華為昇騰910 AI芯片正式商用全場景AI框架MindSpore問世
2018 年10 月,在華為2018 全聯接大會上,華為對外宣布了昇騰910 芯片(Ascend 910)芯片,號稱是全球已經發布的單芯片計算密度最大的AI 芯片——當然,從宣佈到商用也需要一個過程,華為當時表示會在2019 年第二季度商用。
2019 年8 月23 日,伴隨著一場專門的發布會,昇騰910 的商用終於到來。
全球算力最強AI 處理器,即將商用
在發布會上,華為徐直軍錶示,去年昇騰910 宣布之後,華為內部已經進行了測試。結果顯示,在算力方面,昇騰910 完全達到了設計規格,也就是:半精度(FP16) 算力達到256 Tera-FLOPS,整數精度(INT8) 算力達到512 Tera-OPS。更重要的是,昇騰910 達到規格算力所需的功耗僅為310W,明顯低於設計規格的350W。
由此,徐直軍錶示:
昇騰910 總體技術表現超出預期,作為算力最強AI 處理器,當之無愧。我們已經把昇騰910 用於實際AI 訓練任務。
針對未來的計劃,徐直軍錶示,針對不同的場景,包括邊緣計算、自動駕駛車載計算、訓練等場景,華為將持續投資並推出更多的AI 處理器,面向全場景持續提供更充裕、更經濟、更適配的AI 算力。在發布會上,徐直軍已經公佈了部分AI 芯片的名稱,比如說昇騰610、昇騰620,還有昇騰920。
早在2018年10月,華為就已經宣布了昇騰910的不少關鍵信息。昇騰910是一款服務器芯片,具體參數為:
- 半精度為(FP 16):256 TeraFLOPS;
- 整數精度(INT8):512 TeraOPS;
- 128 通道全高清視頻解碼器- H.264/265;
- 最大功耗350 W;
- 採用7nm 工藝。
當時,徐直軍還表示,華為昇騰910 芯片將不會對外單獨銷售,而是以AI 加速卡、加速模塊、服務器和一體機等模式對外銷售。
另外,在前不久舉行的Hot Chips 大會上,華為介紹了旗下的AI 芯片所採用的達芬奇(Da Vinci)架構,其中就包括昇騰910 芯片。
華為的達芬奇核心分為三種,最完整的是Max,其次是Lite,再次是Tiny,Max 可在一個週期內完成8192 次MAC 運算,Tiny 為512次。就具體芯片來說,昇騰910 屬於Ascend-Max 系列,它基於7nm 增強版EUV 工藝,單Die 內建32 顆達芬奇核心,半精度高達256TFOPs,功耗為350W。
值得一提的是,在HotChips 大會上,華為還將昇騰910 的計算密度與NVIDIA Tesla V100 和Google TPU v3 進行了對比,其中昇騰910 的計算密度遠遠超過了這兩個競爭對手。
MindSpore 框架發布,明年Q1 開源
除了昇騰910 AI 處理器,華為還發布了MindSpore 計算框架,這是與TensorFlow、PyTorch、PaddlePaddle 等框架競標的一款產品。
去年華為全聯接大會上,華為提出,AI 框架應該是開發態友好(例如顯著減少訓練時間和成本)和運行態高效(例如最少資源和最高能效比),更重要的是,要能適應每個場景包括端、邊緣和雲。經過近一年的努力,全場景AI 計算框架MindSpore 在這三個方面都取得了顯著進展。
全場景支持,是在隱私保護日漸重要的背景下,實現AI 無所不在越來越基礎的需求,也是MindSpore 的重要特色。針對不同的運行環境,MindSpore 框架架構上支持可大可小,適應全場景獨立部署。MindSpore 框架通過協同經過處理後的、不帶有隱私信息的梯度、模型信息,而不是數據本身,以此實現在保證用戶隱私數據保護的前提下跨場景協同。
除了隱私保護,MindSpore 還將模型保護Built-in 到AI 框架中,實現模型的安全可信。在原生適應每個場景包括端,邊緣和雲,並能夠按需協同的基礎上,通過實現AI 算法即代碼,使開發態變得更加友好,顯著減少模型開發時間。
以一個NLP(自然語言處理)典型網絡為例,相比其他框架,用MindSpore 可降低核心代碼量20%,開發門檻大大降低,效率整體提升50% 以上。通過MindSpore 框架自身的技術創新及其與昇騰處理器協同優化,有效克服AI 計算的複雜性和算力的多樣性挑戰,實現了運行態的高效,大大提高了計算性能。除了昇騰處理器,MindSpore 同時也支持GPU、CPU 等其它處理器。
為了更好促進AI 的應用,徐直軍宣布“MindSpore 將在2020 年Q1 開源”,助力每一位開發者,促進AI 產業生態發展。
總結
華為在2018 全聯接大會上全面發布了AI 戰略和華為的全棧全場景AI 解決方案;其中全場景包括公有云、私有云、各種邊緣計算、物聯網行業終端以及消費類終端等部署環境,全棧是技術功能視角,是指包括芯片、芯片使能、訓練和推理框架和應用使能在內的全堆棧方案。
在這次的發布會上,徐直軍錶示,伴隨著今天昇騰910 AI 處理器以及MindSpore 全場景AI 計算框架的發布,華為全棧全場景AI 解決方案各重要組成部分悉數登場,由此華為也已完成了全棧全場景AI 解決方案的構建。
另外,徐直軍還表示,在今年9 月18 日的華為全聯接大會上,華為將會發布更多的重磅AI 產品。