Intel首款AI 商用芯片已交付新一代Movidius VPU 明年見
2019 英特爾人工智能峰會期間(Intel AI Summit 2019)在舊金山舉行,在峰會期間,英特爾展示了一系列AI 相關新產品和相關進展,其中,包括面向訓練(NNP-T1000 ) 和麵向推理(NNP-I1000) 的英特爾Nervana 神經網絡處理器(NNP) 都重磅亮相,而英特爾也公佈了新一代Movidius Myriad 視覺處理單元。
英特爾公司副總裁兼人工智能產品事業部總經理Naveen Rao 表示:
隨著人工智能的進一步發展,計算硬件和內存都將到達臨界點。如果要在該領域繼續取得巨大進展,專用型硬件必不可少,如英特爾Nervana NNP 和Movidius Myriad VPU。採用更先進的系統級人工智能,我們將從“數據到信息的轉換”階段發展到“信息到知識的轉換階段”。
Nervana NNP 已經投入生產並交付
對於英特爾來說,Nervana NNP 是它在神經網絡處理器方面的重要產品,可以說是第一款AI 商用芯片,而且這款產品從發布、測試、量產到應用,實際上是經歷了一個漫長的產品週期。
新一代Nervana NNP 首先亮相是在2018 年5 月。當時,在英特爾人工智能開發者大會(AIDevCon 2018) 上,Naveen Rao 發布了新一代專為機器學習設計的神經網絡處理器(NNP)芯片,並表示這是英特爾第一款商業NNP 芯片,將不止是提供給小部分合作夥伴,將在2019 年發貨。
到了2019 年8 月,英特爾在Hot Chips 大會召開期間公佈了NNP 芯片的更多信息,其中,它依據用途分為Nervana NNP-T 和Nervana NNP-I,分別用於訓練和推理。
Nervana NNP-T 代號Spring Crest,採用了台積電的16nm FF+ 製程工藝,擁有270 億個晶體管,矽片面積680 平方毫米,能夠支持TensorFlow、PaddlePaddle、PYTORCH 訓練框架,也支持C++ 深度學習軟件庫和編譯器nGraph。
而Nervana NNP-I,代號為Spring Hill,是一款專門用於大型數據中心的推理芯片。這款芯片是基於10nm 技術和Ice Lake 內核打造的,打造地點是以色列的Haifa ,Intel 號稱它能夠利用最小的能量來處理高負載的工作,它在ResNet50 的效率可達4.8TOPs/W,功率範圍在10W 到50W 之間。
按照官方說法,英特爾Nervana 神經網絡訓練處理器(Intel Nervana NNP-T)在計算、通信和內存之間取得了平衡,不管是對於小規模群集,還是最大規模的pod 超級計算機,都可進行近乎線性且極具能效的擴展。英特爾Nervana 神經網絡推理處理器(Intel Nervana NNP-I)具備高能效和低成本,且其外形規格靈活,非常適合在實際規模下運行高強度的多模式推理。這兩款產品面向百度、 Facebook 等前沿人工智能客戶,並針對他們的人工智能處理需求進行了定制開發。
在2019 英特爾人工智能峰會峰會現場,Intel 宣布——新推出的英特爾Nervana 神經網絡處理器(NNP)現已投入生產並完成客戶交付。其中,Facebook 人工智能係統協同設計總監Misha Smelyanskiy表示:
我們非常高興能夠與英特爾合作,利用英特爾神經網絡推理處理器(NNP-I)部署更快、更高效的推理計算。同時,我們最新的深度學習編譯器Glow 也將支持NNP-I。
另外,百度AI 研究員Kenneth Church 在現場表示,在今年7 月,百度與英特爾合作宣布了雙方在Nervana NNP-T 的合作,雙方通過硬件和軟件的合作來實現用最大的效率來訓練日益增長的複雜模型。Kenneth Church 還宣布,在百度X-Man 4.0 的加持下,英特爾的NNP-T 已經推向市場。
新一代Movidius VPU 明年見
在峰會現場,Intel 公佈了全新一代Movidius VPU。
下一代英特爾Movidius VPU的代號是Keem Bay,它是專門為邊緣AI打造的一款產品,專注於深度學習推理、計算機視覺和媒體處理等方面,採用全新的高效能架構,並且通過英特爾的OpenVINO來加速。按照官方數據,它在速度上是英偉達TX2的4倍,是華為海思Ascend 310的1.25倍。另外在功率和尺寸上,它也遠遠超過對手。
Intel 方面表示,新一代Movidius 計劃於2020 年上半年上市,它憑藉獨一無二的高效架構優勢,能夠提供業界領先的性能:與上一代VPU 相比,推理性能提升10 倍以上,能效則可達到競品的6 倍。
英特爾曾經在2017 年8 月推出一款Movidius Myriad X 視覺處理器(VPU),該處理器是一款低功耗SoC,採用了16nm 製造工藝,由台積電來代工,的主要用於基於視覺的設備的深度學習和AI 算法加速,比如無人機、智能相機、VR/AR 頭盔。
除了新一代Movidius,英特爾還發布了全新的英特爾DevCloud for the Edge,該產品旨在與英特爾Distribution of OpenVINO 工具包共同解決開發人員的主要痛點,即在購買硬件前,能夠在各類英特爾處理器上嘗試、部署原型和測試AI 解決方案。
另外,英特爾還介紹了自家的英特爾至強可擴展處理器在AI 方面的進展。
英特爾方面表示,推進深度學習推理和應用需要極其複雜的數據、模型和技術,因此在架構選擇上需要有不同的考量。事實上,業界大部分組織都基於英特爾至強可擴展處理器部署了人工智能。英特爾將繼續通過英特爾矢量神經網絡指令(VNNI) 和英特爾深度學習加速技術(DL Boost)等功能來改進該平台,從而在數據中心和邊緣部署中提升人工智能推理的性能。
英特爾強調稱,在未來很多年中,英特爾至強可擴展處理器都將繼續成為強有力的人工智能計算支柱。
總結
在本次2019 英特爾人工智能峰會上,Intel 還公佈了其在AI 方面的整體解決方案。實際上,英特爾在AI 方面的優勢不僅僅局限在AI 芯片本身的突破,更重要的是,英特爾有能力全面考慮計算、內存、存儲、互連、封裝和軟件,以最大限度提升效率和可編程性,並能確保將深度學習擴展到數以千計節點的關鍵能力。
不僅如此,英特爾還能夠借重現有的市場優勢將自家在AI 領域的能力帶向市場,實現AI 的商用落地——值得一提的是,在峰會現場,英特爾宣布,自家的人工智能解決方案產品組合進一步得到強化,並有望在2019 年創造超過35 億美元的營收。
可見,在推進AI 技術走向商用落地方面,英特爾終於跨出了自信的一步。