單線程性能提升超50% Arm新款服務器CPU要靠單核打天下?
低功耗處理器設計已經應用於超過1800億顆芯片的Arm,兩年前就開始探索邊緣、雲端及5G市場,並發布了Neoverse E系列處理器,Arm當時稱到2021年這一系列處理器每年要實現30%的性能提升。2019年,第一代Neoverse N1推出,性能提升60%,是2018年提出的目標的兩倍。
本週,Arm再次更新Neoverse產品線,發布第二代N系列Neoverse N2以及全新的Neoverse V1平台。相比Neoverse N1,Neoverse N2在保持相同水平的功率和麵積效率之餘,單線程性能提升了40%。同樣與Neoverse N1相比,Neoverse V1的單線程性能可提升超過50%。
Arm在高性能計算市場是要靠單核與x86的多核競爭嗎?
Neoverse CPU為何強調單核性能?
Neoverse系列發布兩年之後,已經擁有了E系列、N系列、V系列三大系列。Neoverse N系列同時考慮了性能、功率、面積(PPA),擅長可擴展;V系列旨在提供最佳性能,相對而言會消耗更多面積和功耗;E系列主要關注效率,在功耗和面積的縮減上進行優化。
作為最新發布的產品系列,V系列更加追求性能,因此Neoverse V1是面向7nm和5nm設計,並且率先支持可伸縮矢量擴展(SVE ,Scalable Vector Extensions)。SVE可基於未知寬度向量單元的軟件編程模型,執行單指令流多數據流(SIMD)整數、bfloat16、浮點指令。
同時,V1還支持PCIe 5.0連接、DDR5、HBM2e和CCIX 1.0,可實現插槽之間的芯片與封裝內小芯片之間的雙向一致性通信。
Arm基礎設施事業部高級副總裁兼總經理Chris Bergey接受雷鋒網(公眾號:雷鋒網)採訪時表示:“SVE在加速HPC高性能計算領域或者是機器學習工作方面表現高效,同時它對軟件開發者非常友好,不需要管矢量的位寬是多少。未來我們會把SVE技術運用到除N2和V1之外的一系列核上面。”
以Arm架構為基礎的日本富嶽(Fugaku)超級計算機就使用了512位的SVE的技術,它不僅是全球最快的超算,也是最新Green500榜單排名第四的超算。
Arm本週發布的另一款新產品Neoverse N2面向5nm工藝設計,支持PCIe 5.0和DDR5,通過支持用於高帶寬存儲器的HBM3以及用於結構的CCIX 2.0和CXL 2.0來進一步擴展。可支持從8核心,20W到192核心350W的設計,橫跨雲、智能網卡(SmartNICs)、企業網絡到功耗受限的邊緣設備的高可擴展性平台。
Chris Bergey表示,關於新發布的V1和N2的更多細節會在之後公佈。現在我們只知道V1和N2相比上一代N1的單核性能提升了超50%和40%。
為什麼Neoverse CPU如此強調單核性能?Chris Bergey解釋:“我們認為雲服務廠商會更傾向選擇單線程處理器核,因為接近度、安全性、多租戶等特性可以為他們帶來更好的經濟性,這也是我們的產品聚焦單線程技術的原因。當然,Neoverse E1也支持同步多線程(SMT)技術。”
他還給出了一張圖表,X軸代錶芯片級性能,Y軸代表每線程性能,從圖表中可以看到,相比傳統的英特爾和AMD服務器CPU,Neoverse的單核及芯片級性能都超過了市場上的產品。
Neoverse每年30%的性能提升持續到2021年之後
Arm承諾,Neoverse系列CPU的性能每年會提升30%,這種提升會持續到2021年。Chris Bergey說:“這當然與Arm工程團隊的努力和投入是分不開的,我認為與軟件生態的逐漸成熟有更大的關係,例如很多雲原生的軟件現在可以比較無縫地運行在Arm架構上面。”
Arm在手機 CPU市場持續更新的架構與Neoverse性能的持續提升顯然有著密不可分的關係。Chris Bergey表示,“我們在Cortex的基礎上,針對基礎設施領域所要求的功能做了進一步的增添或提升,並且打造最合適超多核設備的功耗與性能,包括核之間的互聯等優化工作。”
也就是說,同一時期的Cortex和Neoverse產品之間存在相似之處。比如,Neoverse N1是和Cortex-A76是同期開發,這兩個微體系結構有很多相似之處。
Neoverse V1可以看作是Cortex-X1的同級設計,兩款旗艦CPU可能共享許多超大型內核結構。Cortex-X1是今年5月份發布的新品,同樣追求最大性能。
Neoverse N2有些特殊,因為它代表下一代Cortex-A的設計,也就是與Cortex-X1同期發布的A78的後續產品,這或許也是Neoverse N2的技術細節現在還不能公佈的關鍵原因。為了更直觀的說明Cortex與Neoverse產品線之間的關係,外媒AnandTech製作的一張圖能夠幫助大家更好地理解。
圖片來源:AnandTech
軟件生態方面,Arm關鍵的任務在於Arm的芯片級接口,這提供了設計系統層級解決方案的機會。Arm在CCIX與CXL投資,提供更好的互聯技術,可以提供可擴展性的交換網,支持大量的處理器核。
另外,Arm Project Cassini是希望通過標準、平台安全性與參考實施,對軟件開發者友好,讓行業合作夥伴能夠在基於Arm的平台上部署裝機即用。
在對基礎設施的基礎軟件包括操作系統、虛擬機管理程序支持方面,Xen、KVM、Docker容器以及越來越多的Kubernetes已經陸續宣布支持Arm架構。許多初期由Arm推動的開源項目正在變得自主運轉,商用ISV應用程序也齊步演進。
Arm服務器CPU“搶食”x86蛋糕最缺的是時間
但想要真正撼動x86在雲端CPU市場的地位,Arm還有很長的路要走。Chris Bergey對雷鋒網表示:“Arm在雲端市場最大的挑戰還是時間。我們看到很多數據中心的客戶對轉向Arm有巨大的興趣。但從Arm的IP到芯片設計,到最後能夠在數據中心部署,再到軟件生態系統的支持,仍需要一定的時間以及很多產業鏈合作夥伴一起努力。”
當然,Neoverse是面向從個雲端到邊緣的市場。Chris Bergey也指出,Arm的機遇其實包括了雲原生軟件的支持,以及協助客戶通過定制化的形式克服摩爾定律減速帶來的挑戰等。
雷鋒網此前報導,亞馬遜、Marvell都已經將Arm架構應用於雲端,亞馬遜推出了Arm架構的服務器處理器Graviton2,Marvell也推出了基於Arm架構定制的ThunderX3處理器,華為海思也推出了基於Neoverse N1設計的鯤鵬系列服務器。
業內有觀點認為,Arm在雲端市場要成功的一個關鍵就是滿足大型互聯網公司和雲服務提供商的定制化需求。
“在異構計算裡,Arm有一個很大的機遇,就是我們如何提供緊耦合或是定制化的能力,甚至是通過多核封裝或多芯片組裝技術,將來自生態系統、IP技術與雲廠商的需求與技術整合在一起。” Chris Bergey說,對於沒有很強設計經驗的客戶而言,他們更傾向於選擇Neoverse核。
Arm架構芯片能未來能否覆蓋從終端到邊緣再到雲端?現在看來,這種成功除了Arm的努力外,最終是否會被英偉達收購也成為了關鍵因素。