為什麼英偉達、AWS、阿里都喜歡ARM的伺服器CPU?
耕耘多年後,基於Arm架構的CPU在伺服器市場迎來了大幅成長,被眾多客戶喜歡並採用。超大規模雲端服務商如亞馬遜雲端服務(AWS)、阿里巴巴、微軟等自研CPU,都選擇和Arm合作,這是為什麼?
「答案非常簡單,透過和Arm合作,他們能夠根據自己的用例和基礎設施來打造並優化解決方案。」Arm高級副總裁兼基礎設施事業部總經理Mohamed Awad在2023 Arm Tech Symposia年度技術大會上表示。
與超大規模雲端服務商同樣喜歡Arm伺服器CPU可客製化特性的還有最重要的AI晶片供應商之一-英偉達。
在英偉達強大的GH200超級晶片中,包含了72顆Arm Neoverse核心,加上英偉達的GPU,GH200的AI性能較基於x86架構的系統可提升10倍。
為了滿足更多客戶在基礎建設中的客製化需求,Arm還有兩個重要措施。
為什麼首選Arm Neoverse CPU?
GH200 Grace Hopper 超級晶片平台是英偉達今年5月發布的產品,專為處理海量的生成式AI任務而設計。擁有256個GH200超級晶片的NVIDIA DGX GH200超級計算機,其AI性能提升到了驚人的Exaflop(每秒一百萬萬億次算)級別。
如此強大的AI效能,關鍵在於系統架構的變革。
基礎設施領域的傳統系統架構
傳統的伺服器系統架構,記憶體透過PCIe,連接一個通用現成的CPU(也就是Host CPU),負責管理多個加速器。
「這種傳統架構是過去市場上唯一可用的架構。」Mohamed Awad指出,「這個架構的問題在於,通用現成的CPU以及加速器之間的介面直接限制了產品最終的效能水準。因為所有的加速器都必須透過這個通用現成的CPU存取額外的內存,無法達到內存的一致性,加速器的性能無法被充分利用,也就無法很好地支持生成式AI的需求。”
面向新的應用需求,基礎設施領域出現了現代化的系統架構
GH200超級晶片改變了傳統架構,透過NVLink,讓每個CPU都單獨和一個加速器相連,實現較強的記憶體一致性。其中的關鍵點之一就是可客製化的CPU,為此,借助這樣的架構,英偉達能夠充分發揮GPU的效率,根據實際場景和用例實現了效能的最大化。
「只有了解最終用例,並且根據使用場景針對性地設計CPU,才能獲得更好的效率,達到產品最佳的表現性能。」Mohamed Awad進一步表示,「英偉達攜手Arm,借助了Arm技術帶來的靈活性,設計出他們所需要的晶片以進一步優化系統,同時充分利用Arm強大的軟體生態系統。”
接下來的問題是,英偉達提出的這種架構會成為生成式AI時代的主流嗎?
「現在判斷一個CPU對一個GPU 作為加速器是不是未來的主趨勢,或唯一趨勢,仍為時過早。」 Mohamed Awad對雷峰網表示,「我們正處於計算加速的時代,在未來的架構當中,不管透過什麼方式耦合,任何的通用CPU旁邊都一定會有一個加速器。Arm的獨特之處在於,能夠幫助合作夥伴從頭開始、根據所需構建定制化的CPU,做好CPU和加速器之間的連接。”
由於x86提供的是標準的CPU晶片,所以GH200超級晶片平台中CPU最佳的選擇只有Arm CPU,這也是Arm Neoverse受到歡迎的關鍵。
也就是說,標準化的CPU無法滿足基礎設施的客製化需求,可客製化成了Arm在伺服器市場的殺手鐧。
可自訂化,Arm在伺服器市場的“殺手鐧”
今年八月,Arm推出了Arm Neoverse計算子系統(CSS),促使Arm生態系統透過更低的成本、更少的風險以及更短的時間,打造出專用晶片。
Arm CSS的第一代產品Arm Neoverse CSS N2整合了Neoverse N2 平台,並透過驗證配置且優化了功耗、效能與麵積(PPA)。
「透過Neoverse CSS能夠幫助我們的合作夥伴進一步降低投資,加速整個生態系統對我們解決方案的可訪問性,同時加速合作夥伴產品的上市時間。」Mohamed Awad表示。
雷峰網(公眾號:雷峰網)了解到,有Arm的客戶透過使用Neoverse CSS,節省了長達80人/年的工程師時間。還有客戶用了Neoverse CSS,專案從概念到流片只花了13個月。
微軟近期發布的Cobalt 100 CPU,也是基於Neoverse CSS。
「Arm Neoverse 在中國市場,特別是基礎設施領域,有很多客戶,過去三四年發展也非常強勁。」Arm 中國區業務全球副總裁鄒挺說,「Arm 也積極參與資料中心、雲端運算等本土的生態、開源軟體社區,包括龍蜥社區等,幫助這些社區能更好地融入Arm全球生態系統中。”
Mohamed Awad也強調,中國是Arm非常重要的市場之一,中國合作夥伴基於Arm架構晶片的總出貨量已累積達300億顆,Arm在中國有近400家技術授權客戶,這個數字每個月還在不斷攀升。
Arm全球的生態也是滿足客戶差異化需求的關鍵所在,在Neoverse CSS 的基礎之上,Arm推出了全面設計(Arm Total Design) ,進一步結合生態系統的力量,簡化定制芯片的開發流程,並且讓交付變得更容易、更方便。
Arm全面設計的推出,讓ASIC 設計公司可以快速啟動設計項目,並隨時可將其設計方案提供給所需的客戶;IP 供應商可以針對Neoverse CSS,進行預先整合、預先驗證和預先優化高級IP; EDA合作夥伴可以無縫支援最先進的工具和流程,簡化SoC設計;商業韌體解決方案可早於晶片流片之前便開始開發;與此同時,Neoverse CSS的設計將經過專門優化,充分發揮領先的製程節點的優勢。
顯然,在基礎設施追求差異化的時代,Arm Neoverse CSS和Arm全面設計是當下滿足差異化需求的最佳選擇。
也要注意到,Arm已經轉型為一家運算平台公司,如今Arm的全面運算解決方案(Arm Total Compute Solutions)、Arm Neoverse平台、Arm Corstone 以及SOAFEE 等運算平台都已經被廣泛應用於行動、基礎設施、物聯網以及汽車等領域。