HPC市場生變霸主英特爾2020年面臨ARM和AMD的左右夾攻
在利潤豐厚的服務器和HPC(高性能計算)處理器市場,英特爾的市場份額在很長一段時間都超過九成,但市場不總是一成不變。隨著AMD Epyc處理器的推出,以及Arm架構處理器進入這一市場,2020年英特爾難以避免他們帶來的競爭。
但是,市場份額並不會迅速變化,英特爾 x86處理器在未來五年甚至更長時間仍將主導這一市場,面對強有力的競爭者,能否守住這一市場,新產品變得更加重要。
高性能計算(HPC)市場已經連續多年增長。目前至少有三種架構的CPU可用於HPC任務,包括X86、Arm和Power,有超過六家可靠的供應商,還有兩種(即將成為三種)GPU架構。不過,目前該領域的絕大多數HPC系統還是由英特爾CPU(有時是Nvidia GPU)提供算力。從今年開始,情況將開始改變。
近期內的變化可能會來自x86領域,AMD Epyc的勢頭將使英特爾面臨自Opteron(皓龍,AMD 2003年推出的64位處理器)時代以來最激烈的競爭。特別是,幾乎可以確定第二代Epyc芯片(又名“羅馬”)將搶占英特爾在服務器領域(包括HPC)的市場份額。
羅馬令人印象深刻的性價比無疑是促使美國、英國、德國和芬蘭等超級計算機系統選擇它的關鍵,大多數係統將於今年上線。現在的關鍵問題是,更新的至強處理器(14納米“ Cooper Lake”至強可擴展處理器),尤其是未來的10納米“ Ice Lake”至強可擴展處理器,能在多大程度減少市場份額的流失。
Arm也在緩慢地進入HPC市場,我們認為,緩慢的主要原因是,從技術角度看,與x86或任何其它通用處理器相比,該架構沒有任何特殊的優勢。Arm的優勢在於其IP是可授權的,因此該架構可以滿足不同市場定制處理器的需求,這和全球軟件生態系統捆綁在一起。
需要說明,這種可延展性是長期的優勢,而不是短期的優勢。富士通花了至少五年的時間設計和開發了A64FX,這是第一個基於Arm架構的HPC專用處理器。它即將在RIKEN Lab的“ Fugaku” 400 petaflops超級計算機中首次亮相,將測試Arm架構在高端HPC中的可行性以及相應的生態系統。巧的是,它也將展示沒有加速器或外部存儲器系統的優缺點。
Cavium凱為半導體2017年已經被Marvell收購)的ThunderX2 SoC是一種更普通的芯片,其目標是在低級別的HPC領域,這款處理器於2018年推出,很快就獲得了Marvell的訂單,並成為了英國和其它地區為數不多的第一批基於Arm處理器構建HPC集群的基礎。儘管ThunderX2不是超高性能,但由其較好的集成內存控制器分配,在受內存帶寬限制的應用中表現出色。Marvell希望在ThunderX2成功的基礎上再推出ThunderX3,該產品有望在今年年初發布。
Marvell預測,第三代產品將基於7納米製程,將與AMD的“羅馬” Epyc 7002和英特爾的Ice Lake至強可擴展處理器競爭,性能將比ThunderX2高出兩倍以上,時鐘頻率也更快,能源效率更高。
今年,基於Arm的高性能計算將有另一個重要選擇——基於A64FX的商用系統。例如,由於與富士通達成了合作協議,客戶現在可以從Cray / HPE選擇支持A64FX的CS500集群。對於日本或者歐洲市場,富士通還將提供基於A64FX的FX700和FX1000系統。
如果這些系統在各自的地區能夠吸引足夠的客戶,其他OEM也可能與富士通達成類似的協議。
基於A64FX的商業系統的前景也可以預測。Isambard 2是布里斯託大學最初由ThunderX2驅動的Isambard集群的迭代版本,將採用A64FX Cray CS500。儘管還沒有宣布任何消息,但是如果歐洲三台E級超級計算機(每秒可進行百億億次數學運算)中的一台(或更多台)也都採用A64FX芯片,這也不會令人感到驚訝。
我們認為,用戶和供應商當前對基於Arm的群集的熱情是基於以下事實,即變化似乎已達到拐點。Hyperion Research一直在跟踪HPC中Arm的銷售情況,他們預計在未來五年中,該領域Arm處理器收入的複合年增長率為64.7%。
儘管在2019年僅有50,000顆Arm芯片被用於HPC,但Hyperion預計該數字到2020年將超過233,000,到2024年將超過610,000。其中許多系統將在美國以外,這一事實反映出所有最初的基於Arm的億兆級系統都將在歐洲、中國和日本構建和部署。這些地區佔高性能計算一半以上的市場。也就是說,儘管Arm在這一領域可以維持較高的增長率,但x86處理器在未來五年甚至更長時間內仍將主導這一市場。
Power架構方面,儘管有OpenPower計劃,IBM仍然是遊戲的唯一玩家。Power10處理器原定於今年推出,但現在看來它將在2021年問世,該公司並沒有依靠HPC來增加出貨。儘管Power10可以成為高性能計算領域令人印象深刻的芯片,但尚無大型系統由該芯片提供算力(能源部通過了IBM和Power10的CORAL-2合同)。
一個潛在的增長點是,歐洲開放計算機體系結構實驗室(LOCA)計劃選擇OpenPower作為開發開源HPC處理器的三種架構之一。
在可預見的未來,Power架構似乎注定在高性能計算中扮演次要角色。
GPU和更廣泛的加速器肯定會增長,特別是如果考慮到中國(中科曙光的DCU和Matrix-3000 DSP),歐洲(RISC-V和其他特定領域的加速器)追求定制設計(歐洲處理器計劃)的產品,以及無數的AI加速器進入市場,例如英特爾最近推出的神經網絡處理器:NNP-T和NNP-I。當然,還有Xilinx和英特爾的各種FPGA迭代產品,可用於在芯片中實現硬件半定制化的HPC應用。
但是,對於主流HPC使用者,GPU仍將是首選的加速器平台。英偉達主導了這個領域,但AMD及其Radeon Instinct準備搶占該市場的部分市場份額。頂級的MI60通過Infinity Fabric提供7.4 teraflops的64位性能,32 GB的HBM2內存以及與GPU之間的200 GB /秒的連接性能。在將來的迭代中,連接性能將擴展到AMD的Epyc CPU,以便GPU和CPU可以在同一結構上進行通信。這個功能將在Oak Ridge National Lab的“ Frontier”百億級超級計算機中進行大規模測試,將通過Infinity Fabric在每個節點中連接四個Radeon Instinct GPU和一個Epyc CPU,Frontier計劃於2021年啟動。
同年,“ Aurora”E級超算有望在Argonne國家實驗室上線。該系統將配備英特爾的Xe GPU,這是一個協處理器,旨在加速HPC和神經網絡訓練,就像Nvidia的V100和T4一樣。因此,Aurora將是針對此處理器進行HPC和AI負載的第一個大型測試。由於現在沒有Xe處理器(定於今年晚些時候發布),因此它們的性能以及可編程性未知。
在這方面,英偉達具有優勢,因為該公司十多年來一直在圍繞其CUDA硬件有條不紊地擴展其CUDA軟件,並已擁有數量龐大的開發人員和用戶。事實證明,該公司的GPU也有些難以捉摸,而且隨著可能在今年晚些時候推出的新一代(“安培”)架構的出現,英偉達可能再次體現出優勢。
但現在,至少是一場三雄爭霸的比賽。隨著新十年的開始,這將使加速器市場變得更加有趣。