全球最強超算公佈:1.7exaflops 整合44544個MI300A晶片
當地時間2024年11月18日,在「2024 年超級運算」大會上,Top500組織公佈了全球最強超算Top500名單。其中,位於美國勞倫斯利弗莫爾國家實驗室(LLNL)的由AMD 提供支援的El Capitan 以1.742 exaflops 的峰值性能成為目前地球上已知的最快的超級電腦。這也是AMD支援的超級電腦第六次登頂全球超算Top500榜單。
據介紹,El Capitan超級電腦位於勞倫斯利弗莫爾國家實驗室(LLNL),由AMD Instinct MI300A APU 提供支持,由惠普企業(HPE) 打造。系統擁有11136 個節點,其中包含44544 個AMD 的MI300A、主記憶體容量高達5.4PB。另外還有一個近節點儲存子系統。
具體來說,MI300A 晶片是AMD 投入生產的最大的AI晶片,其內部擁有多達13個小晶片,其中GPU是新一代的CDNA 3架構,並整合了24個Zen 4 CPU內核,配置了8個共128GB的HBM3記憶體。皆基於台積電5nm或6nm製程製程(CPU/GPU計算核心為5nm,HBM記憶體及I/O等為6nm),總共整合1,460 億個電晶體。這也意味著擁有11136 個節點的El Capitan 擁有11,039,616 個運算核心(CPU+GPU),分佈在44,544 個AMD MI300A 處理器上。
根據最新的全球超算Top500 榜單,El Capitan的高性能Linpack (HPL)得分為1.742 exaflops,即每秒1.742萬億次運算,這比Top500超算榜單中的第二名Frontier快了45% 。
AMD表示,El Capitan 是世界上最強大的超級計算機,也是美國國家核安全管理局(NNSA)的第一台百萬兆級計算機,是NNSA三家實驗室(LLNL、洛斯阿拉莫斯和桑迪亞國家實驗室)的首要運算資源。它將用於推進科學發現和國家安全,提供必要的巨大運算能力,以確保國家核威懾的安全性、保障性和可靠性,而無需測試。這個最先進的系統標誌著HPC 的巨大飛躍,實現了前所未有的建模和模擬功能,這對於NNSA 的庫存管理計劃至關重要,該計劃可以認證老化的核庫存,以及其他關鍵的核安全任務,例如防擴散和反恐。
「我們很高興看到El Capitan 成為全球第二台打破exaflop 障礙並成為世界上最快的超級電腦。這款開創性的機器展示了AMD Instinct MI300 APU 令人難以置信的性能和效率,證明了AMD 、LLNL 和HPE 之間的專注工作,「AMD 執行副總裁兼總經理Forrest Norrod 說。 “在AMD,我們正在以領先的性能和功能推動計算的未來,這些性能和功能將繼續定義未來幾年HPC 和AI 的融合。”
LLNL 高級仿真和計算項目主任Rob Neely 表示:「El Capitan 對美國國家核安全局的核心任務至關重要,它極大地增強了我們執行大型高保真3D 仿真集合的能力,這些仿真可以解決任務面臨的複雜科學挑戰。
LLNL 的Livermore Computing 首席技術長Bronis R. de Supinski 補充道:「利用AMD Instinct MI300A APU,我們建立了一個曾經難以想像的系統,在保持卓越能效的同時突破了計算性能的絕對界限。隨著AI 在我們的領域越來越普遍,El Capitan 使我們能夠將AI 與傳統的模擬和建模工作負載集成,為跨各個科學學科的發現開闢新的途徑。
排名第二的超級電腦是Frontier,它位於美國橡樹嶺國家實驗室,也是由AMD EPYC CPU 和AMD Instinct GPU 提供支持,是世界上第二快的計算機,性能為1.35 exaflops,比之前提交的1.194 有所增加。 Rpeak 也從1.714 exaflops 增加到2.055 exaflops。
排名第三的超級電腦是Aurora,其位於美國伊利諾州的阿貢國家實驗室,其在完整安裝完畢的狀態下,內部將整合21248個Intel Xeon Max系列CPU、63744個Intel Max系列GPU、20.42PB內存,峰值性能號稱可達2 EFlop / s,遠超Frontier。
但是,美國能源部並沒有為英特爾的Aurora 提交新的基準測試。其6月前的提交的數據是1.012 exaflop/s的HPL性能,雖然相比首次上榜時(當時未全部安裝完成)性能幾乎翻了一倍,基準測試運行僅佔系統的87%。當時,英特爾表示Aurora 存在許多硬體問題,包括硬體和冷卻系統故障、操作錯誤和網路不穩定。
Aurora 沒有提交新的數據,這意味著一些問題尚未完全解決。不過,Aurora 仍然引領著以AI 為中心的HPL-MxP 混合精度基準測試,使其成為世界上已知最快的AI 超級計算機,具有10.6 AI Exaflops 的性能。
需要指出的是,此外,El Capitan系統是基於HPE的Shasta 架構構建的 ,該架構由高密度液冷EX4000 機櫃和與Slingshot-11 網路互連綁定在一起的EX225a 加速器刀片組成。該平台也為另外兩台百萬兆次級超級電腦Frontier和Aurora提供支援。這使得HPE的系統在Top500 名單上佔據了前三名,而這三個系統都是名單上的E級超算系統。
排名第四的超算是Eagle,其安裝在微軟的Azure 雲端服務基礎設施中,該系統基於英特爾Xeon Platinum 8480C 處理器和英偉達H100 加速器,並實現了561 Petaflop/s 的HPL 分數。
排名第五的超算是HPC6,安裝在義大利Ferrera Erbognone 的Eni SpA 中心。它是另一款HPE Cray EX235a 系統,採用針對HPC 和AI 優化的第3 代AMD EPYC CPU、AMD Instinct 250X 加速器和Slingshot-11 互連,效能達到了477.9 Petaflop/s。
事實上,Top500名單中,速度最快的前十台超級電腦當中,有5台(El Capitan、Frontier、HPC6、LUMI 和Tuolumne)都是由AMD晶片提供支援的;有3台(Aurora、Eagle 、Leonardo)是由英特爾提供支援的;英偉達提供支援的有1台(Alps);日本超級電腦Fugaku則依賴Arm處理器富士通A65FX 48c 2.2GHz 。
同時,速度最快的前十台超級電腦當中有7 台使用Slingshot-11 互連(El Capitan、Frontier、Aurora、HPC6、Alps、LUMI 和Tuolumne),而另外兩台則使用Infiniband(Eagle 和Leonardo)。 Fugaku擁有自己專有的Tofu互連。
德國超算JEDI高居能源效率榜第一
在評估高能效的Green500榜單上,德國的超級電腦JEDI排名第一。 JEDI 是一款BullSequana XH3000 機器,配備Grace Hopper 超級晶片72c 2GHz、NVIDIA GH200 超級晶片、四軌NVIDIA InfiniBand NDR200、 並且總共有19,584 個核心。雖然在TOP500性能榜單中排名第224 位,但能夠達到72.73 GFlops/W 的能源效率評級。
相比之下El Capitan 在滿載使用時消耗>35 MW 的功率,並提供58.89 GFlops/W,在Green500 最高效超級電腦排名中排名第18 位。
從Top500組織公佈的系統供應商來看,聯想以高達162台(32.4%)的擁有數量牢牢佔據著全球Top500超算榜單第一的位置。緊隨其後的是HPE,數量為115台(23%)。
國產超算可進入全球前五
需要指出的是,雖然El Capitan 現在是世界上已知最快的超級計算機,但是由於中國已決定不再參加Top500的HPL基準測試,實際上已經擁有比之前的“神威太湖之光”更強的超級計算機,但是由於一些仍處於保密狀態,因此無法進行比較。
不過,在11月15日於北京舉行的第六屆中國超級算力大會(ChinaSC 2024)會上,中國電腦學會高效能運算專業委員會聯合中國工業與應用數學學會高效能運算與數學軟體專業委員會、中國智慧運算產業聯盟共同發布了2024中國高效能電腦(HPC)效能TOP100榜單。
在該榜單上,一台由某伺服器供應商研發、部署於某超算中心的主機系統以487.94PFLOPS(約48.79億億次每秒)的測試效能蟬聯第一。此主機系統採用CPU+GPU異構眾核架構,CPU核數達到1597萬核心,系統峰值達620 PFLOPS。而此前曾多年“霸榜”的兩台熟悉面孔——“神威·太湖之光”和“天河二號A”,在今年的榜單中分列第四和第六位。
如果以487.94PFLOPS的成績來對比,該國產超級電腦則可以排在全球Top500超算榜單的第五位。