Kestrel超算採用了AMD霄龍Genoa、英特爾Sapphire Rapids和英偉達H100硬件
由慧與(HPE)為美國能源部旗下的國家可再生能源實驗室(NREL)打造的Kestrel 超級計算機,其規格已正式公佈。在NREL 於去年宣布了該計劃之後,現在我們終於知曉它將採用AMD 霄龍Genoa、英特爾Sapphire Rapids、以及英偉達H100 加速器硬件,並且能夠提供高達44 PFLOPS 的算力。
(通過WCCFTech)
在三家科技巨頭最新軟硬件技術的加持下,Kestrel 旨在接替現有的Eagle 超算。而在最近的一次會議上,HPE 首次揭示了這套超算系統的硬件規格。
可知Kestrel 超算採用了標準節點+ 加速節點的組合方案,具有44 PetaFlops 的峰值性能—— 較Eagle 超算提升了5.5 倍。
● 其中標準節點採用了英特爾最新的Sapphire Rapids 至強可擴展CPU(本例中為52 核/ 104 線程的SKU)。
● 在2304 個標準節點中,都使用了雙路CPU 方案(總計4608 顆Sapphire Rapids-SP 處理器,239616 核/ 479232 線程)。
● 75 PB 數據存儲(Lustre),且2304 個節點中的每一個都提供了256GB DDR5 內存(總計560 PB 系統內存)。
另有132 個加速節點:
● Kestrel 選擇了為每個節點配備四路基於Hopper 圖形架構的英偉達H100 GPU 加速卡@ AMD雙路EPYC Genoa 服務器處理器組合。
● 總計有528 塊英偉達Hopper H100 GPU 加速卡,以及264 顆AMD EPYC Genoa 芯片(最高96C / 192T)。
至於加速節點中的確切CPU / GPU 配置型號,目前暫不得而知。若採用頂級配置方案,那Kestrel 有望獲得總計8921088 個CUDA 核心(H100 SXM5)+ 25344 個Zen 4 CPU 核心。
此外Kestrel 加速節點還具有42 TB 的HBM3 高帶寬緩存+ 20 TB 系統內存,輔以8 個DAV 節點(其中包括多達16 路英偉達A40 GPU 加速卡)。
所有這些都使用了HPE 的Slighshot Dragonfly 互連方案,以下是HPE Slingshot 互連的一些亮點:
● 行業領先的性能與可擴展性
● 採用100GbE 和200GbE 高速接口
● 搭配高基數、64 端口、12.8 Tb/s 帶寬的高性能交換機
● 可擴展至25 萬+主機端口/ 最多3 個躍點
● 創新的硬件擁塞管理、自適應路由與QoS 服務質量控制
● 採用標準的以太網協議,輔以優化的高性能計算(HPC)特性
● 鏈路級重試與低延遲前向糾錯
● 開放且標準化的API 管理接口
最後,儘管Kestrel 超算的每瓦特性能為10.4 gflops(遠不及最近宣布的能效超50 gflops/watt 的Frontier 超級計算機),但其造價依然相當昂貴(甚至高於ExaFlops 系統)。
如若一切順利,NREL 的Kestrel 超級計算機預計可在2024 年完成部署。