AMD 6nm MI250X加速卡被扒開:1個節點1小時5度電
日前,AMD發佈了新一代計算加速卡Instinct MI250、MI250X,基於6nm工藝、CNDA2架構,內部封裝兩顆GPU、八顆HBM2e,最多14080個計算核心、880個矩陣核心、128GB顯存記憶體。 作為AMD的第一款百億億次計算級別產品,MI250系列已經得到了很多客戶方案,尤其是聯合美國能源部的超算”Frontier”,已經整裝待發,峰值性能超過150億億次。
這就是MI250X加速卡的真容,中間兩顆大的晶元自然是MI200計算模組,周邊八顆小的就是HBM2e記憶體,單顆32GB,通過2.5D EFB橋接技術彼此互連。
整卡採用OAM形態,也就是基於開放計算專案(OCP)指定的加速卡模組標準,NVIDIA、Intel也都採納。
這是1U半高刀片規格的單個節點,集成八塊MI250X,另有兩顆霄龍處理器,代號”Trento”,基於三代霄龍7003 Milan的定製版,主要加強了Infinity Fabric IO部分,便於控制八路加速卡。
MI250X單卡功耗就有560W,Trento霄龍暫無具體規格估計也在280W左右,那麼這一個節點的整體功耗,就在5000W左右,一小時就是5度電,散熱上風冷也不夠了,全部都是水冷。
而且,這還沒算上12通道記憶體、硬碟、網路等等。
美國的三大百億億次超級計算機中,除了AMD Frontier,Intel承接了”Aurora”,採用超過1.8萬顆下一代可擴展至強Sapphire Rapids、超過5.4萬塊全新加速卡Ponte Vecchio,每個節點雙路CPU加六路GPU,號稱性能超過200億億次,但進度最慢。
NVIDIA則利用自己的A100加速卡,聯合AMD第三代霄龍,打造了”Polaris”,分別有1120顆、2240塊,每個節點雙路配四塊卡,性能相對最低,但因為都是成熟硬體,進度是最快的,今年年內上線,明年還會升級一次。