AMD官宣下代GPU加速卡Instinct MI355X:288GB海量記憶體3nm CNDA4全新架構
除了正式發布升級版的Instinct MI325X GPU加速卡,AMD還宣布了全新的下一代Instinct MI350系列的首款產品“ Instinct MI355X ”,並披露了部分規格、性能數據。 MI355X將在2025年下半年上市,也就是還有差不多一年。
MI350系列將首次升級為台積電3nm工藝,首次採用CDNA 4架構,首次引入FP6、FP4浮點資料類型,搭配記憶體還是HBM3E但是容量高達288GB。
具體功耗沒有揭露,但MI325X已經最高達1000W,AMD也透露MI355X會順應產業趨勢(NVIDIA B200 1000W、GB200 1700W),因此必然會顯著超過1000W。
FP6、FP4都屬於浮點數資料格式,分別代表6位、4位精度,也就是只需6位、4位就能表達一個數字,相較於FP16、F8精度大大降低,但是資料處理量也大大減少,適合大模型的量化,特別是大語言模型和混合專家模型。
如果你不需要太高的精準度,更想要速度,FP6、FP4就很適合。
MI355X上的FP6、FP4浮點效能都是9.2 PFlops(每秒9200兆次運算),同時也將FP16、FP8效能都提升了80%,分別達到2.3 PFlops、4.6 PFlops。
NVIDIA Blackwell GPU同樣引進了FP6、FP4精確度,但效能更高,分別達20 PFlops、40 PFlops。
單卡多達288GB HBM3E記憶體確實是無可匹敵,同時頻寬高達8TB/s。
對比MI325X分別多出1/8、1/3,而相較於目前已上市的MI300X都增加了足足50%。
比較競品,Blackwell B200也只有192GB HBM3E,但頻寬也做到了8TB/s。
MI355X同樣支援單平台八卡,這樣就有總計2.3TB HBME記憶體、64TB/s頻寬,效能更是高達FP16 18.5 PFlops、FP8 37 PFlops、FP6/FP4 74 PFlops。
它也將在明年下半年供貨。
Instinct系列的性能進步幅度無疑是飛躍性的,一代一個新模樣,跨代對比更是驚人。
MI355X對比MI300X,FP16性能達到了7.4倍之多,HBM容量也有1.5倍,所能處理的模型參數規模,也從7140億增加到4.2萬億,足足6倍之多。
展望未來,2026年將推出再下一代的Instinct MI400系列,基於再下一代的CDNA架構(CDNA 5?),規格和性能必將再次邁上一個大大的台階。