AMD提早一年達成將處理器效能提升30倍的目標

2024-12-13 Comments 0 Comment

早在四年前，AMD就曾設定目標，到2025年EPYC系列伺服器處理器和Instinct系列AI晶片的能效，較2020年提高30倍。如今，MI300X AI晶片基本上實現目標，時間提了早一年。根據THW報道，AMD兩個64核心EPYC 9575F CPU、八個Instinct MI300X AI晶片及2304GB DDR5記憶體的伺服器，Llama3.1-70B（vLLM 0.6.1.post2、TP8）測試推理效能，用一組複雜計算確定係統能源效率，並與2020年的舊機器比較，

結果顯示，新機能源效率是舊機的28.3倍。

不過，AMD並未透露2020年的舊機是何規格。但大機率是EPYC 7002系列，Zen 2架構，每個CPU最多64個核心，以及CDNA 1架構Instinct MI100 AI晶片。

AMD表示，除了強力硬體改進，更高效能效率是架構進步，加上軟體最佳化結合，是跳躍式進展。

今年10月的Advancing AI 2024大會上，AMD正式發表了新款AI晶片－GPU加速卡「Instinct MI325X」。它在大獲成功的MI300X基礎上再進一步，主要是增強了HBM記憶體部分。

MI325X配備了多達256GB HBM3E內存，相比於MI300X又增加了64GB。

MI325X也支援八塊並行組成一個平台，這就有多達2TB HBM3E、48TB/s頻寬，總的效能高達FP16 10.4 PFlops(每秒1.04億億次)、FP8 20.8 PFlops(每秒2.08億億次)億億次)、FP8 20.8 PFlops(每秒2.08億億次)億億次)、FP8 20.8 PFlops(每秒2.08億億次)億億次)、FP8 20.8 PFlops(每秒2.08億億次)億億次)、FP8 20.8 PFlops(每秒2.08億億次)億億。

對比NVIDIA H200，無論單卡或八卡平台，不同大模型推理的性能都可以領先20-40％。

訓練表現方面，單卡可領先H200 10％，八卡平台則持平。

MI325X加速卡和平台將在第四季度內投產，而合作夥伴的整機系統、基礎架構解決方案，將從明年第一季起連續推出。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

WONGCW 網誌

記錄生活經驗與點滴

AMD提早一年達成將處理器效能提升30倍的目標

2024-12-13 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆