AMD AI晶片被指軟體有缺陷開箱體驗遠不如NVIDIA
根據通報,晶片顧問機構Semianalysis經過5個月的調查後指出,AMD最新”MI300X” AI晶片因軟體缺陷和效能未達預期,難以挑戰NVIDIA的市場領導地位。 Semianalysis的報告指出,AMD軟體有缺陷,若未經過大量調試,訓練AI模型幾乎不可能,導致AMD在品質和易用性方面陷入掙扎,而NVIDIA則持續推出新功能和工具庫,保持領先。
該機構進行了包括GEMM基準測試和單節點訓練在內的大量測試,發現AMD難以突破NVIDIA的”CUDA護城河”。
雖然MI300X硬體規格上確實比較高,提供1307 TeraFLOPS的FP16精度算力和192 GB HBM3內存,而且AMD系統的總持有成本也較低,但實際應用中這些優勢難以發揮。
SemiAnalysis指出,分析團隊必須與AMD工程師合作修正無數軟體缺陷,才能達到可用的基準測試結果,而NVIDIA系統則能即開即用。
SemiAnalysis建議AMD CEO蘇姿豐加大軟體開發和測試投入,特別是配置數千顆MI300X晶片進行自動化測試,並簡化複雜的環境變量,實施更好的預設設置,以實現“開箱即用” 。
Semianalysis首席分析師Dylan Patel在23日表示,他與蘇姿豐進行了1.5小時的會議,逐一討論了這些問題。
蘇姿豐承認AMD在軟體方面的不足,並認真考慮了Semianalysis的建議,同時向AMD團隊和Semianalysis提出了許多問題。
蘇姿豐轉發貼文並表示:「感謝Dylan具有建設性的對話,即便是批評性的回饋也是一份禮物,我們在客戶和工作負載優化方面已投入了大量的工作,但我們還可以做更多的事情來支持廣泛的生態系統。
同時她也表示,AMD致力於打造世界級的開放軟體,2025年有很多計劃,祝大家佳節愉快!