華為昇騰910C AI推理性能達NVIDIA H100 60% DeepSeek已驗證
DeepSeek的硬體設施雖然沒有公佈詳細情況,但普遍認為大量使用了NVIDIA AI晶片,包括H100、H800、H20等不同型號,但根據最新曝料,DeepSeek也驗證了華為最新的AI晶片——昇騰910C 。
昇騰910C是在2024年晚些時候被曝光的,據稱已向部分客戶批量供貨,包括阿里巴巴、百度、騰訊登巨頭,首批大約7萬顆,平均每顆僅2萬元左右。
訊息顯示,昇騰910C採用了中芯國際的7nm製程製造,chiplets雙晶片整合封裝,電晶體數量達530億個,整體國產化率已達55%左右。
它可以平替NVIDIA H100,同樣用於大規模的AI訓練和推理,FP8、FP16、FP32、FP64等不同資料類型下均有不俗表現。

昇騰910C
根據最新說法,DeepSeek團隊的實測數據顯示,華為昇騰910C在AI推理中的表現出乎意料地好,已經達到NVIDIA H100晶片的60%左右。
更進一步地,透過手寫CUNN核心和優化,昇騰910C的效能還可以進一步提升。
據稱,DeepSeek從第一天起就支援華為昇騰晶片,並且自主維護PyTorch倉庫,只需一行程式碼就能將CUDA轉換為CUNN,效能優化的潛力也相當巨大,透過客製化優化可達到更高效能。

不過要注意的是,目前已知的只是昇騰910C AI推理表現很優秀,但AI訓練表現可能還是不夠理想。
昇騰910