華為晶片為DeepSeek AI的推理階段提供了支持
DeepSeek 這款中國人工智慧模型聲稱在成本效率方面大大超過了美國的競爭對手,而人工智慧大戰也因此進入白熱化階段。 它的開源聊天機器人已將該應用程式推向了51 個國家的App Store 榜首位置,現在又有消息稱它是在華為人工智慧晶片上運行的。


這些資訊來自@Dorialexander ,他表示,DeepSeek R1 LLM(大型語言模型)是在NVIDIA H100 上進行的訓練,但使用了Ascend 910C 晶片進行推理,即使用訓練好的模型產生回應。由於Ascend 晶片不涉及訓練,因此對GPU 的功耗要求並不高。
不過,Ascend 910C 相對較低的表現限制了它在訓練方面的適用性。 華為計畫透過即將推出的920C 晶片來解決這一問題,旨在與NVIDIA 用於人工智慧操作的領先晶片組Blackwell B200 競爭。