《金融時報》:華為問題百出的軟體阻礙了中國在AI領域取代NVIDIA的努力
中國在人工智慧領域與美國的運算能力不相上下的努力受到了漏洞百出的軟體的阻礙,領先的人工智慧晶片製造商華為的客戶抱怨性能問題以及從英偉達產品轉換過來的困難。
去年10 月,華盛頓進一步收緊了對高性能矽片的出口管制,中國科技巨頭在開發國內替代產業領導者NVIDIA的產品的競爭中拔得頭籌。它的Ascend 系列已成為一系列中國AI技術團體運作推理的一個越來越受歡迎的選擇,OpenAI 的ChatGPT 等應用就是利用這個過程來產生對查詢的回應。
但包括一家合作公司的人工智慧工程師在內的多位業內人士表示,在早期的模型訓練中,這些晶片仍遠遠落後於NVIDIA的晶片。他們將此歸咎於穩定性問題、較慢的晶片間連接速度以及華為開發的名為「昇騰異構運算架構CANN」的問題百出的軟體。
NVIDIA的軟體平台CUDA被譽為公司成功的”秘訣”,因為它易於開發人員使用,並能大幅加快資料處理速度。華為是眾多試圖透過開發替代軟體來打破NVIDIA 對人工智慧晶片壟斷的公司之一。
華為自己的員工也在抱怨CANN。一位不願透露姓名的研究人員說,CANN 使Ascend 產品”難以使用且不穩定”,測試工作受到阻礙。 “當隨機錯誤發生時,由於文件不完善,很難找出錯誤的根源。需要有才能的開發人員閱讀原始碼,才能發現問題所在,這就拖慢了工作進度。編碼並不完善,”他們說。
另一位了解百度使用華為處理器情況的中國工程師說,這些晶片經常死機,使人工智慧開發工作變得複雜。華為的研究人員說,崩潰的原因是很難使用硬體。他們說:”由於人們對硬體本身不甚了解,因此很容易出現糟糕的結果。”
據多位熟悉此事的人士透露,為了解決這個問題,華為已經派遣工程師到現場幫助客戶將先前在CUDA上編寫的培訓程式碼轉移到CANN 上。百度、科大訊飛和騰訊等科技公司都接待了工程師團隊。
華為拒絕置評,百度、科大訊飛和騰訊也沒有回應置評請求。
一位前百度員工透露說:”華為擅長客戶服務,所以他們當然會在大客戶那裡派駐工程師,幫助他們使用自己的晶片。”
華為可以利用龐大的員工隊伍加速轉變。據該公司稱,在其207,000 名員工中,50% 以上從事研發工作,包括派遣為客戶安裝技術的工程師。
“與NVIDIA相比,華為的優勢在於可以與客戶密切合作,”諮詢公司Gavekal 的技術分析師Tilly Zhang 說,”與NVIDIA不同,華為擁有龐大的工程師團隊,可以幫助客戶解決問題,並讓客戶過渡到自己的硬體。
華為還建立了一個線上門戶,供開發人員就如何改進軟體提出回饋意見。據熟悉內情的人士稱,美國10 月加強出口管制後,華為將用於培訓的晶片Ascend 910B 的價格提高了20% 至30%。華為的客戶也對Ascend 晶片的供應緊張表示擔憂,原因可能是中國公司無法從荷蘭ASML 公司購買最先進的晶片製造設備,導致製造困難。
華為的人工智慧晶片需求強勁。該公司週四公佈的上半年營收成長了34%,但沒有提供不同業務的銷售細目。華為執行董事張平安今年7 月在上海舉行的世界人工智慧大會上說,在Ascend 晶片上已經”訓練和迭代”了50 多個基礎模型。科大訊飛表示,去年華為派遣了一批工程師到其位於中國東部合肥的總部進行技術整合,其大型語言模型完全是在華為晶片上訓練出來的。