儘管缺乏頂尖晶片中國人工智慧正快速追趕上來
儘管中國在獲取尖端晶片方面面臨限制,但中國新創公司在追趕美國前沿人工智慧模型方面的速度卻超出了業界許多人的預期。今年11月,總部位於北京的DeepSeek公司發布了其最新大語言模型的預覽版本,並聲稱該模型的能力可媲美OpenAI於9月發布的推理模型o1預覽版。
近期,其他中國公司也提出了類似的聲明。由阿里巴巴和騰訊支持的新創企業月之暗面表示,其開發的一款專注數學的模型在性能上已接近o1模型。而阿里巴巴則進一步聲稱,其實驗性研究模型在數學領域的表現甚至優於o1的預覽版。
這些公司尚未發布詳細闡述其模型性能的論文,同時,目前對人工智慧模型能力也缺乏統一的測試標準,因此很難對這些聲明的準確性進行驗證。不過,一些美國專家對中國模型的表現表示認可。
OpenAI前研究員、現人工智慧企業家安德魯卡爾(Andrew Carr)指出,中國人工智慧領域正在「快速追趕」。他提到,DeepSeek的研究團隊在短短數月內成功複製了OpenAI的推理模型,這項成就「讓許多同行感到驚訝」。
用於比較模型表現的一個測試是美國數學邀請賽(AIME),該賽事旨在挑戰全球最聰慧的高中數學人才。
DeepSeek聲稱,其模型在AIME測試的表現優於OpenAI。但美國媒體針對今年AIME的15題試題進行的實驗發現,儘管OpenAI的o1預覽模型在解題速度上領先於DeepSeek、月之暗面及阿里巴巴的實驗模型,但所有模型在首次嘗試中便得出正確答案,這本身已是一項顯著成就。例如,在解答一個關於雙人遊戲策略的字謎問題時,OpenAI程式僅用10秒便得出答案,而DeepSeek則耗時兩分多鐘。
自2022年以來,中國人工智慧開發人員受到美國尖端AI晶片出口限制的影響,其中包括英偉達的高性能晶片。今年12月,拜登政府進一步收緊了出口管制政策。
儘管如此,中國開發人員透過創新技術找到了解決方案。例如,在阿里巴巴和騰訊支持的月之暗面,創辦人楊植麟表示,公司正專注於強化學習,透過模仿人類的試誤過程來提高模型效能。這種方法不僅提升了模型能力,也降低了對運算資源的需求。
此外,自去年年底以來,人工智慧開發人員越來越多地採用「混合專家」(MoE)技術。這種技術透過初始路由機制,將特定問題分配給最擅長處理該類問題的專家模型,就像餐廳廚師長根據訂單將菜餚分配給合適的廚師一樣。這種方法有效降低了對高性能晶片的依賴。
騰訊在今年11月宣布,其最新發布的MoE模型在性能上已可媲美Meta於今年7月推出的Llama 3.1模型。然而,美國研究人員透過審查兩家公司發表的論文指出,騰訊的模型可能只使用了Meta模型十分之一的計算資源來完成訓練。
DeepSeek最初是High-Flyer旗下的人工智慧研究部門,High-Flyer是一家管理著80億美元資產的量化對沖基金管理公司,以利用人工智慧技術進行交易而聞名。 2021年,DeepSeek將大約1萬顆英偉達A100晶片連接起來,建構了一個名為Fire-Flyer 2的AI訓練集群。
在今年8月發表的一篇論文中,DeepSeek表示,Fire-Flyer 2的性能已接近英偉達相似晶片構成的系統,但其成本和能耗均顯著降低。此外,DeepSeek於5月發布的關於其「混合專家」(MoE)模型的論文,也因採用更高效的數據處理技術而在業界引發廣泛關注。
Anthropic共同創辦人傑克克拉克(Jack Clark)在其部落格中提到,DeepSeek的Fire-Flyer 2集群是中國應對出口管制的典型策略。他寫道:「中國透過利用現有硬體資源建構卓越的軟體與硬體堆疊,繞過了出口管制。正如在電動車、無人機等領域的表現,中國製造也將在人工智慧模型領域佔據重要地位。
儘管如此,許多中國AI開發者透過中間商交易和海外資料中心,找到了取得受限英偉達晶片的方法。然而,中國公司高層指出,尖端晶片的短缺依然是限制新創企業發展的主要瓶頸,而這一差距可能進一步擴大。目前,英偉達的客戶正在準備大規模部署其最新的AI資料中心晶片Blackwell。
在國際競爭中,美國企業持續加碼。馬斯克(Elon Musk)旗下的xAI已建成一個由10萬顆英偉達晶片組成的資料中心,並籌集了50億美元用於進一步擴展。亞馬遜AWS也計畫使用數十萬顆自主研發的晶片,打造一台規模空前的人工智慧超級電腦。
DeepSeek專注於開源模型研究,特別著重數學和程式設計能力。而另一家新創公司月之暗面則憑藉其類似ChatGPT的聊天機器人Kimi,成功吸引了中國消費者的青睞,並因其出色的長文本處理能力而聲名鵲起。
然而,與OpenAI等美國公司相比,中國AI新創企業的估值仍相對較低。 OpenAI最近的估值已高達1,570億美元,而中國新創公司則面臨融資挑戰。在這種激烈的市場競爭中,價格戰在AI模型供應商之間已然爆發。
以北京為基地的智譜AI為例,據知情人士透露,該公司已延後最早在2025年下半年上市的計畫。投資銀行家認為,其可能難以獲得預期估值。在最新一輪融資中,智譜AI的估值約為30億美元。值得注意的是,智譜AI於11月底展示了其AI智能體,並於7月推出了一款與OpenAI Sora相似的影片生成模型。
霍華德·黃(Howard Huang),一位曾在北京一家人工智慧公司負責基礎設施的高階主管,將中國的人工智慧產業形容為「戴著鐐銬跳舞」。他表示:「專注於我們擅長的領域是唯一的生存機會,也可能是我們在全球競爭中獲勝的關鍵。」(小小)