美媒:在晶片限制之下,中國AI如何迅速縮小與美國差距
2017年,中國公佈了《新一代人工智慧發展規劃》,目標是在2030年成為全球人工智慧創新中心和領導者。規劃要求,2020年在人工智慧領域取得“標誌性進展”,以展示其發展成果。然而,2022年底,OpenAI推出的ChatGPT橫空出世,不僅震驚全球,也讓中國措手不及。
彼時,中國科技公司正經歷嚴厲的監管風暴,導致科技業損失約1兆美元。直到近一年後,部分人工智慧聊天機器人才獲準公開發布。而就在ChatGPT問世的一個月前,拜登政府推出了出口管制措施,限制中國取得訓練大規模人工智慧模型所需的尖端晶片。這些因素使中國在2030年實現人工智慧領先的目標顯得更加困難。
但到今天,中國發布的一系列人工智慧產品顯示出其快速進步,與美國的差距顯著縮小。 2024年11月,阿里巴巴和中國人工智慧開發商DeepSeek分別發布了推理模型,在某些測試中表現接近OpenAI的o1預覽版。同月,騰訊發布了混元大模型新版本,這款開源模型在多項基準測試中超越了美國頂級開源模型的表現。而在2024年底,DeepSeek發表的DeepSeek-v3更是在知名線上排行榜上佔據開源領域榜首,甚至與OpenAI和Anthropic的頂級閉源系統展開競爭。
這一趨勢引起了關注。 2024年5月,Google前CEO埃里克·施密特(Eric Schmidt)曾表示,美國在人工智慧領域領先兩到三年,“在我看來,這已經是一個非常長的時間了。”但到了11月,他在哈佛大學的演講中改口,稱中國的技術進展——尤其是阿里巴巴和騰訊的成果——正在迅速縮小差距。 “這讓我震驚,我原以為晶片限制會遏制他們的進步。 ”
人工智慧領域的競爭不僅關乎國家聲譽,更深刻影響全球力量平衡。智慧代理(或稱為智能體)的廣泛應用可能推動經濟成長,而未來能夠指揮武器或實施網路攻擊的智慧系統將為國家帶來決定性的軍事優勢。當許多國家必須在中美人工智慧系統之間做出選擇時,人工智慧將成為強大的全球影響力工具。中國的快速崛起令人質疑,美國的半導體出口管制是否足以維持其優勢地位?
建構更強大的人工智慧系統離不開三個核心要素:數據、創新演算法和算力。類似GPT-4的大語言模型,其訓練資料通常來自互聯網,這使全球開發者都能輕鬆取得。同樣,演算法作為改進人工智慧系統的創新思路,也因學術論文的廣泛傳播而跨越國界。即便缺乏學術交流,中國仍憑藉其豐富的人才儲備,培養出比美國更多的頂尖人工智慧研究人員。然而,與數據和演算法不同,先進晶片作為實體產品,其流通可以受到邊境限制。
先進半導體供應鏈主要由美國及其盟友控制。在這一領域,美國的英偉達和AMD幾乎壟斷了AI資料中心所使用的GPU市場。其晶片設計複雜至極,目前只有台積電能夠製造這些尖端晶片。而台積電則依賴荷蘭阿斯麥(ASML)公司提供的昂貴製造設備。
為了保持競爭優勢,美國實施了一系列限制。 2022年,拜登政府推出出口管制,禁止向中國出售最先進晶片。這項政策延續了川普政府時期的相關舉措,旨在遏制中國取得晶片製造技術。這些措施不僅限制了先進晶片進入中國市場,也抑制了中國本土晶片產業的發展。美國商務部長吉娜·雷蒙多(Gina Raimondo)曾在去年4月的一次採訪中表示,中國在晶片領域「已落後多年」。
然而,出口管制的效果並非無懈可擊。在限制生效之前,部分中國開發者已預見即將到來的政策,提前大量囤積即將受限的晶片。例如, DeepSeek在美國出口管制實施前一年,組成了一個由1萬個英偉達A100 GPU組成的計算集群,並開發了人工智慧推理模型R1。
除此之外,其他規避措施也削弱了出口管制的效果。有通報稱,中國企業透過境外空殼公司購入受限晶片,還有一些公司選擇向離岸雲端服務供應商租用GPU資源。去年12月,有媒體報導稱,美國正計劃推出新的限制措施,以阻止中國透過第三國取得晶片的途徑。
儘管美國的出口管制措施限制了中國取得最先進的半導體,但仍允許銷售性能較弱的晶片。然而,要確定哪些晶片可以銷售、哪些應被禁止,一直是個複雜的挑戰。 2022年,英偉達調整了其旗艦晶片的設計,為中國市場推出了一個符合管制要求的版本。儘管效能降低,但該晶片在AI開發領域仍具備實用價值,促使美國在2023年10月進一步收緊限制。
蘭德技術與安全政策中心的人工智慧與運算主管 Lennart Heim)表示:「過去一年,中國能夠購買性能幾乎同等的晶片。」他認為,這一漏洞,加上新晶片融入開發商基礎設施所需的時間,是目前尚未看到出口管制對中國AI發展全面影響的主要原因。
目前管制門檻是否合理,仍有待觀察。 2024年11月,騰訊發布了“混元大模型”,其在多個性能基準測試中表現優異,甚至超越了Meta最強大的Llama 3.1模型。儘管柏克萊風險與安全實驗室的研究顯示,基準測試並非衡量AI智能的完美指標,但混元大模型的表現依然令人印象深刻,尤其是它使用的是性能較弱、不受管制的英偉達H20 GPU進行訓練。
該研究報告的作者里特維克·古普塔(Ritwik Gupta)同時也是美國國防部國防創新部門的顧問,他表示: 「透過軟體優化,中國開發商顯然更有效率地利用了硬體資源。」此外,DeepSeek開發的DeepSeek-v3模型也在開源領域表現出色,而其訓練所需的運算能力卻低得出乎意料。
儘管候任總統川普在人工智慧政策上的具體方向尚不明朗,多位專家在2024年11月表示,預計出口管制將繼續執行,甚至可能進一步擴大範圍。在2024年12月美國推出新一輪限制措施前夕,中國企業再次大規模囤積即將受限的晶片。
對此,古普塔評論道:「整個戰略需要重新思考。我們不能再繼續這種針對硬體晶片的’打地鼠’式應對。」他建議,美國應將關注點從限制晶片使用轉向防止軍用AI系統的崛起,因為這類系統對運算能力的需求通常較低。同時,他也承認,美國對晶片供應鏈其他關鍵環節的限制(如對ASML晶片製造設備出口的管控)在遏制中國國內晶片產業發展方面發揮了重要作用。
海姆補充說,在過去一年,美國在AI領域的領先優勢確實有所縮小。他指出,中國目前可能已經能夠開發出媲美美國頂尖開源模型的產品,但這些模型仍比美國最強閉源模型落後約一年。他進一步強調,這並不意味著出口管制的失敗。 “我們應該摒棄出口管制要么有效、要么無效的二元思維,”他說,“中國可能需要更長時間才能真正感受到出口管制的深遠影響。”
過去十年間,用於訓練人工智慧模型的運算能力成長迅猛,令人矚目。以OpenAI為例,該公司在2023年發布的GPT-4據估計使用的計算量是2019年發布的GPT-2的約1萬倍。有跡象表明,這一成長趨勢仍將持續。美國公司如X和亞馬遜正在建造配備數十萬顆GPU的超大型超級計算機,其運算能力遠超目前領先的人工智慧模型所需的水平。
基於此趨勢,海姆預測,美國的晶片出口管制將對中國人工智慧的發展能力構成重大限制。他指出:「出口管制主要影響的是數量,即便部分受限晶片最終流入中國開發者手中,由於數量受到壓縮,這將大大增加訓練和部署大規模模型的難度。」他進一步補充道,「只要運算能力仍然是關鍵,隨著時間推移,出口管制的影響可能會更加深遠。
卡內基國際和平基金會技術與國際事務計畫訪問學者辛格(Scott Singer)則表示,目前華盛頓在是否應與中國展開人工智慧談判的問題上態度猶豫。他分析道:“隱含的邏輯是,如果美國已處於領先地位,為何還要與中國分享任何成果?”
然而,辛格強調,與中國就人工智慧展開對話具有重要意義。他指出:「即便中國在運算能力上受限,但其持續的技術進步仍可能使其在未來開發出具有潛在危險能力的人工智慧系統。」他警告道,「當中國的模型水準顯著接近美國時,美國需要考慮如何與中國進行對話,以確保雙方的人工智慧系統能夠保持安全。