誕生了DeepSeek的中國AI生態為何與美國不同?
透過押注AI,中國希望發展面向全球市場,尤其是低收入國家的成本效益高的實用商業工具。當美國科技企業家彼得·蒂爾(Peter Thiel)的書《從0到1》(Zero to One)2015年在中國出版時,它擊中了許多中國人心中的一種不安全感。 Thiel認為,雖然中國在新興技術的擴展和商用方面做得很好,但真正的創新不如美國——這裡真正的創新是指從零創造出某種全新事物。以iPhone為例:加州庫比蒂諾的工程師負責設計,中國深圳的工人負責製造業。

在十多年的時間裡,中國的決策層一直想擺脫這種印象,將追求創新融入了國家產業政策,如中國製造2025(Made in China 2025)。一些早期成果已然顯現。例如2023年,深圳科技公司華為(Huawei)推出了使用本土生產晶片製造的智慧型手機Mate 60。這被視為象徵性突破,證明中國即使面對美國在核心設備和高端設計軟體上的嚴厲制裁,仍能製造出先進的半導體。不久前問世的DeepSeek-R1——只用其西方同類產品的一小部分成本打造的一款中國大語言模型——在美國科技領域掀起了軒然大波。
著名創投家Marc Andreessen稱之為「AI的’斯普特尼克’時刻」 ——其典故為蘇聯在20世紀中期發射世界首顆衛星「斯普特尼克」(Sputnik)後開始了美國-蘇聯太空競賽。透過一個應用程式介面(API,連接不同軟體應用的協定)使用DeepSeek,價格只需加州OpenAI公司開發的類似模型的1/13。
DeepSeek的橫空出世將聚光燈照到了中國的人工智慧(AI)生態系統中——而這裡的運作模式與矽谷的非常不同。雖然面向用戶的應用得到了大量關注,但中國AI公司和美國AI公司不一樣,它們實際上更關注如何解決大規模的工業和製造問題。這種差異映射了兩國創新驅動力的差異:美國是風投資本,而中國是大型製造業企業和國家機構。
技術分流
這種差異的根源是中國在全球經濟中的比較優勢——製造業——以及政府才是新技術的最大客戶。中國政府希望研發出低成本、可擴展的AI應用,幫助這個快速發展的國家實現現代化。
在去年9月的例行記者會上,外交部發言人林劍表示,中國始終把科技創新放在國家發展的核心。為了響應政府號召,各AI研究實驗室努力打造實際應用-讓火車準點、監測魚類資源、提供自動遠距醫療服務。
北京公司智譜AI(Zhipu AI)與多地政府以及國營企業合作,部署其智能體模型,讓填表和財務報告分析這類任務自動化。 1月,總部位於杭州的科技巨頭阿里巴巴(Alibaba)與北京新創公司零一萬物(01.AI)成立了“產業化大模型聯合實驗室”,聚焦加速AI的商業和產業落地。
AI在中國能源轉型中的作用也不容忽視,從大規模試點整合式智慧家居,到對國家智慧電網的巨額投資(約合8000億美元)。
因此,中國政府的目標未必是引領全球的AI對話機器人領域,而是利用底層技術打造可負擔、商業可行的解決方案。其應用能向其他地區出口,尤其是向低收入國家。換句話說,中國的目標不一定是“前沿AI”,而是“大眾市場AI”。中國新譜寫的AI藍圖呼應了它對其他技術的態度,如電動車和清潔能源:不做第一個創新的,而做第一個讓技術實現可負擔和大規模使用的。
逼不得已
技術堆疊(stack)是指一組用於開發先進AI模型的互相關聯的資源,包括半導體等硬體、為此硬體優化的前沿學習演算法,以及一個包含能源密集型資料中心和可預測資金流的後端。
為了穩坐AI技術的全球寶座,美國不時會對關鍵組件實施出口制裁。 2022年10月7日,美國前總統拜登的政府發布了一系列對先進運算和半導體製造元件的出口管制措施,旨在防止中國從加州英偉達(NVIDIA)等公司採購高效能晶片。當時的國家安全顧問Jake Sullivan稱之為“小院高牆” (small yard, high fence)策略:美國會在核心AI技術周圍設“牆”,甚至鼓勵荷蘭和韓國等盟國的公司限制向中國的出口。
同時,中國看到了升級產業鏈對於經濟發展的重要性,尤其是飛機和半導體等領域。從這方面來看,這種競爭要求中國的努力更加迫切、更大力度。如果美國掌握了未來技術並執意動用出口管制,那麼中國就面臨經濟停滯的風險,以及隨之而來的政治動盪。對AI霸權的爭奪其實是整個地緣政治矩陣的一部分。
為因應這個局面,中國早有準備。 2019年,美國將華為列入實體清單——美國商務部發布的貿易限制清單。這使得中國重新思考如何才能減少受到美國出口管制的擺佈。中國教育部提出了多個整合攻關大平台(IRP),透過重大機構改革助力國家在易受美國制裁或出口管控的關鍵領域發展,包括機器人學、無人駕駛汽車和AI等。目前共有30個整合式攻關大平台。
上海復旦大學的新一代積體電路技術整合攻關大平台,便是有望推動突破的國家級科研隊伍。 2022年的出口管制針對「節點」(node,半導體的最小單位)為14奈米或以下的晶片。晶片的節點越小,同一區域整合的電晶體就越多,就能提升效能和效率。早在2021年,復旦新一代積體電路技術整合攻關大平台已就推出從事3-4奈米節點研究的崗位了。如今,這類高效能晶片是AI技術堆疊的驅動力。為了解決製造瓶頸,去年中國啟動了第三期“大基金”,並計劃在半導體生態系統中投入470億美元。國家大基金是一個國家支持的投資計劃,集中了來自公共企業和當地政府的資源。
這顯示出中國透過投入大量機構、學術和科研資源以實現AI能力本土化的決心。美國限制中國取得晶片的政策,逼迫中國創造條件、找到了非傳統方法。許多這些嘗試不一定有成果,但不需要很多成功也能產生全球影響力。
整合攻關大平台已經成了培訓工程師團隊的理想平台,填補了即使十年前仍存在的人才庫空白。DeepSeek的一舉成名從某種程度上來說,也是這項多年投入的成果。
前方的路
中國AI生態的未來會朝哪個方向發展?雖然美國在短期內仍可能掌握了晶片領域的「卡脖子」優勢,但中國在其他方面的準備更加充分:例如,對消耗大量電力的資料中心的需求日益旺盛。全國一體化算力網絡,作為2021年啟動的一個基礎設施大項目的一部分,計劃在土地和電力相對便宜的中國西部大面積建設數據中心。
中國獨特的經濟和政治生態將引領AI朝向特定路徑發展。中國仍面臨發展問題,因此,醫療資源均衡化,準確預測天氣模式,以及管理產業物流,都是比開發AI對話機器人和數位伴侶更為急迫的挑戰,尤其是考慮到關於敏感話題的各種合規性要求。
中國龐大的消費市場加上製造基礎,或能推動「具身AI」(embodied AI)的發展,如AI驅動的機器人、自動駕駛汽車和工業設備等。例如,當杭州公司宇樹科技(Unitree Robotics)的狗狗外型的四足機器人被用於修復基礎設施——利用高清攝影機抵達特定檢查點並用機器臂開展修復工作——它們得到了國家新聞機構新華社的報道和讚揚。
「軟體(在中國)基本上不賺錢;民眾認為軟體都應該是開源的。軟硬體結合才能有盈利。」北京大學的一位機器學習研究員表示,“所以說,AI驅動的機器人可能成為中國未來的潮流。”
在語言模型領域,中國的下一個發力點或是辨識出能出口到其他新興經濟體的一系列產品。加州大學聖迭戈分校的技術哲學研究員Benjamin Bratton說,“本質上,中國能提供盒子裡的AI堆棧。這是你的發電廠;這是你的基座模型;這是用於應用系統的堆棧架構——拿去吧印度,拿去吧巴西。”
為提前做好準備,中國政府落實了重大政策改革,修改經濟理論,將數據視為與資本、人力和土地等同的資源。根據中國國家科研機構——資訊通信研究院——去年發布的一份白皮書,目前中國占到了全球所有大語言模型的36%,僅次於美國。
但是,就算美國和中國的AI發展領先世界其他國家,隨著雙方的發展各行其道,誰先誰後的問題也就不那麼重要了。
原文以China made waves with Deepseek, but its real ambition is AI-driven industrial innovation標題發表在2025年2月18日《自然》的Essay版塊上