DeepSeek省了訓練費但推理模型應用又成了”燒錢黑洞”
儘管投資人曾經一度產生疑慮,但來自大型科技企業、各國政府以及創投機構的巨額資金正以前所未有的速度流入人工智慧領域。要理解這現象背後的原因,關鍵在於洞察人工智慧技術本身的演進趨勢。

目前,人工智慧技術正從傳統的大語言模型轉變為推理模型和AI代理。傳統的大語言模型,即多數免費人工智慧聊天機器人所使用的模型,其訓練過程需要消耗龐大的電力和運算時間。然而,隨著技術的進步,我們正在迅速找到方法,在使用者呼叫這些模型時減少其運行所需的資源。與之不同,基於大型語言模型的推理模型,其實際運行過程消耗的計算和電力資源是傳統模型的數倍。
自OpenAI於2024年9月發表首款推理模型o1以來,人工智慧公司紛紛加速推出能與之抗衡的系統。這其中包括DeepSeek R1,它震撼了整個人工智慧產業,並讓許多科技和能源企業的估值出現波動。上週,馬斯克(Elon Musk)旗下人工智慧新創公司xAI也推出了其推理模型Grok 3。
DeepSeek的推出之所以引發了一定程度的恐慌,是因為它證明了人工智慧模型可以以更低的成本進行訓練,這可能會削減對資料中心和昂貴先進晶片的需求。然而,DeepSeek實際上推動了人工智慧產業更堅定地邁向資源密集的推理模型,這意味著運算基礎設施的需求仍然十分強勁。
鑑於推理模型具備更強大的能力,它們可能很快就會成為人們使用人工智慧執行多種任務時的預設方式。 OpenAI執行長 Sam Altman曾表示,該公司人工智慧模型的下一次重大升級將包含高階推理能力。
那麼,為何推理模型及其相關產品(如「深度研究」工具和AI代理)需要如此多的算力資源?答案在於它們的運作原理。
英偉達人工智慧產品管理副總裁卡里·布里斯基(Kari Briski)在最近一篇部落格中解釋稱,人工智慧推理模型消耗的算力資源,通常是傳統大語言模型的100倍以上,這是因為推理模型在「思維鏈」中需要長時間與自己對話,而這些推理過程使用者往往看不見。模型消耗的算力資源與其產生的詞彙量成正比,因此,如果推理模型產生的詞彙量是常規模型的100倍,那麼它也將消耗相應的電力和算力資源。
當推理模型連接到互聯網時,如Google、OpenAI和Perplexity的「深度研究」模型所做的那樣,資源消耗會更多。這些模型對算力資源的需求還只是開始。對此,Google、微軟和Meta計劃在2025年總共投入至少2,150億美元用於資本支出,其中大部分將用於建造人工智慧資料中心。這標誌著他們的資本支出較去年增加了45%。
今年1月,隨著中國AI模型DeepSeek R1的發布,每token的算力成本(包括電力與硬體支出)似乎將迎來斷崖式下降。 DeepSeek透過論文證明,其AI模型的訓練與部署效率遠超過美國AI實驗室先前公開的方法。
表面上看,這似乎預示著人工智慧未來對算力資源的需求將大幅降低,可能只有當前需求的十分之一,甚至更少。但隨著推理模型的問世,當它們回答查詢時對算力資源的需求可能會大幅增加。簡言之,若基於DeepSeek技術的新型高效模型將AI算力需求削減至十分之一,而推理模型的普及使其使用需求激增100倍,未來整體算力需求仍將淨增10倍。
而這只是起點。隨著企業發現新型人工智慧模型的能力更強,它們會越來越頻繁地調用這些模型,這使得對算力資源的需求從模型訓練轉向模型使用,即人工智慧產業所稱的「推理」。
為其他公司提供人工智慧算力資源的Baseten公司執行長圖欣·斯里瓦斯塔瓦(Tuhin Srivastava)表示,這種向推理需求的轉變已在進行中。他的客戶包括在應用程式和服務中使用人工智慧的科技公司,如允許內容創作者透過轉錄編輯音訊和視訊的Descript,以及處理醫療記錄的新創公司PicnicHealth。
斯里瓦斯塔瓦稱,隨著客戶自身產品需求的快速成長,他們發現需要更多的人工智慧處理能力。他補充說:“六個月前,我們幫助一位客戶將算力資源需求降低了60%,但僅僅三個月後,他們的算力消耗已反超原水平。”
OpenAI、Google和Meta等公司仍在競相訓練能力較強的人工智慧模型。無論成本多高,它們的目標都是盡可能搶佔尚處萌芽階段的人工智慧市場。 Fractional AI執行長 Chris Taylor表示:「我認為,尖端實驗室很可能需要持續投入巨額資金以推動前沿技術的發展。」他的公司,如同Baseten及蓬勃發展的人工智慧生態系統中的許多其他企業,依賴這些尖端模型為客戶提供服務。
創投家、Theory Ventures創辦人 Thomas·通古茲(Tomasz Tunguz)預測,未來幾年,新的創新和更多人工智慧專用微晶片可能使得人工智慧系統比今天更有效率,或使終端系統效率提升千倍。投資人和大型科技公司押注的是,在未來十年內,由於推理模型的普及和快速採用,對人工智慧模型的需求可能會急劇增長。
通古茲表示:「你每一次鍵盤敲擊,或對著麥克風說的每一個音節,每個操作節點都將由至少一個AI系統實時處理。」如果真是這樣,他補充道,人工智慧市場的規模可能很快就會比現在擴大1000倍。