新報告估計DeepSeek硬體支出可能高達5億美元
根據CNBC報道,中國的DeepSeek成為本週科技界最大的話題,許多業內人士和華爾街人士都關註一個數字:600萬美元。 DeepSeek 在關於其最新人工智慧模型的論文中表示,DeepSeek 包含一個明確的警告,稱該數字僅包括模型的官方訓練,不包括與架構、演算法或數據的先前研究和消融實驗相關的成本。

本週早些時候,DeepSeek 的AI Assistant 取代OpenAI 的ChatGPT,成為美國蘋果應用商店下載次數最多的免費應用程式。全球科技股遭遇拋售,晶片製造商英偉達和博通週一總市值蒸發了8,000 億美元。
半導體研究和諮詢公司SemiAnalysis 的一份新報告為DeepSeek 的開支提供了更多背景資訊。
該公司估計,DeepSeek 的硬體支出在公司歷史上遠高於5 億美元,並補充說研發成本和總擁有成本相當高。
SemiAnalysis 寫道,為模型產生訓練所需的合成資料需要大量的計算。
報道稱,Anthropic 的Claude 3.5 Sonnet 訓練成本數千萬美元,但指出Anthropic 從亞馬遜籌集了數十億美元和Google,這表明運營這些模型和公司需要多少錢。
SemiAnalysis 表示:這是因為他們必須進行實驗、提出新的架構、收集和清理資料、支付員工薪水等等。
DeepSeek 自己的論文並未包含對其計算成本的估計。該公司沒有立即回應置評請求。
SemiAnalysts 寫道:需要明確的是,DeepSeek 的獨特之處在於他們率先實現了這種成本和能力水平。
該公司補充說,DeepSeek 的R1是一個非常好的模型,並且如此迅速地趕上推理前沿確實令人印象深刻。
本週,專家和分析師對DeepSeek 模型的品質大加讚賞,並指出考慮到美國三年內三次限制對華晶片出口,該模型令人印象深刻。這引發了人們的擔憂,即美國在一個預計十年內收入將超過1 兆美元的市場上落後於其主要對手。
伯恩斯坦分析師在周一的一份報告中寫道,根據我們(週末)看到的許多(偶爾歇斯底里的)熱門言論,其影響範圍從這真的很有趣到這是我們所知的人工智能基礎建設綜合體的喪鐘。
DeepSeek 成立於2023 年,創辦人是專注於人工智慧的量化對沖基金High-Flyer 的共同創辦人梁文峰。據報道,這家人工智慧新創公司於2023 年4 月從對沖基金的人工智慧研究部門中脫穎而出,專注於大型語言模型和通用人工智慧(AGI)——人工智慧的一個分支,它在廣泛的任務上等同於或超越人類智力,OpenAI 和其他公司正在追求這一目標。
傑富瑞(Jefferies) 分析師表示,DeepSeek 仍由High-Flyer 全資擁有並獲得資助。
本月初,DeepSeek 發布了R1,該模型可與OpenAI 的o1 相媲美,由此引發的討論開始升溫。 R1 是開源的,這意味著任何AI 開發人員都可以使用它。
OpenAI 執行長Sam Altman 公開讚揚了該模型,但該公司也表示,有證據表明DeepSeek不正當地收集了OpenAI 數據來建立其產品。
在周四由OpenAI 於華盛頓特區舉辦的一場活動上,奧爾特曼表示,DeepSeek顯然是一個很棒的模特兒。
他說:這提醒我們競爭的水平以及人工智慧獲勝的必要性。
他說,這也顯示了對推理的興趣水平,對開源的興趣水平。