OpenAI CEO罕見認錯:DeepSeek是非常好的模式將考慮跟進開源
為因應DeepSeek-R1所帶來的競爭,OpenAI正式發布了o3-mini模型,這也是OpenAI推理系列中最新、最具成本效益的模型,並且已在ChatGPT和API中開放使用。據悉,該模型在數學程式碼等基準測試中刷新SOTA,相關測試中o3-mini(high)在準確率和校準誤差(Calibration Error)均是最優。

△o3-mini與o1在AIME競賽數學的得分對比
據介紹,o3-mini的價格比OpenAI o1-mini便宜63%,比滿血版o1便宜93%。開發者可依需求選擇高、中、低三種推理強度,讓o3-mini在處理複雜問題時進行深度思考,平衡速度與準確度。
具體來說,目前ChatGPT免費用戶首次可以體驗有限速率的o3-mini版本,速率限制與現有的GPT-4o 限制類似;Plus用戶可選擇o3-mini-high更高智慧版本;每月支付200美元的Pro 用戶可無限使用o3-mini和o3-mini-high;API層面,o3-mini輸入1.10美元/百萬token、輸出4.40美元/百萬token,價格比o1-mini便宜63%,比滿血版o1便宜93%,但仍是GPT-4o mini的7倍左右。
OpenAI表示,o3-mini的發布是追求高效能智慧技術道路上的另一個重要里程碑。透過優化科學(Science)、技術(Technology)、工程(Engineering)和數學(Mathematics)領域的推理能力,同時保持較低的成本,讓高品質AI技術變得更加平易近人。
OpenAI聯合創始人、首席執行官山姆·奧爾特曼在o3-mini發布後的在線問答中透露,“在未來幾週,滿血版o3即將上線。”
談到對於DeepSeek的看法,奧爾特曼表示,「它(DeepSeek)確實是一個非常好的模型,OpenAI會開發出更好的模型,但我們不會像往年那樣保持那麼大的領先優勢了。 」
奧爾特曼也罕見地承認了自己的錯誤,並表示OpenAI正在討論一個新的開源策略。 “我個人認為,在這個問題上我們站錯了隊,需要想出一個不同的開源策略;不是OpenAI的每個人都持有這種觀點,而且這也不是我們目前的最高優先級。”


值得一提的是,圖靈獎得主、主導Meta AI研究的首席科學家Yann LeCun日前就曾指出,DeepSeek 成功的最大收穫,是AI開源的價值使任何人都能受益。 「對那些看到DeepSeek表現並認為『中國在AI領域正超越美國』的人而言,你的解讀錯了,正確解讀應是『開源模式正超越專有模式』。DeepSeek 從開放研究和開源獲益良多(如PyTorch和Llama),他們提出新想法,並從其他人的工作基礎加以建構。 他們發布新的模型並開源,所以每個人都能從中受益,這就是開放研究和開源的力量。 」Yann LeCun說。
近期,中國AI技術廠商DeepSeek推出的V3和R1 兩款開源AI 模型都顛覆了業界對於「AI算力需求」的看法。特別是DeepSeek推出的推理大模型DeepSeek-R1,其不僅性能比肩OpenAI o1 ,而且其所需的訓練成本可能只有後者的約1/20(僅用了2048 個H800 GPU,花了兩個月的時間訓練完成,只花了約558萬美元),API的定價更是只有後者的約1/28,相當於使用成本降低了約97%。
也就是說,DeepSeek採用並不先進的AI晶片,以更低的算力要求和更低的成本,達到了OpenAI等美國AI技術廠商的頂級AI大模型的效果。這項成就被認為對美國的人工智慧領導地位構成威脅,不僅引發了OpenAI、Meta、Google等眾多大模型廠商恐慌,也引發了英偉達等AI晶片企業的價值重估和股價大跌。
然而,根據SemiAnalysis,與外界認為DeepSeek公司擁有5萬張H100 GPU計算卡看法不同,該機構認為,DeepSeek囤積了6萬張英偉達GPU卡,其中包括1萬張A100、1萬張H100、1萬張「特供版」H800、3萬張「特供版」H20,算力資本支出的總體擁有成本(TCO)超過140億元,達19.96億美元(約合人民幣143.45億元)。 DeepSeek 的總伺服器資本支出約為16.29 億美元,營運此類叢集的成本高達9.44 億美元,因此整體的成本可能高達25.73 億美元。

但是,DeepSeek並未進行過大規模融資,其母公司幻方似乎也不太可能會進行如此大規模的硬體支出。 DeepSeek官方公佈的數據來看,其DeepSeek-V3的訓練僅用了約2080張英偉達H800加速卡,這部分的晶片投資大約為4000萬美元左右。而且,DeepSeek訓練其AI模型也不一定非要擁有龐大的自有的硬體基礎設施,其完全可以透過租用第三方的硬體基礎設施來對自己的大模型進行訓練。
不過,如果SemiAnalysis對於DeepSeek囤積了6萬張英偉達GPU加速卡的分析是正確的話,那麼這也意味著DeepSeek現有的AI算力硬體足以支撐其沿著目前的技術路徑在未來持續研發出多代性能更為強大的AI大模型。