中國AI刷屏外媒DeepSeek或徹底改變遊戲規則
短短一個月內,中國AI新創公司深度求索(DeepSeek)先後發布了DeepSeek-V3和DeepSeek-R1兩款大模型,成本價格低廉,性能與OpenAI相當,讓矽谷震驚,甚至引發了Meta內部的恐慌,工程師們開始連夜嘗試複製DeepSeek的成果。
Scale AI創辦人Alexander Wang在1月24日的訪談中表示,DeepSeek在他們的測試裡是表現最好的,與美國最好的模型相當。
此前,Alexander Wang評論說,DeepSeek-V3是中國科技界帶給美國的苦澀教訓。 「當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。”
此外,中國AI「刷屏」國外各大媒體,它們認為中國大模型的新進展為矽谷敲響了警鐘。
在5000億美元的「星際之門」計畫公佈之際,DeepSeek以極低的價格建立了一個突破性的AI模型,而且沒有使用尖端晶片,讓人們質疑,AI行業數千億美元資本的巨額投入真的是最有效的方法嗎?
Meta進入恐慌模式,試圖複製DeepSeek
1月24號,一則發佈在匿名平台teamblind上的貼文瘋傳。一名Meta員工稱,現在Meta內部因為DeepSeek的模型,已經進入恐慌模式。
這位Meta員工寫道:
「一切源自於DeepSeek-V3的出現,它在基準測試中已經讓Llama 4相形見絀。更讓人難堪的是,一家’僅用550萬美元訓練預算的中國公司’就做到了這一點。
工程師們正在爭分奪秒地分析DeepSeek,試圖複製其中的一切可能技術。這絕非誇張。
管理階層正為GenAI研發部門的巨額投入而煩惱。當部門裡一個高階主管的薪資就超過訓練整個DeepSeek V3的成本,而且這樣的高階主管還有數十位,他們該如何向高層交代?
DeepSeek-R1的出現讓情況更加嚴峻。具體細節屬於機密,不便透露,不過很快就會公開了。 」
去年12月27日,DeepSeek推出開源模型DeepSeek-V3。當時,聊天機器人競技場(Chatbot Arena)顯示,DeepSeek-V3在所有模型中排名第七,在開源模型中排名第一。而且,DeepSeek-V3是全球前十中性價比最高的模型。
不到一個月後,今年1月20日,DeepSeek正式開源R1推理模型,允許所有人在遵循MIT License(註:被廣泛使用的一種軟體授權條款)的情況下,蒸餾R1訓練其他模型。
1月24日,DeepSeek-R1在聊天機器人競技場綜合榜單上排名第三,與頂尖推理模型o1並列。
在高難度提示字、程式碼和數學等技術性極強的領域,DeepSeek-R1拔得頭籌,名列第一。
在風格控制方面,DeepSeek-R1與o1並列第一,意味著模型在理解和遵循使用者指令,並按照特定風格生成內容方面表現出色。
在高難度提示詞與風格控制結合的測試中,DeepSeek-R1與o1也並列第一,進一步證明了其在複雜任務和精細化控制方面的強大能力。
Artificial-Analysis對DeepSeek-R1的初步基準測試結果也顯示,DeepSeek-R1在AI分析品質指數中取得第二高分,價格是o1的約三十分之一。
AI大佬驚嘆:中國AI已追上美國
去年12月DeepSeek-V3發布後,AI數據服務公司Scale AI創辦人Alexander Wang就發文表示,DeepSeek-V3是中國科技界帶給美國的苦澀教訓。 「當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。”
著名投資公司A16z的創始人馬克安德森1月24日發文稱,Deepseek-R1是他見過的最令人驚嘆、最令人印象深刻的突破之一,而且還是開源的,它是給世界的一份禮物。
1月24日,A16z合夥人、Mistral AI董事會成員Anjney Midha表示:“從史丹佛到麻省理工,DeepSeek-R1幾乎一夜之間成為美國頂尖大學研究人員的首選模型。”
對於中國AI為何能有如此快速的進展,諾獎得主、「AI教父」傑弗裡·辛頓在1月21日接受博主Curt Jaimungal專訪中表示,中國的STEM(科學、技術、工程、數學)教育比美國更好,擁有更多受過良好教育的人才,這將為AI的發展提供堅實的基礎。儘管美國試圖透過限制(如英偉達晶片)來減緩中國的發展,但這只會促使中國加速發展自己的技術,「他們可能會落後幾年,但最終會趕上」。
DeepSeek或徹底改變遊戲規則「大力出奇蹟」還有效嗎?
史丹佛大學和Epoch AI的研究人員去年年中發表了一項研究表明,到2027年,最大型的模型的訓練成本將超過10億美元。 Gartner預測,到2028年Google、Microsoft和AWS等超大規模企業僅在AI伺服器上的支出就將高達5,000億美元。
但DeepSeek完全不同,它的訓練成本並不昂貴。 Noah’s Arc資本管理公司表示,DeepSeek-V3模型有可能徹底改變訓練和推理領域的遊戲規則。
特別是在5000億美元的「星際之門」計畫公佈後,DeepSeek更讓人懷疑,巨額投入這種「大力出奇蹟」的辦法真是最有效的方法嗎?
美股大V「THE SHORT BEAR」1月24日在X上發文稱,DeepSeek給AI巨頭們帶來了痛苦時刻,投資者必須對此敲響警鐘。
他說:“如果擊敗OpenAI只需要5500萬美元,那麼這個行業的商業化會比很多人預想的要快很多。”
他還指出:“根據紅杉,美國AI公司每年必須產生約6000億美元收入來支付其AI硬體費用。現在看來,這種冒險行為變得越來越無利可圖。”
著名財經記者Holger Zschaepitz 1月25日表示,DeepSeek以極低的價格建立了一個突破性的AI模型,而且沒有使用尖端晶片,這讓人們質疑該行業數千億美元資本支出的效用。
有投資人甚至認為,美股晶片股的股價也會面臨挑戰。
投資人Geiger Capital表示,Deepseek和OpenAI一樣好,甚至更好,而且價格只有後者的3%…而美國公司卻投入了數千億美元。那麼……納斯達克會怎麼樣呢?
值得注意的是,DeepSeek-V3發表後,英偉達股價下跌了2%。而DeepSeek-R1引發海外大討論後,1月24日英偉達股價又大跌了3.12%。
外媒集體刷屏:給矽谷敲響警鐘
如果說DeepSeek-V3只是掀起了波瀾,那麼DeepSeek-R1則是引發了轟動。最近四天,國外媒體紛紛聚焦DeepSeek,並一致認為中國大模型的新進展為矽谷敲響了警鐘。
1月22日,美國媒體Business Insider報告稱,DeepSeek-R1模型秉承開放精神,完全開源,為美國AI玩家帶來了麻煩。開源的先進AI可能挑戰那些試圖透過出售技術賺取巨額利潤的公司。
1月24日,美國媒體CNBC推出了長達40分鐘的節目,邀請了Perplexity CEO Aravind Srinivas來分析為何DeepSeek會引發人們對美國在AI領域的全球領先地位是否正在縮小的擔憂。
英國《金融時報》1月25日報道稱,中國小型AI新創公司DeepSeek震驚矽谷。報道聚焦資源更豐富的美國AI公司能否捍衛自己的技術優勢。
報導引述加州大學柏克萊分校AI政策研究員Ritwik Gupta稱,DeepSeek最近發布的模型顯示「AI能力沒有護城河」。 Gupta補充說,中國的系統工程師人才庫比美國大得多,他們懂得如何充分利用運算資源來更便宜地訓練和運行模型。