中國AI刷屏外媒DeepSeek或徹底改變遊戲規則

2025-01-27 Comments 0 Comment

短短一個月內，中國AI新創公司深度求索（DeepSeek）先後發布了DeepSeek-V3和DeepSeek-R1兩款大模型，成本價格低廉，性能與OpenAI相當，讓矽谷震驚，甚至引發了Meta內部的恐慌，工程師們開始連夜嘗試複製DeepSeek的成果。

Scale AI創辦人Alexander Wang在1月24日的訪談中表示，DeepSeek在他們的測試裡是表現最好的，與美國最好的模型相當。

此前，Alexander Wang評論說，DeepSeek-V3是中國科技界帶給美國的苦澀教訓。「當美國休息時，中國（科技界）在工作，以更低的成本、更快的速度和更強的實力趕上。”

此外，中國AI「刷屏」國外各大媒體，它們認為中國大模型的新進展為矽谷敲響了警鐘。

在5000億美元的「星際之門」計畫公佈之際，DeepSeek以極低的價格建立了一個突破性的AI模型，而且沒有使用尖端晶片，讓人們質疑，AI行業數千億美元資本的巨額投入真的是最有效的方法嗎？

Meta進入恐慌模式，試圖複製DeepSeek

1月24號，一則發佈在匿名平台teamblind上的貼文瘋傳。一名Meta員工稱，現在Meta內部因為DeepSeek的模型，已經進入恐慌模式。

這位Meta員工寫道：

「一切源自於DeepSeek-V3的出現，它在基準測試中已經讓Llama 4相形見絀。更讓人難堪的是，一家’僅用550萬美元訓練預算的中國公司’就做到了這一點。

工程師們正在爭分奪秒地分析DeepSeek，試圖複製其中的一切可能技術。這絕非誇張。

管理階層正為GenAI研發部門的巨額投入而煩惱。當部門裡一個高階主管的薪資就超過訓練整個DeepSeek V3的成本，而且這樣的高階主管還有數十位，他們該如何向高層交代？

DeepSeek-R1的出現讓情況更加嚴峻。具體細節屬於機密，不便透露，不過很快就會公開了。」

去年12月27日，DeepSeek推出開源模型DeepSeek-V3。當時，聊天機器人競技場（Chatbot Arena）顯示，DeepSeek-V3在所有模型中排名第七，在開源模型中排名第一。而且，DeepSeek-V3是全球前十中性價比最高的模型。

不到一個月後，今年1月20日，DeepSeek正式開源R1推理模型，允許所有人在遵循MIT License（註：被廣泛使用的一種軟體授權條款）的情況下，蒸餾R1訓練其他模型。

1月24日，DeepSeek-R1在聊天機器人競技場綜合榜單上排名第三，與頂尖推理模型o1並列。

在高難度提示字、程式碼和數學等技術性極強的領域，DeepSeek-R1拔得頭籌，名列第一。

在風格控制方面，DeepSeek-R1與o1並列第一，意味著模型在理解和遵循使用者指令，並按照特定風格生成內容方面表現出色。

在高難度提示詞與風格控制結合的測試中，DeepSeek-R1與o1也並列第一，進一步證明了其在複雜任務和精細化控制方面的強大能力。

Artificial-Analysis對DeepSeek-R1的初步基準測試結果也顯示，DeepSeek-R1在AI分析品質指數中取得第二高分，價格是o1的約三十分之一。

AI大佬驚嘆：中國AI已追上美國

去年12月DeepSeek-V3發布後，AI數據服務公司Scale AI創辦人Alexander Wang就發文表示，DeepSeek-V3是中國科技界帶給美國的苦澀教訓。「當美國休息時，中國（科技界）在工作，以更低的成本、更快的速度和更強的實力趕上。”

著名投資公司A16z的創始人馬克安德森1月24日發文稱，Deepseek-R1是他見過的最令人驚嘆、最令人印象深刻的突破之一，而且還是開源的，它是給世界的一份禮物。

1月24日，A16z合夥人、Mistral AI董事會成員Anjney Midha表示：“從史丹佛到麻省理工，DeepSeek-R1幾乎一夜之間成為美國頂尖大學研究人員的首選模型。”

對於中國AI為何能有如此快速的進展，諾獎得主、「AI教父」傑弗裡·辛頓在1月21日接受博主Curt Jaimungal專訪中表示，中國的STEM（科學、技術、工程、數學）教育比美國更好，擁有更多受過良好教育的人才，這將為AI的發展提供堅實的基礎。儘管美國試圖透過限制（如英偉達晶片）來減緩中國的發展，但這只會促使中國加速發展自己的技術，「他們可能會落後幾年，但最終會趕上」。

DeepSeek或徹底改變遊戲規則「大力出奇蹟」還有效嗎？

史丹佛大學和Epoch AI的研究人員去年年中發表了一項研究表明，到2027年，最大型的模型的訓練成本將超過10億美元。 Gartner預測，到2028年Google、Microsoft和AWS等超大規模企業僅在AI伺服器上的支出就將高達5,000億美元。

但DeepSeek完全不同，它的訓練成本並不昂貴。 Noah’s Arc資本管理公司表示，DeepSeek-V3模型有可能徹底改變訓練和推理領域的遊戲規則。

特別是在5000億美元的「星際之門」計畫公佈後，DeepSeek更讓人懷疑，巨額投入這種「大力出奇蹟」的辦法真是最有效的方法嗎？

美股大V「THE SHORT BEAR」1月24日在X上發文稱，DeepSeek給AI巨頭們帶來了痛苦時刻，投資者必須對此敲響警鐘。

他說：“如果擊敗OpenAI只需要5500萬美元，那麼這個行業的商業化會比很多人預想的要快很多。”

他還指出：“根據紅杉，美國AI公司每年必須產生約6000億美元收入來支付其AI硬體費用。現在看來，這種冒險行為變得越來越無利可圖。”

著名財經記者Holger Zschaepitz 1月25日表示，DeepSeek以極低的價格建立了一個突破性的AI模型，而且沒有使用尖端晶片，這讓人們質疑該行業數千億美元資本支出的效用。

有投資人甚至認為，美股晶片股的股價也會面臨挑戰。

投資人Geiger Capital表示，Deepseek和OpenAI一樣好，甚至更好，而且價格只有後者的3%…而美國公司卻投入了數千億美元。那麼……納斯達克會怎麼樣呢？

值得注意的是，DeepSeek-V3發表後，英偉達股價下跌了2%。而DeepSeek-R1引發海外大討論後，1月24日英偉達股價又大跌了3.12%。

外媒集體刷屏：給矽谷敲響警鐘

如果說DeepSeek-V3只是掀起了波瀾，那麼DeepSeek-R1則是引發了轟動。最近四天，國外媒體紛紛聚焦DeepSeek，並一致認為中國大模型的新進展為矽谷敲響了警鐘。

1月22日，美國媒體Business Insider報告稱，DeepSeek-R1模型秉承開放精神，完全開源，為美國AI玩家帶來了麻煩。開源的先進AI可能挑戰那些試圖透過出售技術賺取巨額利潤的公司。

1月24日，美國媒體CNBC推出了長達40分鐘的節目，邀請了Perplexity CEO Aravind Srinivas來分析為何DeepSeek會引發人們對美國在AI領域的全球領先地位是否正在縮小的擔憂。

英國《金融時報》1月25日報道稱，中國小型AI新創公司DeepSeek震驚矽谷。報道聚焦資源更豐富的美國AI公司能否捍衛自己的技術優勢。

報導引述加州大學柏克萊分校AI政策研究員Ritwik Gupta稱，DeepSeek最近發布的模型顯示「AI能力沒有護城河」。 Gupta補充說，中國的系統工程師人才庫比美國大得多，他們懂得如何充分利用運算資源來更便宜地訓練和運行模型。

WONGCW 網誌

記錄生活經驗與點滴

中國AI刷屏外媒DeepSeek或徹底改變遊戲規則

2025-01-27 Comments 0 Comment

相關

發表迴響取消回覆

2025 年 1 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

分享此文：

相關

發表迴響取消回覆