DeepSeek嚇壞美國矽谷Meta連夜組成四個研究小組專門破解
近一周,來自中國的深度求索(DeepSeek)全球爆紅,尤其讓美國矽谷極為震撼與恐慌。其最新發布的R1大模型不僅在性能上比肩甚至超越了OpenAI的o1,並完全開源,而且以對手3%的超低成本實現了這一突破。
近日,一篇在匿名平台teamblind上發布的文章遭瘋傳,有一位自稱是Meta員工稱公司內部因DeepSeek模型而進入恐慌模式,並提到DeepSeek-V3在基準測試中,已經讓(Meta推出的)Llama 4相形見絀,而更讓人難堪的是一家「僅用550萬美元訓練預算的中國公司」就做到這一點。
該文稱,Meta工程師正爭分奪秒分析DeepSeek,試圖複製其中的一切可能技術,而DeepSeek-R1的出現,也讓情況更加嚴峻。
另根據The Information爆料,Meta生成AI小組和基礎設施團隊的經理和工程師已開設了四個作戰室來學習DeepSeek的工作原理。
其中兩個動員的小組正在試圖了解High-Flyer如何降低訓練和運行DeepSeek的成本。第三個Meta研究小組正在試圖弄清楚High-Flyer可能使用哪些資料來訓練其模型。第四作戰室正在考慮基於DeepSeek模型屬性重構Meta模型的新技術。
AI科技新創公司Scale AI創辦人亞歷山大·王(Alexandr Wang)接受電視媒體公開採訪時表示,中國人工智慧公司DeepSeek的AI大模型效能大致與美國最好的模型相當。過去十年來,美國可能一直在人工智慧競賽中領先中國,但DeepSeek的AI大模型發布可能會「改變一切」。
Meta創辦人兼CEO祖克柏表示,DeepSeek非常先進,並認為中美之間的AI差距非常小。
祖克柏也表示,中國正在全力衝刺,如果將來有一個開源模型能被全世界廣泛使用,我們希望它是一個美國模型。