中國大模型DeepSeek正在讓矽谷陷入恐慌

2025-01-25 Comments 0 Comment

CNBC發文稱，DeepSeek R1，因其性能超越美國頂尖同類模型，且構建成本更低、使用的晶片算力也較弱，引發了矽谷的恐慌。 CNBC表示，DeepSeek R1使用英偉達性能稍遜的H800晶片，僅用兩個月時間、不到600萬美元就構建完成了這個模型。

在一系列第三方基準測試中，從複雜問題解決到數學和編碼等方面，DeepSeek的模型在準確性上超越了Meta的Llama 3.1、OpenAI的GPT-4o以及Anthropic的Claude Sonnet 3.5。

這引發了美方擔憂：美國在人工智慧領域的全球領先地位是否正在縮小？大型科技公司在建構人工智慧模型和資料中心的巨額投入是否值得？

標竿資本合夥人切坦・普塔貢塔表示：「DeepSeek採用一種名為知識蒸餾的過程，來打造一個非常出色的大型模型。基本上，就是利用一個非常大的模型，幫助小模型在你期望的領域變得聰明。

微軟執行長薩蒂亞・納德拉週三在瑞士達沃斯世界經濟論壇上表示：「看到DeepSeek的新模型，真的令人印象非常深刻。他們切實有效地開發出了一個開源模型，在推理計算方面表現出色，且超級計算效率極高。

「我們必須非常、非常認真地對待中國的這些進展，」納德拉說。

相關

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。