中國大模型DeepSeek正在讓矽谷陷入恐慌
CNBC發文稱,DeepSeek R1,因其性能超越美國頂尖同類模型,且構建成本更低、使用的晶片算力也較弱,引發了矽谷的恐慌。 CNBC表示,DeepSeek R1使用英偉達性能稍遜的H800晶片,僅用兩個月時間、不到600萬美元就構建完成了這個模型。
在一系列第三方基準測試中,從複雜問題解決到數學和編碼等方面,DeepSeek的模型在準確性上超越了Meta的Llama 3.1、OpenAI的GPT-4o以及Anthropic的Claude Sonnet 3.5。
這引發了美方擔憂:美國在人工智慧領域的全球領先地位是否正在縮小?大型科技公司在建構人工智慧模型和資料中心的巨額投入是否值得?
標竿資本合夥人切坦・普塔貢塔表示:「DeepSeek採用一種名為知識蒸餾的過程,來打造一個非常出色的大型模型。基本上,就是利用一個非常大的模型,幫助小模型在你期望的領域變得聰明。
微軟執行長薩蒂亞・納德拉週三在瑞士達沃斯世界經濟論壇上表示:「看到DeepSeek的新模型,真的令人印象非常深刻。他們切實有效地開發出了一個開源模型,在推理計算方面表現出色,且超級計算效率極高。
「我們必須非常、非常認真地對待中國的這些進展,」納德拉說。