英特爾前CEO已在其新創公司Gloo使用DeepSeek 而不是OpenAI
DeepSeek 的新開源AI 推理模型R1 引發了NVIDIA 股票的拋售,並使其消費者應用程式飆升至應用程式商店的榜首。上個月,DeepSeek 表示,它使用一個擁有約2000 個NVIDIA H800 GPU 的資料中心,在短短兩個月內訓練了一個模型,成本僅550 萬美元。
上週,它發表了一篇論文,表明其最新模型的性能與世界上最先進的推理模型相匹配。這些模型正在資料中心進行訓練,這些資料中心花費數十億美元購買NVIDIA 更快、非常昂貴的AI 晶片。
整個科技產業對DeepSeek 的高性能、低成本模型的反應非常激烈。例如,Pat Gelsinger 興高采烈地在X 上發文說:“謝謝DeepSeek 團隊。”
Gelsinger最近剛卸任英特爾執行長一職,他的本職工作是一名硬體工程師,目前擔任自己的IPO 新創公司Gloo 的董事長,Gloo 是一家面向教會的資訊和互動平台。他在英特爾工作了四年,並試圖用英特爾的替代AI GPU Gaudi 3 AI 追趕英偉達,去年12 月離職。
Gelsinger寫道,DeepSeek 應該提醒科技業最重要的三個教訓:更低的成本意味著更廣泛的採用;在約束下,創造力才能蓬勃發展;「開放才是主流,DeepSeek 將幫助重置日益封閉的基礎AI 模型工作世界,」他寫道。 OpenAI 和Anthropic 都是閉源的。
Gelsinger表示,R1 非常令人印象深刻,Gloo 已經決定不採用OpenAI 並為其付費。 Gloo 正在建造一項名為Kallm 的AI 服務,該服務將提供聊天機器人和其他服務。
「Gloo工程師今天正在運行R1,」他說。 “他們本可以運行o1——好吧,他們只能通過API 訪問o1。”
相反,兩週後,Gloo 預計將從頭開始重建Kallm,「使用我們自己的完全開源的基礎模型,」他說。 “這令人興奮。”
他認為DeepSeek 將使AI 變得如此實惠,好的AI 將無處不在。 「我希望我的Oura Ring 中有更好的AI。我希望我的助聽器中有更好的AI。我希望我的手機中有更多AI。我希望我的嵌入式設備中有更好的AI ,例如我的電動車中的語音識別,」他說。
Gelsinger 的高興反應可能與其他人的反應不一致,他們不太高興推理基礎模型現在有了性能更高、更實惠的挑戰者。 AI的訓練價格一直在上漲,而不是下降。
其他人的反應是暗示DeepSeek 一定是以某種方式捏造了它的數字,訓練成本一定更高。有些人認為,由於美國對中國的AI 晶片出口限制,它不能說自己用什麼方式獲得了高階晶片。其他人則在它的性能上挑毛病,發現其他模型表現更好的地方。還有一些人認為,OpenAI 的下一個模型o3 在發佈時將遠遠超過R1,現狀將得到修復。
Gelsinger 對此不屑一顧。 「鑑於大部分工作都是在中國完成的,你永遠不用指望有完全的透明度,」他說。 “但儘管如此,所有證據表明,他們的訓練成本比o1 便宜10 到50 倍。”
DeepSeek 證明,人工智慧可以「透過工程創造力,而不是投入更多的硬體能力和運算資源來推動發展。所以這很令人興奮,」他說。
至於這是一家中國開發商,以及對隱私和審查制度的擔憂,Gelsinger 搖了搖頭。他說:“中國人提醒我們開放生態系統的力量,對我們的社會、對西方世界來說,可能有點尷尬。”