DeepSeek超越ChatGPT 登頂蘋果美國區免費APP下載排行榜
Deepseek應用程式登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。 Deepseek來自國產大模型公司深度求索,系量化巨擘幻方量化旗下大模型公司。 1月20日,該公司正式發表推理大模型DeepSeek-R1。一推出,DeepSeek-R1便憑藉其「物美價廉」的特性在海外開發者社群中引發了轟動。
蘋果美國區應用商店
蘋果APP Store中國區免費榜
作為開源模型,R1在數學、程式碼、自然語言推理等任務上的表現能夠比肩OpenAI o1模型正式版,並採用MIT授權協議,支援免費商用、任意修改和衍生開發等。目前,在國外大模型排名榜Chatbot Arena上,DeepSeek-R1的基準測試排名已升至全類別大模型第三,與OpenAI的ChatGPT-4o最新版並列,並在風格控制類模型(StyleCtrl)分類中與OpenAI的o1模型並列第一。
更令市場驚訝的是,根據DeepSeek介紹,R1的預訓練費用只有557.6萬美元,在2048塊英偉達H800 GPU(針對中國市場的低配版GPU)集群上運行55天完成,僅是OpenAI GPT-4o模型訓練成本的不到十分之一。 DeepSeek表示,R1在後訓練階段大規模使用了強化學習技術,在僅有極少標註資料的情況下,大幅提升了模型推理能力。此外,DeepSeek不僅將R1訓練技術全部公開,還蒸餾了6個小模型向社群開源,讓使用者可以藉此訓練其他模型。
英偉達高級研究科學家Jim Fan表示,DeepSeek-R1可能是「首個展示了RL(強化學習)飛輪可以發揮作用且能帶來持續增長的OSS(開源軟體)專案」。其中,「飛輪」用來形容AI系統中自我強化、正向循環的過程。 DeepSeek的論文顯示,不同於過去AI模型往往依賴監督微調(SFT,指AI模型透過已標註的資料進行訓練),R1完全由強化學習驅動,證明了直接強化學習是可行的。
Jim Fan寫道:「我們正處於一個奇特的時間線上,一家非美國公司正在實踐OpenAI最初的使命,即實現真正開放的前沿研究並讓所有人受益。這種情況簡直無法理解。最有娛樂性的結果卻是可能性最大的結果。