DeepSeek超越ChatGPT 登頂蘋果美國區免費APP下載排行榜

2025-01-27 Comments 0 Comment

Deepseek應用程式登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜，在美區下載榜上超越了ChatGPT。 Deepseek來自國產大模型公司深度求索，系量化巨擘幻方量化旗下大模型公司。 1月20日，該公司正式發表推理大模型DeepSeek-R1。一推出，DeepSeek-R1便憑藉其「物美價廉」的特性在海外開發者社群中引發了轟動。

蘋果美國區應用商店

蘋果APP Store中國區免費榜

作為開源模型，R1在數學、程式碼、自然語言推理等任務上的表現能夠比肩OpenAI o1模型正式版，並採用MIT授權協議，支援免費商用、任意修改和衍生開發等。目前，在國外大模型排名榜Chatbot Arena上，DeepSeek-R1的基準測試排名已升至全類別大模型第三，與OpenAI的ChatGPT-4o最新版並列，並在風格控制類模型（StyleCtrl）分類中與OpenAI的o1模型並列第一。

更令市場驚訝的是，根據DeepSeek介紹，R1的預訓練費用只有557.6萬美元，在2048塊英偉達H800 GPU（針對中國市場的低配版GPU）集群上運行55天完成，僅是OpenAI GPT-4o模型訓練成本的不到十分之一。 DeepSeek表示，R1在後訓練階段大規模使用了強化學習技術，在僅有極少標註資料的情況下，大幅提升了模型推理能力。此外，DeepSeek不僅將R1訓練技術全部公開，還蒸餾了6個小模型向社群開源，讓使用者可以藉此訓練其他模型。

英偉達高級研究科學家Jim Fan表示，DeepSeek-R1可能是「首個展示了RL（強化學習）飛輪可以發揮作用且能帶來持續增長的OSS（開源軟體）專案」。其中，「飛輪」用來形容AI系統中自我強化、正向循環的過程。 DeepSeek的論文顯示，不同於過去AI模型往往依賴監督微調（SFT，指AI模型透過已標註的資料進行訓練），R1完全由強化學習驅動，證明了直接強化學習是可行的。

Jim Fan寫道：「我們正處於一個奇特的時間線上，一家非美國公司正在實踐OpenAI最初的使命，即實現真正開放的前沿研究並讓所有人受益。這種情況簡直無法理解。最有娛樂性的結果卻是可能性最大的結果。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

WONGCW 網誌

記錄生活經驗與點滴

DeepSeek超越ChatGPT 登頂蘋果美國區免費APP下載排行榜

2025-01-27 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆