夜襲Open AI DeepSeek開源最強推理模型R1再震歐美同行

2025-01-22 Comments 0 Comment

對標OpenAI o1 正式版的國產大模型來了！ 1 月20 日晚，DeepSeek（深度求索）公司發布推理模型DeepSeek-R1 正式版，同步開源模型權重，並允許用戶利用模型輸出、透過模型蒸餾等方式訓練其他模型。網友熱評：這，才是真正的OpenAI 。能力相當於一個月200 美元的ChatGPT o1 版本，卻完全免費。

不止如此，DeepSeek 一同開源的還有“技術報告”，那些訓練R1 時踩過的坑、做過的事通通講給你聽，只為鋪平AGI 的路。

第一時間閱讀這份技術報告後，英偉達高級研究科學家Jim Fan 帶來了新鮮解讀，值得我們大聲齊讀:

「我們生活在這樣一個時代：由非美國公司保持OpenAI 最初的使命——做真正開放的前沿研究、為所有人賦能。這似乎講不通，但戲劇性的往往最有可能發生。

DeepSeek-R1 不僅開源了大量模型，還洩漏了所有訓練秘密。他們可能是第一個顯示RL（強化學習）飛輪發揮主要作用、持續成長的OSS 專案。

影響可以透過『內部實現了ASI』或『草莓計畫』等神話名稱來實現。也可以透過簡單地轉儲原始演算法和matplotlib 學習曲線來產生影響。」

中國公司DeepSeek，正在實現追趕OpenAI 的使命。

DeepSeek-R1：

實力派選擇“秀肌肉”

「DeepSeek-R1」的發布，擺明了是：有實力所以明晃晃地秀肌肉！

這首先體現在它不整期貨那一套，而是「發布即上線」，現在，你就可以在DeepSeek 官網與App 體驗最新的推理模型DeepSeek-R1，隨便體驗隨便用，免費。

登入DeepSeek 官網或官方App，開啟「深度思考」模式，即可呼叫最新版DeepSeek-R1 完成各類推理任務。｜圖片來源：DeepSeek

DeepSeek-R1 也同步上線了API，對使用者開放思維鏈輸出，透過設定model=’deepseek-reasoner’ 即可呼叫。

值得注意的是DeepSeek-R1 API 服務定價為每百萬輸入tokens 1 元（快取命中）/ 4 元（快取未命中），每百萬輸出tokens 16 元。看下面這圖你會有更直接的體感，輸出API 價格只有OpenAI o1 的3%。低價背後，顯然仍是秀肌肉，價格實力展現了技術實力——從AI Infra 層面降本的技術能力。

圖中深藍色柱子代表DeepSeek-R1，剩下的灰色、淺藍、青淺灰分別是OpenAI o1 不同版本的價格。｜來源：DeepSeek

第三波「秀肌肉」體現在開源開放。 DeepSeek-R1 開源模型權重幾乎是選擇了最開放的許可證和用戶協議，開源License 統一使用MIT，產品協議明確可“模型蒸餾”，主打一個讓大家多多來基於它做二次開發、集成。 DeepSeek 甚至主動給大家示範引導將R1 作為教師模型來蒸餾出一個更小但仍有實力的模型，「透過DeepSeek-R1 的輸出，蒸餾了6 個小模型開源給社區，其中32B 和70B 模型在多項能力上實現了對標OpenAI o1-mini 的效果」。

事實上，模型開源選擇不同的License 背後大有學問，直接反映不同模型廠商的開放程度，更反映開源背後的目的和策略。例如Llama、Qwen、GPT-2 等模型不只開放權重，還開放了模型訓練的原始碼，這可能是為了追求衍生模型的繁榮。而DeepSeek-R1 選擇只開放權重，但換成了標準化、寬鬆的MIT License，更多還是為了讓更多開發者能用起來，感受DeepSeek-R1 的能力。

我們再來透過幾個主流測驗基準來感受一下DeepSeek-R1 的實力。「表現對齊OpenAI-o1 正式版DeepSeek-R1 在後訓練階段大規模使用了強化學習技術，在僅有極少標註資料的情況下，極大提升了模型推理能力。在數學、程式碼、自然語言推理等任務上，性能比肩OpenAI o1 正式版。

圖片來源：DeepSeek

對於DeepSeek-R1 帶來的直觀感受，矽基流動聯合創始人楊攀表示，不止模型能力和性能出色，最近兩個模型(R1 和V3) 在訓練技術和模型底層架構上都做了領先全球的創新，而且其論文開放程度也震驚了業界。

在一併公開的模型技術報告中，DeepSeek 將「DeepSeek-R1」訓練技術全部公開，「旨在促進技術社群的充分交流與創新協作」。

根據技術報告，矽基流動創辦人&CEO 袁進輝稱，DeepSeek-R1 是無人區的探索與發現。｜來源：即刻

對於開源模型加技術報告，開源社聯合創始人林旅強此前向極客公園表示，開源是最好的「秀技術肌肉」的方式，同時「有的開源模型只開源、不講他是怎麼做的，但合乎大家期待的開源模型是要搭配技術報告，等於是發paper 了。他們是很透明地把他的技術報告拿來公開，即使一定程度還是會摀著掖著，但是已經是開得比較有態度。以開源的方式，是有學術追求的。

如果DeepSeek 的目標是真正達到AGI，就不斷需要把踩過的坑、做過的事情開放出來，讓大家少走一點彎路，開放才能讓整個行業更快達到AGI，他補充道。

最後，我們來隨機看一些使用者實測評價（截圖來源：X.com）：

Twitter 用戶盛讚R1 的實力｜圖片來源：X

DeepSeek，還有什麼

驚喜是我們不知道的？！

儘管昨晚DeepSeek-R1 的發布引發了「這才是Open AI 吧」「東方的OpenAI」等一片稱讚。但DeepSeek 強得非常紮實、全面。

去年在2024 年11 月20 日發布DeepSeek-R1-Lite 預覽版時，美國著名半導體與AI 諮詢機構Semianalysis 創始人Dylan Patel 就坐不住了，第一時間下場「提醒」大家：他們有5 萬張H100 GPU ！請不要以為他們只有1 萬張A100！

因為眾所周知的原因，這大機率不是事實，卻能反映DeepSeek-R1-Lite 的強悍到讓產業緊張。

一個月後，DeepSeek 上線並同步開源了媲美GPT-4o 和Claude 3.5 Sonnet 的模型“DeepSeek-V3”，並附上了詳盡的技術報告。這一次，幾乎驚動了整個矽谷AI圈。卡神（OpenAI 創始團隊、前Tesla AI 總監Andrej Karpathy）、Alexandr Wang（Scale.ai 創始人）、田徑棟（Meta AI 科學家）、賈揚清（Lepton AI 創始人）……人均一句「難以置信」。就連Sam Altman 都忍不住出來酸一把「復刻已經被驗證過奏效的東西是容易的」。

DeepSeek-V3 發布後，Sam Altman 疑似喊話DeepSeek。｜截圖來源：X.com

隨著模型性能逐漸走向全球第一梯隊，DeepSeek 也迎來了新的發展機會。

過去一年半，DeepSeek 專注於模型和研究，但從今年開始，DeepSeek 著手做應用了。

2025 年1 月15 日，DeepSeek 推出行動端AI 助理「DeepSeek」App。目前看，DeepSeek App 跟網頁版功能一致，主要有兩個功能：聯網搜尋和深度思考，主打一個簡潔，聊天記錄也會同步顯示在手機端和網頁端，尚未針對行動端進行特定功能的打磨，也沒有市面上AI 助手類App 豐富、fancy 的功能，更像是一個能讓你在手機上體驗DeepSeek 最新模型的入口。

DeepSeek App 展示圖｜來源：Apple Store

對此，一位投資人向極客公園解釋DeepSeek 開始做應用背後可能的策略轉向：「前期DeepSeek 靠自己的算力優勢積累出了模型技術的領先度。後期要補數據，發App 是補數據的手段之一。

同時，有了DeepSeek-R1 和其他模態、類型越來越好的模型，可以期待未來DeepSeek 在例如程式碼模型/應用裡有更激進的表現，驚喜才剛開始。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

WONGCW 網誌

記錄生活經驗與點滴

夜襲Open AI DeepSeek開源最強推理模型R1再震歐美同行

2025-01-22 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆