Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

全網都在等梁文鋒DeepSeek R2發布倒數計時?

全網都在等梁文鋒DeepSeek R2發布倒數計時?

2025-04-29 Comments 0 Comment

五月將至,中美科技巨頭或將迎來新一輪巔峰對決。先是在4月中旬,OpenAI一口氣發布了GPT-4.1 o3、o4 mini系列模型;谷歌則拿出了Gemini 2.5 Flash Preview,一個混合推理模型;與谷歌同一天,豆包在杭州巡展中正式發布了1.5·深度思考模型,在多模態上展現了更強的實力。鳳凰網科技從業界人士處了解到,阿里的下一代大模型Qwen3也將於本月內發布。

混戰之下,那股「神秘的東方力量」似乎也在悄悄準備新的發行。

在敏感的神經之下,一點蛛絲馬跡都會放大。昨日,全球最大AI開源社群Hugging Face執行長Clément Delangue在社群平台上發表了一條耐人尋味的動態。這條動態僅由三個眼睛的表情符號構成,並附上了DeepSeek團隊在Hugging Face平台的官方資源庫入口。

這群充滿懸念的組合引發科技圈熱議,業界普遍推測DeepSeek R2模型已進入發布倒數計時。

DeepSeek R2發布已進入倒數計時?

近半個月來,有關「DeepSeek全新模型R2即將問世」的傳聞持續發酵。除HuggingFace執行長Clément Delangue發布動態外,玩家@deedydas也在社群平台貼出了所謂DeepSeek-R2大機型的詳細技術參數。

1.擁有1.2兆參數,活躍參數為780億,採用混合MoE架構

2.成本比GPT-4o便宜97.3%(輸入每百萬次0.07美元,輸出每百萬次0.27美元)

3.使用了5.2PB的訓練數據,在C-Eval2.0測試中取得了89.7%的得分

4.視覺能力更強,在COCO測試集上達到了92.4%

鳳凰網科技就以上訊息向DeepSeek方面發去詢問,對方表示不回應。有接近DeepSeek的知情人士對鳳凰網科技表示,目前網路盛傳的消息,真實性含量非常低。

但結合DeepSeek的產品迭代規律與產業鏈動態,其五月可望發布新品的傳聞卻並非空穴來風。

根據《中國企業家》報道,過去DeepSeek創辦人梁文鋒率領的AI團隊始終保持著與國際巨頭同頻的產品迭代節奏-2024年9月推出V2.5版本,12月發布V3基礎架構,隔年3月即升級至V3-0324版本,形成每季重大更新的開發範式。這種緊扣產業脈動的研發策略,使得業界普遍預測其下一代主力模型R2或將延​​續「五一檔」發布傳統。

路透社先前披露的研發活動向印證了這種猜測:DeepSeek正在加快R1模型的後續產品R2的研發和發布進程,原計劃在5月初發布,但公司現在希望能夠儘早推出。

更值得關注的是技術演進方向,此前也有業內人士推測,DeepSeek-R2模型預計將在代碼生成和除英語外的更多語種推理能力方面有不小的提升。

這項預期並非無中生有——今年三月發布的V3-0324版本已展現驚人實力,根據Artificial Analysis Intelligence Index最新評測,該模型已成為得分最高的非推理模型。在基準測試中力壓Google Gemini 2.0 Pro、Anthropic Claude 3.7Sonnet及Meta Llama 3.3 70B等頂尖模型。

這種技術累積與迭代速度,使得R2尚未發布便已承載全球AI界的較高期待。無論前述傳聞最終是否成真,可以預見的是,當這款新模型正式亮相時,或將改寫新一輪全球演算法與算力生態格局。

該梁文鋒出場了

在國產AI大模型賽道暗潮湧動的當下,DeepSeek創辦人梁文鋒的每一步都走得很穩。他曾說過:“中國也要逐步成為創新貢獻者,而不是一直搭便車。”

儘管近期DeepSeek在公眾視野中保持低調,但梁文鋒一直在向著DeepSeek的核心使命努力,那就是探索通用人工智慧的本質。

多位接觸過DeepSeek團隊的人士都認為,梁文鋒的志向不在服務好用戶和做好產品,而是直指終極AGI。這讓他在早年間試探性接觸資方時,優先排除了有退出顧慮的絕大多數機構,甚至主要依託於自有資金,「梁文鋒也有這個資本實力」。

一位在早期就接觸過DeepSeek的機構對鳳凰網科技表示,梁文峰很早就發現Chatbot產品的可替代性很強,「現在的產品都沒有粘性,所以只要技術強隨時可以把用戶搶過來」。 DeepSeek R1的發布也的確證實了這個觀點。

DeepSeek的最後一次模型更新發布是在今年3月,發布了V3-0324版本,也被看作是R2的基礎模型,已針對性能、用戶體驗和實用性進行了優化,透過6850億參數的MoE架構升級,程式碼能力顯著增強,又一次深度影響了全球市場。

因而5月或將發布的旗艦模型R2,也被視為影響全球AI格局的關鍵落子。

特別需要說明的是,這項技術攻堅的窗口期,恰逢國產晶片產業劇變。美國對英偉達H20晶片的出口禁令,直接斬斷中國AI企業取得高階GPU的主通路,倒逼華為昇騰910C、寒武紀MLUarch04等國產晶片加速填補市場空白。

清程極智的CEO湯雄超曾經告訴鳳凰網科技,作為目前開源市場所能用到的最好模型,DeepSeek和最難取得的晶片一度是深度捆綁的。如此前DeepSeek開源週所呈現的,其推出了一系列針對英偉達H卡的算力優化方案。

這讓梁文鋒在早年間曾表達:“我們真正的挑戰從來不是資金,而是高端晶片的出口禁令。”

但禁令也從未真正束縛其技術野心,「英偉達的GPU沒有什麼神秘之處,但要趕上他們,就必須重建團隊、付出時間和成本,追趕下一代技術——這才是真正的護城河。」梁文鋒表示。

多位國產算力產業從業人士也對鳳凰網科技表示,當前國產生態已在加速迭代中。

本次DeepSeek新一代旗艦模型發布,也或將存在另一變量,即在推理側深度適配國產算力。

目前,千行百業都展現出了旺盛的大模型部署需求,但正如李彥宏所言,DeepSeek最大的問題就是又慢又不穩定,如何才能獲取到穩定的、便宜的滿血版DeepSeek,這不僅僅是行業需要解決的問題,更需要DeepSeek官方加入其中。

值得一提的是,鳳凰網科技從業界人士那裡了解到,DeepSeek已經正在和一些國產晶片合作,「國產晶片中有些頭部的,實際上已經在和DeepSeek合作了」。

但對於合作的進展,以及R2可能滿足的情況,目前尚不能得知更多細節。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
出口管制迫使NVIDIA探索其他選擇傳公司未來有計畫剝離中國業務
NEXT
豐田章男據悉計畫收購豐田工業加強集團業務掌控引發公司治理擔憂

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2025 年 4 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
282930  
« 3 月   5 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • NEO半導體將模仿快閃記憶體製造512GB記憶體採用3D X-DRAM結構進行堆疊 2025-05-22
  • 高合汽車或將復活:全新公司成立註冊資本超10億 2025-05-22
  • 電影《尋秦記》宣布2025賀歲檔上映古天樂等原班人馬回歸 2025-05-22
  • 2025年版Model 3歐洲NCAP測驗成績公佈:五星 2025-05-22
  • 彩虹-YH1000無人物流機首飛成功一口氣能飛1500公里 2025-05-22
  • 微軟正在開發Windows 11/Android跨裝置復原功能 2025-05-22
  • 全球TWS耳機出貨量最新排名:小米殺上第二首度突破900萬副 2025-05-22
  • 用印度程式設計師假扮AI的獨角獸宣告倒閉微軟亞馬遜都曾被坑 2025-05-22
  • 福特CEO驚嘆中國車企研發速度:只有傳統車廠一半時間 2025-05-22
  • 儘管創辦人面臨法律風險Telegram獲利仍躍升至5.4億美元 2025-05-22

熱門文章與頁面︰

  • 微軟員工再次擾亂Satya Nadella 的主題演講
  • 您可以在Windows 11 24H2 中找回WordPad
  • 索泰展示全球最小RTX 5060 Ti 16GB主機機箱容量僅2.65公升
  • 一汽豐田開卷電動車全新bZ5開啟預售:入門版價格不超13萬
  • 氮化鎵充電器如何設計看完這12款拆解秒懂
  • ROG NUC 2025迷你遊戲PC上市:Ultra 9 275HX+RTX 5080首發24999元
  • 蘋果iPhone 16 和iPhone 16 Pro Max 原版桌布現已下載
  • Office 2019部署自定義安裝教程
  • z-sms – 在線免費云短信臨時手機號接碼平台網頁版
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.