Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

DeepSeek致謝騰訊技術團隊:DeepEP的最佳化是一次「huge speedup」程式碼貢獻

DeepSeek致謝騰訊技術團隊:DeepEP的最佳化是一次「huge speedup」程式碼貢獻

2025-05-08 Comments 0 Comment

騰訊技術團隊針對DeepSeek開源的DeepEP通訊框架進行深度最佳化,使其在多種網路環境下均實現顯著效能提升。經測試,優化後的通訊框架效能在RoCE網路環境提升100%,IB網路環境提升30%,為企業進行AI大模型訓練提供更有效率的解決方案。該技術方案獲得了DeepSeek公開致謝,稱這是一次「huge speedup」程式碼貢獻。

自今年2月DeepSeek開源包含DeepEP在內的五大程式碼庫以來,該團隊便向業界展示如何利用有限的硬體資源實現接近萬卡叢集的效能。在這些技術中,DeepEP憑藉突破性的方法提升了300%的通訊效率,成功解決了MoE架構大模型對英偉達NCCL的依賴問題。但該技術在成本較低、適用面更廣的RoCE網路環境中表現不佳,限制了其在更廣泛場景的應用。這個痛點引發了開源社群的持續討論。

據悉,騰訊星脈網路團隊在DeepEP開源後便展開技術攻關,發現兩大關鍵瓶頸:一是對於雙埠網卡頻寬利用率不足,二是CPU控制面交互存在時延。

在騰訊的技術優化下,DeepEP不僅在RoCE網路實現效能翻倍,反哺到IB(InfiniBand)網路時更讓原有通訊效率再提升30%。

目前,該技術已全面開源,並成功應用於騰訊混元大模型等項目的訓練推理,在騰訊星脈與H20伺服器構建的高效能環境中,這套方案展現出出色的通用性。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
理想首款純電SUV 全新i8內裝間諜照曝光:熟悉的配方
NEXT
OpenAI計劃將「星門」AI計畫擴展到美國以外

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • NEO半導體將模仿快閃記憶體製造512GB記憶體採用3D X-DRAM結構進行堆疊 2025-05-22
  • 高合汽車或將復活:全新公司成立註冊資本超10億 2025-05-22
  • 電影《尋秦記》宣布2025賀歲檔上映古天樂等原班人馬回歸 2025-05-22
  • 2025年版Model 3歐洲NCAP測驗成績公佈:五星 2025-05-22
  • 彩虹-YH1000無人物流機首飛成功一口氣能飛1500公里 2025-05-22
  • 微軟正在開發Windows 11/Android跨裝置復原功能 2025-05-22
  • 全球TWS耳機出貨量最新排名:小米殺上第二首度突破900萬副 2025-05-22
  • 用印度程式設計師假扮AI的獨角獸宣告倒閉微軟亞馬遜都曾被坑 2025-05-22
  • 福特CEO驚嘆中國車企研發速度:只有傳統車廠一半時間 2025-05-22
  • 儘管創辦人面臨法律風險Telegram獲利仍躍升至5.4億美元 2025-05-22

熱門文章與頁面︰

  • 微軟員工再次擾亂Satya Nadella 的主題演講
  • Google製作了專門針對UI設計的AI開發工具
  • 您可以在Windows 11 24H2 中找回WordPad
  • ROG NUC 2025迷你遊戲PC上市:Ultra 9 275HX+RTX 5080首發24999元
  • 索泰展示全球最小RTX 5060 Ti 16GB主機機箱容量僅2.65公升
  • 半導體資本支出驟降代工巨頭擴張速度減緩
  • 一文看懂Google I/O 2025開發者大會: Android、Chrome、搜尋、Gemini
  • z-sms – 在線免費云短信臨時手機號接碼平台網頁版
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • 一汽豐田開卷電動車全新bZ5開啟預售:入門版價格不超13萬

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.