Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

DeepSeek深夜發布多模態大模型影像性能跑分力壓OpenAI競品

DeepSeek深夜發布多模態大模型影像性能跑分力壓OpenAI競品

2025-01-28 Comments 0 Comment

就在華爾街週一緊張評估“DeepSeek風暴”之際,這家中國公司再次甩出新品:在圖像生成基準測試中超越OpenAI“文生圖”模型DALL-E 3的多模態大模型Janus-Pro,同樣也是開源的。

除夕凌晨鐘聲敲響前不久,DeepSeek工程師們在「抱抱臉」平台上傳了Janus Pro 7B和1.5B模型。這倆模型是去年10月發布的Janus模型的升級。

15億和70億的參數量,意味著這兩個模型具備在消費級電腦上本地運行的潛力。與R1一樣,Janus Pro採用MIT許可證,在商用方面沒有限制。

根據DeepSeek介紹,Janus-Pro是一個新穎的自回歸框架,統一了多模態理解和生成。透過將視覺編碼分離為「理解」和「生成」兩條路徑,同時仍採用單一的Transformer架構進行處理,解決了以往方法的局限性。這種分離不僅緩解了視覺編碼器在理解和生成中的角色衝突,也提升了框架的靈活性。

從報告給出的「跑分」數據來看,在部分文生圖基準測試中,Janus-Pro 70億參數模型表現優於OpenAI的DALL-E 3、Stability AI的Stable Diffusion 3-Meduim等。

(來源:技術報告)
(來源:技術報告)

雖然DALL-E 3是OpenAI在2023年發布的“舊模型”,同時Janus Pro目前只能分析和產生規格較小的圖像(384 x 384)。 DeepSeek在如此緊湊的模型尺寸中依然展現了令人印象深刻的性能。

技術報告顯示,在視覺生成方面,Janus-Pro透過添加7,200萬張高品質合成影像,使得在統一預訓練階段真實資料與合成資料的比例達到1:1,實現「更具視覺吸引力和穩定性的圖像輸出」。在多模態理解的訓練資料方面,新模型參考了DeepSeek VL2並增加了大約9000萬個樣本。

作為一個多模態模型,Janus-Pro不僅可以“文生圖”,同樣也能對圖片進行描述,識別地標景點(例如杭州的西湖),識別圖像中的文字,並能對圖片中的知識(例如下圖中的「貓和老鼠」蛋糕)進行介紹。

公司也在報告中,給出了更多圖像生成的案例。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
DeepSeek多模態Janus-Pro-7B模型發布並開源擊敗OpenAl DALL-E3
NEXT
蒸發近6000億美元!英偉達創美股單日市值最大損失歷史紀錄

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
赫思醫美
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2025 年 1 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 12 月   2 月 »

分類

  • 網站公告
  • 赫思醫美
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 植髮手術怎麼選?從剃髮與不剃髮的區別找到最適合方案 2025-07-09
  • 把葉綠體「偷」到自己體內這些動物曬太陽就能活 2025-07-09
  • 茶顏悅色進軍美國:不賣奶茶專攻茶週邊零食 2025-07-09
  • 全球最大的3D列印學校建築計畫正在卡達建設中 2025-07-09
  • 分析師呼籲特斯拉董事會限制馬斯克結束“肥皂劇” 2025-07-09
  • Switch2在日首月熱銷140萬台《瑪利歐賽車:世界》登頂軟體榜 2025-07-09
  • 全新速騰L正式下線顏值飆升 2025-07-09
  • 多人收到河北文旅千條簡訊轟炸手機流量被限速、佔用數十GB儲存空間 2025-07-09
  • 全球最高遺產稅壓頂三星家族拋售梨泰院豪宅賺了146億 2025-07-09
  • 石破茂:美國造的尺寸大、油耗高的汽車在日本沒有市場 2025-07-09

熱門文章與頁面︰

  • 無3C行動電源禁止登機一文看懂到底什麼是3C認證、如何分辨真偽
  • 您可以在Windows 11 24H2 中找回WordPad
  • Photon Matrix:針對蚊子的“防空系統”
  • YouTube By Click 2.2.86(含:註冊機序列號)
  • 植髮手術怎麼選?從剃髮與不剃髮的區別找到最適合方案
  • CCleaner全家桶激活密鑰
  • 你的耳機可以被偷聽20餘款音訊設備曝出漏洞:Sony、Bose、JBL等淪陷
  • Chrome開啟硬體加速, 顯示顏色變淡
  • 日本川崎重工確認開發氫能飛機部件計劃2040年投用
  • 美國力推車聯網(V2X)技術以降低交通事故率

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

赫思醫美

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.