Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

真假難辨!谷歌發布最強文生圖大模型Imagen2

真假難辨!谷歌發布最強文生圖大模型Imagen2

2023-12-15 Comments 0 Comment

谷歌剛剛發布了其最強大的文生圖大模型 Imagen 2,可提供與用戶提示詞緊密結合且一致的高品質、逼真的圖像輸出。它可以透過使用訓練資料的自然分佈來產生更逼真的影像,而不是採用預先編程的風格。

谷歌的增強模型 Imagen 2 是利用谷歌旗艦人工智慧實驗室 Google DeepMind 的技術開發的,該模型在 5 月的科技巨頭 I/O 大會上悄悄推出了預覽版。谷歌聲稱,與第一代 Imagen 相比,它在圖像品質方面「顯著」提高,並引入了新功能,包括渲染文字和 Logo 的能力。

谷歌雲端執行長托馬斯·庫里安(Thomas Kurian)在周二的新聞發布會上表示,“如果你想創建帶有文字疊加的圖像——例如廣告——你可以做到。”

Google生成媒體產品主管 Vishy Tirumalasetty 表示,

“Imagen 2 可以產生……徽章、字母標記和抽象徽標……[並且]能夠將這些徽標覆蓋到產品、服裝、名片和其他表面上。”

由於“新穎的訓練和建模技術”,Imagen 2 還可以理解更具描述性的長格式提示,並對有關圖像中元素的問題提供“詳細答案”。 Google表示,這些技術也增強了 Imagen 2 的多語言理解能力——允許模型將一種語言的提示翻譯成另一種語言的輸出(例如 Logo)。

Imagen 2 利用 SynthID(DeepMind 開發的一種方法)將隱形浮水印應用到其創建的影像上。當然,偵測這些浮水印(Google聲稱這些浮水印能夠適應影像編輯,包括壓縮、濾鏡和色彩調整)需要Google提供的工具,而第三方無法使用該工具。

目前開發人員和Google雲端客戶已經可以體驗 Imagen 2 的強大:

https://cloud.google.com/blog/products/ai-machine-learning/imagen-2-on-vertex-ai-is-now-generally-available

影像逼真程度達到新高度

看下圖,你能一眼猜到是 AI 生成的嗎?

提示詞:一張 32 歲女性在叢林中的照片,她是一位嶄露頭角的自然資源保護主義者; 運動型短捲髮,笑容溫暖

提示詞:深藍色背景上的水母

提示詞:一幅小畫布油畫,顯示案板上的橘子。光線穿過橘色部分,在切菜板的一部分上投射出橘色光。背景中有一塊藍色和白色的布。焦散、反射光、富有表現力的筆觸

對圖像提示詞的理解達到新的高度

文生圖模型學習根據訓練資料集的圖像和文字說明中​​的詳細資訊產生與使用者提示相符的圖像。但對於每個影像和蚊子說明,這些配對的細節品質和準確性可能會有很大差異。

為了幫助創建更高品質、更準確的圖像,更好地符合用戶的提示,谷歌在Imagen 2 訓練資料集中的圖像說明文字中添加了進一步的描述,幫助Imagen 2 學習不同的文字說明樣式並進行概括,以更好地理解廣泛的用戶提示。

這些增強的圖像-文字說明配對有助於 Imagen 2 更好地理解圖像和文字之間的關係,從而增強對上下文和細微差別的理解。

以下是 Imagen 2 快速理解的範例:

1. AI 生成油畫圖像:

提示詞:「溪水輕柔地流淌,鳥兒重新唱出它們的音符,它們混合的音樂在空中飄蕩。」(菲利斯·惠特利的《晚間讚美詩》)

2. 人工智慧生成水下場景彩繪影像

提示詞:「考慮大海的微妙; 其中最可怕的生物如何在水下滑行,大部分時間是不可見的,並且危險地隱藏在最美麗的蔚藍色調下。」(赫爾曼·梅爾維爾的《白鯨》)

3. 人工智慧生成逼真的歌唱知更鳥圖像

提示詞:「知更鳥從搖曳的常春藤叢中飛到了牆頂上,張開喙,唱起了響亮、可愛的顫音,​​只是為了炫耀。世界上沒有什麼比知更鳥炫耀時更可愛了——而且它們幾乎總是這樣做。」(弗朗西斯·霍奇森·伯內特的《秘密花園》)

更真實的圖像生成

Imagen 2 的資料集和模型進步在文字轉圖像工具經常難以解決的許多領域提供了改進,包括渲染逼真的手和人臉以及保持圖像免受分散注意力的視覺偽影。

Imagen 2 產生逼真的手和人臉的範例

谷歌根據人類對良好照明、取景、曝光、清晰度等品質的偏好,訓練了專門的影像美學模型。每張圖像都會獲得一個美觀評分,這有助於調節 Imagen 2,使其訓練資料集中的圖像具有更多權重,以符合人類喜歡的品質。該技術提高了 Imagen 2 生成更高品質影像的能力。

AI 使用提示「花」產生的圖像,美學分數較低(左)到較高分數(右)

流體式調理

Imagen 2 以擴散為基礎的技術提供了高度的靈活性,使得控制和調整影像的風格變得更加容易。透過提供參考風格圖像與文字提示相結合,我們可以調節 Imagen 2 以產生遵循相同風格的新圖像。

視覺化顯示 Imagen 2 如何透過在文字提示旁邊使用參考圖像來更輕鬆地控制輸出樣式。

進階修圖功能

Imagen 2 也支援「inpainting」和「outpainting」等影像編輯功能。透過提供參考影像和影像遮罩,使用者可以使用稱為修復的技術直接在原始影像中產生新內容,或透過修復將原始影像擴展到其邊界之外。這項技術計劃在新的一年用於谷歌雲端的 Vertex AI。

Imagen 2 可以透過 inpainting 擴圖功能直接在原始影像中產生新內容。

Imagen 2 可以透過 outpainting 將原始影像擴展到其邊界之外。

參考資料:

https://deepmind.google/technologies/imagen-2/

Google debuts Imagen 2 with text and logo generation

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
科學雜誌公佈年度十大突破:「減肥神藥」名列榜首
NEXT
Mondoze New VPS

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2023 年 12 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 11 月   1 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 瑞典立法禁止付費購買線上性表演內容 2025-05-21
  • 《要塞英雄》重返美國App Store 2025-05-21
  • Google 開始對Android 16 新外觀展開Beta 測試 2025-05-21
  • 馬斯克表示特斯拉的自動駕駛測試將在奧斯汀「最安全」的地區進行 2025-05-21
  • 最後程序走完美國對東南亞四國太陽能設備徵收最高3521%的關稅成定局 2025-05-21
  • 伊隆馬斯克稱特斯拉和xAI預計將繼續從英偉達和AMD購買晶片 2025-05-21
  • 一文看懂Google I/O 2025開發者大會: Android、Chrome、搜尋、Gemini 2025-05-21
  • 馬斯克確認特斯拉計畫6月推出自動駕駛計程車 2025-05-21
  • NASA毅力號火星車在日出前拍攝到火衛二在天際閃耀的景象 2025-05-21
  • Google在Pixel 9 Pro上展示Project Astra:可代表使用者行動的AI助手 2025-05-21

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • 微軟員工再次擾亂Satya Nadella 的主題演講
  • ROG NUC 2025迷你遊戲PC上市:Ultra 9 275HX+RTX 5080首發24999元
  • Red Hat Enterprise Linux 10 正式發布
  • Autodesk AutoCAD 2020.1 正式版-簡體中文/繁體中文/英文
  • 惠普收購Autonomy世紀詐欺案主謀被判無罪
  • 華為nova 14、MateBook Fold等17款新價格總表
  • 揭密蘋果製造工廠:每年的支出可以造兩艘航母
  • 新冠病毒又抬頭了嗎鐘南山發聲:沒必要恐慌預計6月底前結束
  • ASUS 華碩 RT-AX86U AX5700規格電競路由器 開箱拆解評測

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.