Google在Gemini應用程式中推出原生AI影像編輯功能
經過上個月的開發人員測試後,Google開始在Gemini 應用程式中推出原生AI 影像編輯功能。 您可以使用自然語言文字提示編輯手動上傳的圖片以及Gemini 應用程式產生的圖片,並不斷要求Google 進行編輯,直到滿意為止,並且上下文始終保留,這包括更改背景、替換物件和添加元素。
不僅如此,還能夠改變影像的風格。在下面的例子中,你可以看到狗狗被加了一頂帽子,然後草地背景變成了海灘。另一個例子是「你可以上傳一張個人照片,然後Gemini 會產生一張你用不同髮色會是什麼樣子的圖片」。

底層功能上線後(會有內嵌提示),可以使用任何當前模型開始影像編輯。
Google所謂的「直覺、多步驟編輯」的另一個好處是「透過整合文字和圖像,對你的提示做出更豐富、更具情境性的回應」。其中一個例子就是要求提供包含圖像的逐步說明。
例如,您可以要求Gemini 創建有關龍的睡前故事的初稿,並提供與故事相符的圖片。
在安全性方面,「使用原生影像產生功能建立或編輯的影像將包含不可見的SynthID 數位浮水印」。 Google也「正在嘗試在所有由Gemini 生成的圖像上添加可見的浮水印」。在上面的例子中,它是右下角藥丸形容器中的“ai”。
上個月,Google在AI Studio 中大力宣傳Flash 2.0 如何出色地渲染帶有文字的圖像(無論文字長度如何),以及如何「利用世界知識和增強推理能力來創建正確的圖像」。
從今天開始,原生影像編輯功能將逐步在Gemini 應用程式中推出。該功能將「在未來幾週內擴展到更多用戶,支援超過45 種語言,涵蓋大多數國家」。