OpenAI發布GPT-image-1模型更強吉卜力版本來啦
今天凌晨1點30,OpenAI發布了全新圖像模型GPT-image-1,已經透過API向全球開發者開放使用。 GPT-image-1與ChatGPT版本有很大不同,可以控制生成影像的敏感度、生成效率、背景、輸出格式、渲染品質、壓縮品質等,並且支援全網爆火的吉卜力模式。目前,Adobe、Figma、HeyGen、Wix等知名企業已經將該模型整合在產品中。
要注意的是,OpenAI已經對新模型的API使用了全新身份驗證。如果無法通過驗證的小夥伴,可以使用微軟的Azure雲端服務來體驗。

詳細API指南:https://platform.openai.com/docs/guides/image-generation?image-generation-model=GPT-image-1
GPT-image-1應用案例
目前,已經有許多知名企業開始將GPT-image-1模型應用在實際業務中,例如,多媒體巨頭Adobe已經將其整合在Firefly 和Express應用程式中,為用戶提供不同類型的圖片風格。
<在
雲端設計平台Figma透過GPT-image-1只用簡單的提示產生和編輯圖像,就能幫助設計師直接在Figma 中快速獲取想法並進行視覺迭代。
AI影片平台HeyGen 正在使用GPT-image-1 來增強頭像創建,特別是改進平台內的頭像編輯。

雲端開發平台Wix透過GPT-image-1可以幫助任何使用者將想法快速變成現實。

圖像設計平台Photoroom正在使用GPT-image-1 幫助線上賣家透過一張產品照片即時創建工作室品質的視覺效果、生活場景和模特兒照片。
GPT-image-1支援哪些高級定制
開發者透過API最大特色就是支援各種進階功能的客製化。例如,通常我們用GPT-4o來產生影像一般是一張,但透過API只需要設定一個N參數,就可以一次產生多張。

以多張圖像作為提示詞,例如,我們直接用四張單圖,直接合成一張完成的禮品新圖像。


使用過Photoshop合成圖片的小夥伴應該都知道很重要的一個功能—遮罩。現在透過GPT-image-1也能輕鬆實現了。
提示詞:陽光明媚的室內休息區,有一個游泳池,池中有一隻火烈鳥。然後進行蒙版塗抹。

最終輸出的影像。


開發者也可以對圖片的透明度進行更改,只需要將background 參數設為transparent 即可。但僅支援png 和webp 輸出格式。

此外,開發者也可以透過API設定GPT-image-1的影像尺寸1024×1024、1024×1536、1024×1536或自動;渲染質量,low、medium 、high三種;壓縮格式,JPEG 和WebP 格式的壓縮等級(0-100%)。

所以,透過GPT-image-1的API來產生圖片,自由度極高,徹底釋放使用者的想法,產生的影像也非常好。
定價方面,文字輸入每100萬token為5美元,圖片輸入每100萬token為5 10 美元;圖像輸出每100萬token為40美元。
在實際使用中,低品質的1024×1024影像產生成本約為每張0.02 美元,中等品質的影像約為每張0.07 美元,而高品質影像則約為每張0.19 美元。

OpenAI執行長兼聯合創始人Sam Altman也讚揚了該模型,並表示與ChatGPT版本有很大的不同。

網友表示,這次API 發布對開發者來說意義重大。單是影像編輯功能,就能開啟眾多先前無法實現的創意應用程式場景。

這個模型太棒了!會取代DALL-E系列嗎?

影像生成功能的整合如今拓寬了API 使用者的創意可能性。期待看到開發者們的應用程式不斷增加。這是引人注目的創新。

這很有意思! API 在底層提供了更多的控制能力。對於特定的應用情境而言,自訂審核敏感度以及平衡品質與速度可能會帶來變革。
