最新AI生圖模型Flux1.1刷螢幕新增單眼相機檔案名稱獲得超寫實影像
最新AI文生圖模型Flux1.1,一夜刷螢幕。只要一個簡單技巧,就能去除圖中的「AI味」,無論人物或風景都能達到照片級效果。留言區網友的反應be like:我分不清,真的分不清啊。
這個技巧用起來也非常簡單,在提示詞中模仿單眼相機的檔案命名格式即可。
例如「CR2」就是佳能相機使用的原始影像檔案格式,輸入「IMG」+隨機編號+「.CR2」,再加指定的內容,就能獲得一張寫實影像了。
後面也陸續有嘗試過的網友回饋,換成索尼相機的「ARW」、尼康相機的「NEF」,甚至蘋果的「HEIC」格式,都能獲得不錯的結果。
以至於有人都開始懷疑,不會是模型隨機吐出來一張訓練資料裡的真照片吧?
不過要放大看一些特定細節,還是很容易看出確實是AI生成的,例如車牌號碼上的文字都是亂碼。
那麼是否Flux1.1模型本身能力就很強大,這個技巧在其中扮演了多大角色呢?
一位資深修圖師傅做了對比,左邊加了IMG_1018.CR2,對比右邊不加的,他認為差別巨大。
我們的實測結果也能看出,加上這個技巧能顯著提升畫面真實性。
現在想免費試玩這個Flux1.1模型,可以來到together.ai平台,註冊即送5美元的積分。
隨便生成一張在長城的遊客自拍照,乍看之下像那麼回事,但仔細觀察人物皮膚質感、背景山和植物都有還是有一股AI味。
換成“IMG_0314.cr2: selfie on The Great Wall”,是不是立刻就不一樣了?
代號藍莓,最新SOTA文生圖模型
隨著FLUX1.1的正式發布,此前在文生圖模型排行榜上屢佔榜首的兩個無人認領的“藍莓”模型的神秘面紗也被揭下,正是它。
官方不藏了,直接放出數據,在Artificial Analysis image arena上,FLUX1.1 [pro]以“blueberry”為代號,超越所有其它模型,獲得最高的整體Elo評分。
相較之下,FLUX1.1 [pro]價格也更低,速度更快,各項指標超越Midjourney、SD3、Ideogram等。
生成速度上,FLUX1.1 [pro]在維持影像品質、指令反應和多樣性提升的同時,速度是前代FLUX.1 [pro]的6倍。
順便提一下,現在FLUX.1 [pro]也進行了更新,速度是之前的2倍,FLUX1.1 [pro]的速度是目前可用的FLUX.1 [pro]的3倍。
此外,官方表示即將推出快速高解析度生成,FLUX1.1 [pro]可原生支援的那種,在不犧牲任何指令回應情況下,能生成2k影像。
FLUX1.1 [pro]將透過Together.ai 、Replicate 、fal.ai、Freepik等線上平台提供。
同時官方也推出了BFL API,可供其他開發者整合到自己的應用程式中,API定價是:
FLUX.1 [dev]:每張圖2.5美分(約RMB 0.18元)
FLUX.1 [pro]:每張圖5美分(約RMB 0.35元)
FLUX1.1 [pro]:每張圖4美分(約RMB 0.28元)
Stable Diffusion原班人馬打造
FLUX1.1 [pro]的背後是Stable Diffusion原團隊,成員包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等。
△ Robin Rombach
其實Stable Diffusion最初是個學術研究計畫。
由Björn Ommer教授領銜,Robin Rombach、Andreas Blattmann、Dominik Lorenz等幾位慕尼黑大學機器視覺與學習研究小組成員,以及Runway的研究人員Patrick Esser完成。
研究論文發表七個月後,Stability AI開始介入,提供運算資源,以進一步開發文字到圖像生成模型。 2022年,上述幾位論文作者加入Stability AI。
團隊一起創建了Stable Diffusion XL、Stable Video Diffusion等。
ICML 2024最佳論文之一、Stable Diffusion 3技術論文的Rectified Flow Transformers,還有SDXL-Turbo使用的對抗擴散蒸餾方法(Adversarial Diffusion Distillation),也是這群子人在研究。
今年三月這些核心研究團隊成員被爆出集體辭職。
而後,他們組成了新團隊名為Black Forest Labs(黑森林實驗室),總部位於德國。
今年8月初剛宣布成立,並發布了其初代文生圖模型FLUX.1,FLUX.1有三個變體:FLUX.1 [pro]、FLUX.1 [dev]和FLUX.1 [schnell],平衡了性能和可訪問性。
目前黑森林實驗室完成種子輪融資,共融資3,100萬美元,Andreessen Horowitz領投,Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun等跟投。
據說他們還已經收到General Catalyst、MätchVC的後續投資。
黑森林實驗室和馬斯克也合作,將其影像生成模型引入xAI的Grok助手中。
接下來,團隊透露將推出SOTA級文字到影片產生模型。
據說他們正在以10億美元的估值籌集1億美元資金,比之前1.5億美元的估值大幅上漲。
從Pika 1.5到Meta Movie Gen,今年下半場影片生成賽道爆火,黑森林實驗室的加入,或許會帶來不一樣的火花。
來源:量子位