最新AI生圖模型Flux1.1刷螢幕新增單眼相機檔案名稱獲得超寫實影像

2024-10-07 Comments 0 Comment

最新AI文生圖模型Flux1.1，一夜刷螢幕。只要一個簡單技巧，就能去除圖中的「AI味」，無論人物或風景都能達到照片級效果。留言區網友的反應be like：我分不清，真的分不清啊。

這個技巧用起來也非常簡單，在提示詞中模仿單眼相機的檔案命名格式即可。

例如「CR2」就是佳能相機使用的原始影像檔案格式，輸入「IMG」+隨機編號+「.CR2」，再加指定的內容，就能獲得一張寫實影像了。

後面也陸續有嘗試過的網友回饋，換成索尼相機的「ARW」、尼康相機的「NEF」，甚至蘋果的「HEIC」格式，都能獲得不錯的結果。

以至於有人都開始懷疑，不會是模型隨機吐出來一張訓練資料裡的真照片吧？

不過要放大看一些特定細節，還是很容易看出確實是AI生成的，例如車牌號碼上的文字都是亂碼。

那麼是否Flux1.1模型本身能力就很強大，這個技巧在其中扮演了多大角色呢？

一位資深修圖師傅做了對比，左邊加了IMG_1018.CR2，對比右邊不加的，他認為差別巨大。

我們的實測結果也能看出，加上這個技巧能顯著提升畫面真實性。

現在想免費試玩這個Flux1.1模型，可以來到together.ai平台，註冊即送5美元的積分。

隨便生成一張在長城的遊客自拍照，乍看之下像那麼回事，但仔細觀察人物皮膚質感、背景山和植物都有還是有一股AI味。

換成“IMG_0314.cr2: selfie on The Great Wall”，是不是立刻就不一樣了？

代號藍莓，最新SOTA文生圖模型

隨著FLUX1.1的正式發布，此前在文生圖模型排行榜上屢佔榜首的兩個無人認領的“藍莓”模型的神秘面紗也被揭下，正是它。

官方不藏了，直接放出數據，在Artificial Analysis image arena上，FLUX1.1 [pro]以“blueberry”為代號，超越所有其它模型，獲得最高的整體Elo評分。

相較之下，FLUX1.1 [pro]價格也更低，速度更快，各項指標超越Midjourney、SD3、Ideogram等。

生成速度上，FLUX1.1 [pro]在維持影像品質、指令反應和多樣性提升的同時，速度是前代FLUX.1 [pro]的6倍。

順便提一下，現在FLUX.1 [pro]也進行了更新，速度是之前的2倍，FLUX1.1 [pro]的速度是目前可用的FLUX.1 [pro]的3倍。

此外，官方表示即將推出快速高解析度生成，FLUX1.1 [pro]可原生支援的那種，在不犧牲任何指令回應情況下，能生成2k影像。

FLUX1.1 [pro]將透過Together.ai 、Replicate 、fal.ai、Freepik等線上平台提供。

同時官方也推出了BFL API，可供其他開發者整合到自己的應用程式中，API定價是：

FLUX.1 [dev]：每張圖2.5美分（約RMB 0.18元）

FLUX.1 [pro]：每張圖5美分（約RMB 0.35元）

FLUX1.1 [pro]：每張圖4美分（約RMB 0.28元）

Stable Diffusion原班人馬打造

FLUX1.1 [pro]的背後是Stable Diffusion原團隊，成員包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等。

△ Robin Rombach

其實Stable Diffusion最初是個學術研究計畫。

由Björn Ommer教授領銜，Robin Rombach、Andreas Blattmann、Dominik Lorenz等幾位慕尼黑大學機器視覺與學習研究小組成員，以及Runway的研究人員Patrick Esser完成。

研究論文發表七個月後，Stability AI開始介入，提供運算資源，以進一步開發文字到圖像生成模型。 2022年，上述幾位論文作者加入Stability AI。

團隊一起創建了Stable Diffusion XL、Stable Video Diffusion等。

ICML 2024最佳論文之一、Stable Diffusion 3技術論文的Rectified Flow Transformers，還有SDXL-Turbo使用的對抗擴散蒸餾方法（Adversarial Diffusion Distillation），也是這群子人在研究。

今年三月這些核心研究團隊成員被爆出集體辭職。

而後，他們組成了新團隊名為Black Forest Labs（黑森林實驗室），總部位於德國。

今年8月初剛宣布成立，並發布了其初代文生圖模型FLUX.1，FLUX.1有三個變體：FLUX.1 [pro]、FLUX.1 [dev]和FLUX.1 [schnell]，平衡了性能和可訪問性。

目前黑森林實驗室完成種子輪融資，共融資3,100萬美元，Andreessen Horowitz領投，Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun等跟投。

據說他們還已經收到General Catalyst、MätchVC的後續投資。

黑森林實驗室和馬斯克也合作，將其影像生成模型引入xAI的Grok助手中。

接下來，團隊透露將推出SOTA級文字到影片產生模型。

據說他們正在以10億美元的估值籌集1億美元資金，比之前1.5億美元的估值大幅上漲。

從Pika 1.5到Meta Movie Gen，今年下半場影片生成賽道爆火，黑森林實驗室的加入，或許會帶來不一樣的火花。

來源：量子位

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

WONGCW 網誌

記錄生活經驗與點滴

最新AI生圖模型Flux1.1刷螢幕新增單眼相機檔案名稱獲得超寫實影像

2024-10-07 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆