實測MidJourney吊打Adobe Firefly 老牌權威也跟不上新時代了
這兩天,不少人開始拿到Adobe Firefly的測試資格。雖然3月下旬才剛剛殺入,但作為設計界權威公司的新AI工具,它的生成效果也自是被寄予厚望。這不,英偉達AI研究科學家Jim Fan率先給出實測:
Adobe能否與自籌資金的11 人團隊MidJourney相抗衡?
結果是——
嗯,Adobe Firefly被吊打了……
不信你看:
Adobe Firefly大戰MidJourney
Jim Fan一共測試了8輪。
第一輪:
死侍在英國一所公寓大樓外的汽車頂部擺出廣角姿勢。
來看兩者的生成結果,左邊是Firefly,右邊MidJourney(下同):
啊這,Firefly你確定左邊這個是蜘蛛俠,而不是真·豬豬俠?
第二輪:
一張照片捕捉到超級馬里奧在昏暗的街道上擺pose,在地上的水坑里有一個大倒影,空氣中有輕微的薄霧,你知道某些事情即將發生,人們對此充滿期待。這就像好萊塢電影中的場景,高產值,擬人化的鏡頭。
結果:
超級馬里奧的形象就不說了,感覺Firefly在背景和氛圍感的刻畫上也遜色一番。
第三輪:
和第二輪的提示詞一模一樣,不過把超級馬里奧換成皮卡丘。
除去皮卡丘形像不說,還是MidJourney更能抓住氛圍,Firefly這次連昏暗的街道都表現得不到位。
第四輪:
不整IP形象了,這輪看看誰更擅長人物攝影。
富士膠片拍攝的這張現代街頭風格的照片捕捉到了東京一個憂鬱的早晨,一大群通勤者在街上行走。
人群中註意力集中的面孔穿著日本街頭服飾和商務裝的混搭,但吸引你注意力的是穿紅色衣服的女人。
日出的溫暖光芒在薄霧中綻放,而銳利的陽光和精心的構圖強調了人群的情緒和紅衣女子的優雅。
完全兩種不同的呈現方式,但Firefly實在實在是有點失真了。
第五輪:
這輪再整點科幻的。
抽象分形藝術作品,由數百萬個三維異形塊組成的圓形馬賽克城市建築,城市位於太空中,背景可以看到木星,就像從宇宙飛船上看到的那樣。
感覺Firefly對“圓形”的理解過於表面,顯然也不懂什麼是“像從宇宙飛船上看到的那樣”。
第六輪:
現在來生成一些手機應用程序的圖標設計,Firefly知道這是什麼嗎?
應用程序圖標設計:iOS,科幻星球景觀,skeomorphic風格;視覺技巧:使用淺景深、高曝光度、柔焦來強調美;設備:採用高分辨率相機拍攝;編輯:通過顏色校正和銳化增強;平台:Dribble、Behance
顯然它還不知道。
第七輪:
報刊/電視台/新聞風格的照片,中全景,afga vista劇照,一位留著白色辮子的牙買加年輕女子站在沙漠中,身穿復古亮片Gucci白色禮服。
這輪主要是看一下AI最不擅長的手部生成。
乍看一眼,兩個都還行,但稍微瞧瞧就會發現Firefly給了個男扮女裝的形象,手部廢了,背景相比MidJourney還是輸了一截。不過兩者這個“白色辮子”的呈現就大哥不說二哥了。
最後一輪:
Seealpsee湖旁蒲公英中的紅色法拉利F40,用Fujifilm Velvia 50拍攝,高細節,高對比度4K
乍一看也都還行,但細看Firefly的背景還是假,不過Firefly說畫蒲公英就只畫蒲公英,MidJourney反而畫蛇添足給了一些其它花種,略微偏離題意。
測試就是這些,總體看下來,Firefly確實完敗,有種小學生VS大學生的趕腳,也有網友認為Firefly的水平也就算MidJourney的V1版本。
不過如Jim Fan所說,這種情況情有可原,畢竟:
(1)這些提示語已經在MidJourney中進行了大量優化,直接和剛“出道”的Firefly來比不是很公平。
不過Jim Fan也試了一些“變體”,但仍然無法獲得更好的結果,也可能是和他寫的提示詞不是很好有關,上面這些測試的提示語基本來自網友。
(2)最重要的一點,Firefly宣稱它僅在Adobe Stock和完全許可的圖像上接受過訓練。
這點是很大的劣勢,但對於必須確保輸出圖像版權的使用者來說卻是一個重要的優勢。因為這些人很可能更願意為了合法性而犧牲質量。
針對這個話題,Jim Fan進一步發表觀點:
恕我直言,從長遠來看,MidJourney的策略(幾乎不關注藝術家和版權)和Adobe的策略(為了保護知識產權削弱訓練)都不是最優的。
也有一些還不錯的作品
事實上,隨便在網上搜一搜,還是能看到Firefly在沒有如此對比之下生成的一些還不錯的作品。
算是挽回一些局面。
比如這個:
走在鵝卵石路上的阿爾巴尼亞老婦人。
這個:
這個:
以及用它添加的動畫效果:
能感覺到,Firefly不擅長寫實,這種卡通/手繪等效果還是可以。
Midjourney更新:能以圖生文了
強大的Midjourney仍在繼續迭代。
官方最新發布一個命令:/describe,可以用4種文字結果來描述一張圖片。
網友紛紛表示:我們可以用它給的描述來研究怎麼更好的寫提示詞了。
不過,直接用它給出的描述再生成圖,會跟原圖有些差別,比如設計美學博主@Simon_阿文嘗試的這個“地鐵老人看手機”梗圖:
但很快就有網友給出解決方案:
除了手動再修改提示詞,在二次生成時將原圖也餵給Midjourney就會基本差別不大了。
來源:量子位