會畫畫、會識圖的ChatGPT終於要來了…
DALL·E 3 來了!不僅來了,還會被整合到ChatGPT 裡。也就是說,除了老生常談的對話、寫程式、解數學題外,整合了最新DALL·E 3 的ChatGPT 這次終於有圖片功能了。
ChatGPT+DALL·E ,這波算是強強聯合,一個是語言大模型裡的無冕之王,另外一個也算是文生圖模型裡的佼佼者,真正的效果也必然會1+1>2 。
這次突然官員宣算是填了今年年初GPT-4 剛出來後,被傳的紛紛揚揚的多模態ChatGPT 的大坑。
不過,現在OpenAI 還只是公佈了這個消息,具體的上線時間是10 月。面向Plus 和企業版用戶,單獨的DALL·E 3 今年秋天也會上線。
這玩意具體有多厲害,雖然現在我們還不能上手,但從OpenAI 公開的範例來看,還是相當炸裂的。
其中,就有熱心網友直接打來了Midjourney ,把DALL·E 3 的示例提示詞餵給了它,好直接鬥圖一比高下。
而結果只能說:Midjourney 危了。
首先是很經典的酪梨看病梗圖,提示詞:一個酪梨坐在治療師的椅子上,說著「 我感到內心如此空虛」 ,酪梨中間有一個小坑大小的洞。治療師,勺子,塗鴉筆記。
雖然乍看是各有千秋,兩種不同的風格。但若再仔細對照下提示詞,很顯然Midjourney 忽視了治療師,勺子,塗鴉筆記這幾個元素,對話框裡的文字也是亂寫一通,不按照要求來。
然後請他們產生一張關於半透明心臟的圖片,並且要求在心臟下面刻上一行特定的名言。
提示詞:這是一幅用半透明的玻璃製成的人類心臟的插圖,它矗立在狂風暴雨的海洋中的一個基座上。陽光穿透雲層照亮了心靈,揭示了內在的微小宇宙。「 發現你內心的宇宙」 這句名言被粗體字刻在基座上。
毫無疑問,這次DALL·E 3 再次吊打了Midjourney ,Midjourney 除了沒按照要求刻字外,像狂風暴雨的海洋、內在的微小宇宙等細節是一點也沒展現。
再來一張以荔枝為靈感的球形椅子的照片,細節上,要求有白色凹凸不平的外觀,柔軟的內飾,與背後的熱帶壁紙形成對比。
這把它們倆生成的圖片裡各個元素都齊活了,但Midjourney 似乎還是誤解了熱帶壁紙和熱帶雨林的差異。
當然,誤解提示詞、斷章取義這些都等於是之前文生圖模型的頑疾了。
像什麼寄居蟹就給生成一隻螃蟹…
讓它產生2D 的擬人化森林樂團結果生成3D 的…
而這些老毛病,照OpenAI 自己的說法以及給出的例子來看,新的DALL·E 3 基本上不存在這種情況。
除了解決老毛病之外, DALL·E 3 還在原先二代版本上也進行了質感上的升級。
就例如讓它們畫籃球運動員灌籃的場景,元素是星空爆炸。
原本DALL·E 2 產生的圖已經很符合要求了,沒想到升級後的DALL·E 3 更逼真,肌肉線條、宇宙的色彩這些細節都一一展示出來,屬實是降維打擊。
左:DALL·E 2 ,右:DALL·E 3
整體看下來,DALL·E 3 在ChatGPT 的加持下,語言理解能力直接拉滿,簡直是要贏麻了的節奏。
升級版的ChatGPT 不但不會失去關鍵資訊點,就算只是零零星星打了幾個關鍵字,它也能幫你自動補全描述,然後再讓DALL·E 3 生成圖片。
OpenAI 這是拿捏住了當代網友「 文化沙漠」 的本質了( 狗頭)。
當然DALL·E 3 和ChatGPT 的整合,不只更能聽懂人話那麼簡單,它們還會產生一些奇妙的火花。
就例如昇級版的ChatGPT 在畫畫上也有了上下文理解能力,甚至可以直接當作生產力工具。
具體有多厲害, OpenAI 官網給出了一段演示視頻,說實話,世超在看了後,也是為插畫師的飯碗狠狠地捏了一把汗。
首先是讓ChatGPT 產生一個超級向日葵刺猬,它會給出四張圖,從裡面選一張最喜歡的之後,可以進行下一步的對話。
然後把這個刺蝟命名成Larry ,可以再讓ChatGPT 多產生幾張它的照片。
接下來上點難度,直接搞個場景,讓它展示一下Larry 的家。
這把可以直接看出DALL·E 3+ChatGPT 的實力了,不僅Larry 的樣貌還保持原樣( 這換其他AI 可能早變樣了),而且門口的郵箱還寫著“LARRY” 的名字。
此外,描述Larry 的特點、用圖片展示它的愛心、甚至做做Larry 的周邊,設計出幾個貼紙,對於ChatGPT 來說都是灑灑水的事。
最後讓它整理個睡前故事,來個ending pose , ChatGPT 也是信手拈來, u1s1 我真的有點被這絲滑的對話震撼到…
看到這裡,世超還突然得了新的靈感,之後我們寫好的文章豈不是就可以直接丟給ChatGPT ,讓它提取關鍵字做封面。
有啥特殊要求也可以直接告訴ChatGPT ,參考圖啥的也可以丟給它,摸魚技巧+1+1 …
言歸正傳,上面提到的那些還只是OpenAI 單方面展示出來的效果,實際用起來怎麼樣,還是得等到10 月份上線之後才能知道,估計到時候有會有一波隱藏技巧被網友們開發出來,坐等。
另外,談到AI 繪畫,就還是躲不過那個老生常談的話題:版權問題。
OpenAI 這邊依舊還是之前的立場,和第二版一樣,用DALL·E 3 生成的圖片不需要經過許可就能用,想商業化都行。
不過,有了太多的前車之鑑, OpenAI 這次耍了點小聰明,說是藝術家可以選擇拒絕自己的作品被投餵給DALL·E ,前提是只要填一個表格就OK 了。
雖然這多少有點「 不拒絕就是默許」 的意味,但相較於之前,起碼藝術家們不再那麼被動了…
對於先前網路出現的AI 繪畫侵犯公眾人物隱私,以及一些其他偏見的問題, DALL·E 也有對策了:在實際使用的過程中, ChatGPT 會直接拒絕提示中帶有公眾人物名字的請求。
也就是,像這種樂子圖我們估計也不會在ChatGPT 中看到了…
而他們也組成了一個「 紅色團隊」 ,用來評估和降低模型在各個階段可能會產生的風險。
最後, OpenAI 也在官網上表示說,它們在研究一個辨識AI 畫圖的工具,能夠判斷哪些圖片是DALL·E 3 產生的。
( 只希望不要像之前那個辨識AI 文字的工具,因為雞肋半路夭折…
總的來說,有文生圖功能的ChatGPT 就已經足夠在AI 圈子裡掀起一陣熱度,而這波又是整合的升級版DALL·E 3 ,很難不讓人振奮,反正世超已經是等不及想上手試試了。
但有人歡喜有人憂, OpenAI 這波是再次甩了同行一大截,等到10 月更新之後,估計又有不少AI 新創公司被碾壓在ChatGPT 前進的車輪下…
來源:差評