DALL-E文本到圖像AI模型迎來邊界畫幅擴展升級很快就被網友們玩壞
上週,OpenAI 為其“文本到圖像”AI 模型DALL-E 添加了“outpointing”功能,為系統帶來了能夠拓展任何給定圖片邊界的功能。在此基礎上,許多網友開始通過Beta 測試階段的每月50 次免費訪問來生成新的視覺效果,並在社交網絡上分享了許多有趣的內容。
以《戴珍珠耳環的少女》為例,你可看到DALL-E 是如何在人工智能技術的加持下,“想像”出在Johannes Vermeer 畫框之外的場景。
讓人感到震驚的是,即使僅提供了相當有限的初始信息,AI 系統還是能夠努力匹配原畫作者的風格—— 比如物體的陰影和高光。
使用任意尺寸的 DALL-E 圖片擴展創意並講述更大的故事(通過)
在Twitter 上分享的這段視頻中,藝術家August Kamp 展示瞭如何將圖像逐級“放大”。可知DALL-E 會經常隨著畫幅的擴展,而重新計算出匹配的畫面。
《玩撲克的狗》(油畫原作者為Cassius Marcellus Coolidge)
需要指出的是,DALL-E 的系統並沒有單獨生成擴展出來的畫面。與所有“文本轉圖形”AI 一樣,該模型同樣要求人類輔助描述想要看到怎樣的視覺效果。
“末世”蒙娜麗莎
隨著公測的開啟,網友們也開始瘋狂地拿DALL-E 對各個“世界名畫”開涮。
光影朝向不對勁的派拉蒙片頭
此外儘管許多“文本到圖像”AI 模型都有提供類似的畫幅延伸功能,但它們往往與升級前的DALL-E 一樣,需要相當繁雜的人工介入。
這位騎馬的男子,有一個響噹噹的名字(拿破崙)。
在Beta 測試階段,OpenAI 有提供超百萬的用戶訪問。如果用完了一個月50 次的免費服務,也可支付15 美元來購買115 次額外的圖像生成。
披頭士《Abbey Road》專輯封面(原版只有四人走過人行道)
“桂格”震怒(假如該燕麥品牌的形象代言人是一位身材豐滿的酒吧女招待)