研究人員開發神經網絡可讀取食譜並生成熟食產品的圖像
來自特拉維夫大學的一組研究人員開發了一種神經網絡,能夠讀取食譜並生成烹飪完成後的熟食產品的圖像。嗯,好像可以更換人頭拍色情片的DeepFakes還不夠糟糕,現在我們無法確定我們在網上看到的美味食物都是否是真實的了。由研究人員Ori Bar El,Ori Licht和Netanel Yosephian組成的特拉維夫團隊使用名為StackGAN V2的生成對抗網絡(GAN)的修改版本和巨大的recipe1M數據集中的52K圖像/配方組合創建了他們的AI。
該團隊了一種人工智能,只需要列出任何配方和說明清單,就可以運算成品食品的樣子。
這一切都是一名研究人員在向祖母詢問她傳統的番茄醬炸魚排配方時開始的。由於她年事已高,她不記得確切的食譜,所以吃貨科學家就建立了一個能夠給出食物圖像的系統,方便輸出食譜。由於人們很難從飯菜中獲得具有實際數量和“隱藏”成分的精確配方,如鹽,胡椒,黃油,麵粉等。因此基於配方生成食物圖像就成了有用的做法,這項任務對於人類來說非常具有挑戰性,對於計算機更是如此。
由於目前大多數人工智能係統都試圖在人類易於完成的任務中取代人類專家,解決一項甚至超出人類能力的任務會很有趣。
值得一提的是,與CUB和Oxford102數據集中的圖像相比,recipe1M數據集中的圖像質量較低。這反映在許多模糊的圖像上,光照條件差,“粥狀圖像”以及圖像不是方形(這使得訓練模型變得困難)。這個事實可能會解釋這兩個模型成功生成“類似粥”的食物圖像(例如麵食,米飯,湯,沙拉),但卻難以生成具有獨特形狀的食物圖像(例如漢堡包,雞肉,飲料) )。
如果有足夠的配方,特拉維夫團隊的人工智能現在可以將它變成一個看起來足夠好的圖像,根據研究論文顯示,在盲測中,人類有時更喜歡計算機生成的圖片而不是真實照片。
該團隊打算繼續開發該系統,希望擴展到超越食物的領域。包括完善當前的數據集質量,還考慮構建一個包含兒童書籍文本和相應圖像的數據集,這樣就可以讓計算機看文章畫插畫了。