AI生成中國山水畫!普林斯頓姑娘本科畢業作品,線條筆觸騙過半數人類觀察者
用GAN創作似乎已經不是新鮮事了。2019,英偉達在GTC大會上推出了一個人工智能圖像生成器“GauGAN”。用戶只需要簡單的勾畫幾條線條輪廓,便會自動生成美麗的風景圖片。這款AI使用的技術是生成對抗網絡(GAN),也是一種深度學習模型,現在被廣泛用於圖像生成。
包括去年MIT和IBM沃森聯合實驗室聯合發布的AI Portraits Ars,用戶可以在線將自己的照片轉變為中世紀的優化風格,這個在線工具一度火爆到網站宕機。
你可能會說,“這不就是風格遷移麼?”
不,團隊人員專門強調,這不是風格遷移,這是AI自己創作的,從線條到色調,都和人類畫師一樣,照著真人的樣子自行創作。
但是正如東西方巨大的文化溝壑一樣,在藝術和技術結合的領域,AI似乎也更偏向西方,我們看到不少AI生成寫實主義、後現代,甚至是抽象主義的作品,但是卻很少能看到AI在傳統東方藝術上的表現。
終於,一位普林斯頓大學的本科學生Alice Xue將目光投向了中國山水畫。
在她的畢業論文中,她開發了一款名為SAPGAN(Sketch-And-Paint GAN)的AI模型,該模型可以生成傳統的中國山水畫,為此她也獲得了普林斯頓2020優秀畢業論文獎。
論文鏈接:
論文提到,在一項242人的圖靈視覺測試研究表明,SAPGAN創作出的畫作被誤認為人類藝術品的頻率高達55%,顯著高於基線GAN模型創作的畫作。
和人類一樣,先畫草圖後著色
傳統中國山水畫在繪製過程中,一般有勾、皴、點、染等步驟,顧名思義,就是先勾畫出大致輪廓,再進行渲染。
AIice提出的端到端生成中國山水畫無條件輸入模型遵循的也是這個步驟。為了實現這一過程,AIice構建了兩個模型:
Stage I: SketchGAN Stage II: PaintGAN
SketchGAN從樣本圖像中採集高分辨率的邊緣圖,而PaintGAN是根據SketchGAN進行“翻譯”創作,從而生成一幅完整的山水畫。
中國人反而更容易誤判
實驗的結果也很驚人。
在最後進行測評時,242名參與者中,模型生成的畫有一半以上(55%)被誤認為是人類作品。
視覺圖靈測試的分數分佈,要求參與者判斷藝術品是由人類還是計算機製作的(平均值= 70.5%)
在“審美愉悅”、“藝術構圖”、“清晰”和“創造力”方面,SAPGAN模型在所有藝術類別中的評分始終高於基線。SAPGAN與人類繪畫最大的區別是“清晰”。
讓人匪夷所思的是,中國人可能更容易被SAPGAN欺騙。作為母語為漢語的人,多少是見過幾幅山水畫的,但是在判別一幅山水畫是否為SAPGAN所作時,中國人可能更容易被欺騙。
作者比較了母語為漢語和英語的參與者的結果,看看文化接觸是否能讓中國參與者正確判斷這些畫。然而,說漢語的參與者平均得分為49.2%,明顯低於說英語的考生的73.5%。
也就是說,說中文的人70%的時候還會把SAPGAN的畫誤認為是人,而整體水平是55%。顯然,不管對中國文化的熟悉程度如何,參與者都很難區分繪畫的來源。
自己收集兩千多張山水畫數據,GitHub上公開
文章提出的模型是在一個新的中國傳統山水畫數據集上訓練的,這一數據集不是來自百度或者谷歌,而是由作者本人收集。
AIice表示,目前的山水畫數據集存在不唯一性和圖像質量和數量不足的問題,為了促進這一領域的發展,Alice本人建立了2192幅高質量中國傳統山水畫組成的新數據集,這些山水畫來自普林斯頓藝術博物館藏品。
目前,這些有價值的繪畫在很大程度上還沒有被生成創作研究觸及,作者也在GitHub上發布了這一數據集供公眾使用。
Alice在接受學校採訪時說,普林斯頓大學美術館有一個令人驚異的開放式數字收藏中國畫,這對我的數據集很有價值,但不幸的是,大多數研究人員沒有充分利用它。
數據集鏈接
https://github.com/Alice x 2020/Chinese-landscape painting-Dataset
寫論文之前從沒上過機器學習課,準備去Facebook工作
看到這裡,你可能覺得Alice是一位“資深程序員”了。但是她表示,“我寫這篇論文的時候從來沒有上過機器學習課程,所以我經常被這樣一個問題弄得不知所措: 像我這樣的新手能為已經存在的創新研究做些什麼。但是我發現總是有一個有趣的角度來處理一個問題,因為一個人的興趣和技能是他們獨一無二的。”
在談到對其他的學生建議時,Alice說,將數字化人文融入你的工作中是自然而然的事。找到你感興趣的東西——無論是19世紀的文學作品還是爵士樂——總有一種方法可以從中收集數據,用來分析或製作與之相關的技術工具。
談到自己未來的規劃,Alice表示自己準備去Facebook工作,成為一名軟件工程師。