更接近人類對世界的理解:研究人員讓AI擁有“想像力”
據外媒報導,先想像一隻橙色的貓,現在想像一下這隻貓隻長了黑色的皮毛,然後再想像一隻貓在中國的長城上昂首闊步。這一系列的想想會讓你大腦中神經元的快速激活根據你之前對世界的認識想出各種各樣的圖片。換言之,作為人類,很容易想像一個具有不同屬性的物體。
然而儘管深度神經網絡在某些任務上取得了跟人類相當或超過人類的表現,但計算機在人類特有的“想像力”技能方面仍在做著苦苦的掙扎。
現在,南加州大學(USC)一個由計算機科學教授Laurent Itti、博士生Yunhao Ge、Sami Abu-El-Haija和Gan Xin組成的研究團隊開發出了一種人工智能,這種AI能夠通過使用類似人類的能力來想像出一個具有不同屬性的從未見過的物體。
“我們受到人類視覺泛化能力的啟發,試圖在機器上模擬人類的想像力,”該研究的論文首席作者Ge說道,“人類可以通過屬性(如形狀、姿勢、位置、顏色)來分離他們所學到的知識,然後將它們重新組合以想像一個新的物體。我們的論文試圖用神經網絡來模擬這一過程。”
AI的泛化問題
假設你想創建一個生成汽車圖像的AI系統。理想情況下,你可以為算法提供一些汽車的圖像,這樣它就可以從多個角度生成各種顏色的汽車。
這是AI長期追求的目標之一:創造出能進行外推的模型。這意味著,只要給出幾個例子模型就應該能夠提取出基本的規則並將它們應用到它以前沒有見過的大量新例子中。但機器通常是在樣本特徵上訓練的,如像素,而不會去考慮對象的屬性。
想像力的科學
在這項新研究中,研究人員試圖用一種叫做消糾纏(disentanglement)的概念來克服這個限制。消糾纏可以用來產生深度偽造。Ge指出,通過這樣做,“人們可以合成新的圖像和視頻來用另一個人的身份代替原來的人,但卻能保持原來的運動。”
類似地,新方法採用一組樣本圖像–而不是像傳統算法那樣一次採集一個樣本–並挖掘它們之間的相似性以實現所謂的“可控解消糾纏表徵學習”。
然後,它重新組合這些知識以實現“可控的新圖像合成”或可以稱之為想像力的東西。”這類似於我們人類的推斷:當一個人從一個物體看到一種顏色時我們可以很容易地把它應用到其他物體上,通過用新的顏色替換原來的顏色。研究小組通過利用他們的技術生成了一個包含156萬張圖像的新數據集,這可能有助於該領域未來的研究。
理解這個世界
雖然“消糾纏”並不是一個新概念,但研究人員表示,他們的框架可以跟幾乎任何類型的數據或知識兼容。這擴大了應用的機會。如將種族和性別相關知識從等式中移除敏感屬性從而創造出更公平的AI。
在醫學領域,它可以幫助醫生和生物學家發現更多有用的藥物以將藥物的功能從其他屬性中分離出來,然後重新組合從而合成新的藥物。賦予機器想像力還可以幫助創造更安全的AI,如讓自動駕駛汽車想像並避免在訓練中看不到的危險場景。
Itti說道:“深度學習已經在許多領域展示了卓越的性能和前景,但這往往是通過淺層模仿發生的,它沒有對使每個對象獨特的單獨屬性擁有更深入的了解。這種新的分離方法,第一次真正釋放了AI系統的新想像力從而讓它們更接近人類對世界的理解。”