李飛飛團隊新作登《自然》子刊:如果AI有身體會更智慧嗎?
如果AI有身體,它會變得更智慧嗎? 答案是,會的。 近日,斯坦福大學教授李飛飛帶領的團隊研究發現,身體形態會影響虛擬生物Unimal在複雜環境的適應和學習能力,複雜環境也會促進形態智慧的進化。 此項題為《通過學習和進化實現具身智慧》(Embodied intelligence via learning and evolution)的研究登上了《自然·通訊》(Nature Communications)雜誌。
“我們通常專注於AI是如何實現人類大腦中神經元的功能,然而將AI看作是具有物理實體的東西會是完全不同的範式,”李飛飛表示。
對於此項研究,論文第一作者Agrim Gupta告訴澎湃新聞,”最終的目標將是擁有生活在一個’由人類創造並且為了人類而創造’的世界的實體智慧體。 ”
“現在,我們已經看到人工智慧在視覺和語言方面的研究取得了巨大進展,並將降低在『虛擬/網路』世界中做事的成本。 但像説明老年群體或幫人類做危險的工作這樣真正以一種好的方式影響人類生活的技術,目前還是遙不可及的。 所以當我們有了擁有物理實體的智慧體,這個影響將是巨大的,並且很有希望讓人類更好。 ”
研究團隊創建了一個計算機類比的”遊樂場”,在那裡,被稱為”unimals”(通用動物的縮寫,發音為”yoo-nimals”)的類節肢動物智慧體學習並受到突變和自然選擇的影響。
每個環境的類比都從576個獨特的unimals開始,它們由一個「球體」(頭部)和一個「身體」組成,該「身體」由不同數量以各種方式排列的圓柱形肢體組成。 每個unimal都以相同的方式感知世界,並以相同的神經架構和學習演算法開始。 換句話說,所有unimals都以相同的智慧水平開始了他們的虛擬生活——只是他們的身體形狀不同。
在學習階段中,Unimal必須在多變的地形上將一個塊狀物移動到目標位置,地形有不同難度——平坦的地形、塊狀山脊、階梯或光滑的山丘。
該團隊採用一種錦標賽式的達爾文進化方案,在相同的環境/任務組合中接受過訓練的每個unimal都與其他三個unimal一起參加比賽,獲勝者被選中產生一個單一的後代。 該後代在面臨與其父母相同的任務之前,都要經歷涉及肢體或關節變化的單一突變。 所有的unimals(包括獲勝者)都參加了多次比賽,只有隨著新後代的出現才會老化。
在訓練了4000種不同的形態后,研究人員結束了類比。 那時,每個環境倖存下來的unimal平均經歷了10代進化,成功的形態多種多樣,包括兩足動物、三足動物和四足動物,有或沒有手臂。
在每個環境中完成3次這樣的進化(訓練4000種不同的形態)后,研究團隊再從每個環境中選擇前10名表現最佳的動物,並從頭開始訓練它們執行八項全新任務,例如繞過障礙物、操縱球或推動一個盒子向上傾斜。
最後發現,在變化地形中的unimal進化地比平坦地形中的更好,在變化地形中操縱盒子的unimal表現最好。 進化10代以後,最成功的unimal在形態上已經適應得非常好,他們學習同樣任務的時間是最早一代的一半。
這也與美國心理學家詹姆斯·馬克·鮑德溫 (James Mark Ba ldwin) 在19世紀後期提出的假設一致,他推測學習具有適應性優勢(adaptive advantage)事物的能力可以通過達爾文的自然選擇傳遞下去。 Gupta解釋,”自然會選擇能更快地獲得優勢行為的身體變化”。
由於在更複雜環境中進化的智慧體可以更快更好地學習新任務,Gupta和他的同事認為,允許類比實體智慧體(embodied agent)在日益複雜的環境中進化將為開發在現實世界中執行多項任務的機器人提供啟示。
Gupta說,「人類不一定知道如何為奇怪的任務設計機器人身體,例如爬過核反應堆提取廢物,地震後提供救災,引導納米機器人在人體內運動,包括做洗碗或摺疊衣物等家務。 也許唯一的出路是讓進化來設計這些機器人。 ”
在面對這項研究將會如何具體幫助這些任務的實現的疑問,Gupta向澎湃新聞表示,”另一個看待此項研究的方式不再是創造了智能演算法(intelligent algorithms),而是你可以有正確的物理形式,從而輕鬆完成手頭的任務。 從這個意義上說,理論上你可以優化摺疊衣服的機器人的形式。 ”
對於下一步的研究計劃,Gupta透露,當前的工作幾乎只涉及了表面,現在的類比環境和學習行為都還非常簡單,”我們希望能擴大範圍,同時,將現在的一個智慧體擴展成多個智慧體也是一個有趣的方向。 ”