迪士尼玩起強化學習新機器人有星際大戰那味了
迪士尼新機器人閃亮登場!話不多說,先來看長啥樣──一閃一閃的大眼睛、搖搖晃晃的腦袋、靈活擺動的觸角,還有一雙小短腿。
走起路來屁顛屁顛,關鍵還很穩:
雖然是機器,但不得不說這神態很有「靈性」:
就在剛舉行完的國際機器人頂會IROS上,迪士尼研究所研究科學家Moritz Bächer帶領團隊展示的這個新機器人可謂萌翻全場。
雖然這個小傢伙還沒有一個正式的名字,但它的表現足夠令人印象深刻。
和常見的雙足機器人最大的不同點在於,它不僅能夠在行走中保持動態平衡,還能夠透過動作表達出一些「情感」。
經研究人員介紹,這主要是因為在訓練過程中使用了團隊去年耗費一年時間開發的強化學習系統,並且還請了專業的動畫師設計動作,將動畫角色用動作表現情感的方式應用到了機器人身上。
基於此,小傢伙不再是冷冰冰的機器。可以想見,若給它裝一個GPT大腦,家裡的狗子危~~~~
瑞思拜,我是大學生,給我。
不少網友看到後聯想到了星際大戰中的角色:
另一波網友看到小傢伙如此“憨態可掬”,認為這就是現實版的瓦力(WALL-E,《機器人總動員》中的角色):
更有網友直呼感覺「站在了機器人革命的風口浪尖」:
這個小傢伙走起路來為何如此平穩?開發者又具體是如何賦予其「情感」的?我們接著往下看。
在瑞士森林中“漫步”
搖頭晃腦還能平穩運動的秘訣,在於頭部和腿部的設計。
其中,小傢伙的頭部是一個四自由度的設計,可實現上、下、左、右四個方向傾斜觀察:
而它的腿更是增加到五自由度,具備髖關節,因此它在行走時能夠保持動態平衡。
偷襲推它,或是故意拖曳它腳下的地毯,它都能應對自如:
挑戰更為複雜的地形,在瑞士野外森林中漫步也不在話下:
穩重又不失風情,走著走著,還能跳上一段:
據研究人員介紹,能做到這種效果,從概念提出到最終打磨成型,其實只花了不到一年的時間。
這還要得益於3D列印技術,使用模組化硬體和執行器,大為提高了設計和迭代的速度。
再來說說賦予其「情感」。
其實這種讓機器人以有情感的方式運動是迪士尼的專長,早在上世紀六、七十年代,迪士尼就開發了機械人偶。
但隨著機器人變得愈加先進和機動,設計出能夠與其相容的情感行為變得具有挑戰性。
為此,迪士尼搬出了王牌,請用了擅長使角色透過運動傳達情感的動畫師來為機器人設計動作。
但交由動畫師設計動作,就得面臨一個難題——
動畫工具通常沒有內建物理特性,動畫師的設想有時在現實中很難做到。這使得團隊需要耗費大量時間試驗。
為了彌補這一差距,團隊用到了強化學習系統。
背後是強化學習的加持
研究團隊開發了一個基於強化學習的流程,透過模擬將動畫師的視覺願景和機器人動作結合。
這個過程本質上是為動畫師提供了物理約束條件,確保動畫師設計的高表現力動作可以在現實中實行,或盡可能接近機器人所能做到的程度。
迪士尼研究所的研究科學家Morgan Pope表示:
這就不僅僅是走路了,走路只是強化學習系統的輸入之一,另一個重要的輸入是如何行走。
好在這種情況下,強化學習的一大優勢是生成的運動穩健性很好。
並且根據研究人員的說法,用該流程在一台PC上只需幾個小時就能訓練機器人做新動作,大大縮短了開發新機器人角色所需的時間。
同時在一遍遍的訓練中,還可以對馬達性能、質量分佈和機器人與地面之間的摩擦力等進行細微的調整。
團隊負責人Bächer認為,「這使得迪士尼開發新機器人角色所需的時間從幾年縮短到幾個月」。
而研究人員也強調重要的不是機器人,而是這個過程:
所以如果我們想要增加更多的腿、手臂,或是製作一個全新角色,我們可以迅速教它新的動作。現成的致動器、3D列印組件、可適應性強的強化學習框架,這些都可以應用於外觀和動作都大不相同的機器人。
而這個機器人,只是旅程的一步。
參考連結:
[1]https://twitter.com/linusekenstam/status/1710277661069574171
[2]https://spectrum.ieee.org/disney-robot