虛擬脊髓讓Morti機器狗在短短一小時內學會正常行走
在定於2022 年7 月18 日在《自然·機器智能》期刊上發表的一篇文章中,馬克斯·普朗克智能係統研究所(MPI-IS)的研究人員們介紹了他們的最新工作。據悉,為了解動物如何學會走路、尤其是從一次次絆倒後再爬起的過程中積累經驗,他們特地打造了一隻小狗大小的四足機器人。
(圖自:MPI-IS / Dynamic Locomotion Group / Felix Ruppert)
在大自然中,新生的小鹿或小馬駒必須盡快學會行走,以躲避掠食者。即使動物天生就有位於脊髓中的肌肉協調網絡,但學習腿部肌肉和肌腱的精確協調,還是需要一些時間的。
起初,嬰兒動物主要依賴於硬連接的脊髓反射。雖然更加底層,但運動控制反射有助於其在第一次嘗試行走時避免跌倒和傷害自己。
通過一段時間的練習,它們才會掌握更高級和更精確的肌肉控制,直到神經系統最終能夠很好地適應年輕動物的腿部肌肉和肌腱。在越過了失控的障礙後,它們就可以跟上成年動物了。
研究配圖- 1:四足機器人Morti
MPI-IS 動態運動研究小組的前博士生Felix Ruppert 表示:
作為一名工程師和機器人專家,其正在通過構建一個像動物一樣具備反射能力、並從錯誤中習得經驗的機器人。
若動物只是偶爾絆倒,這個錯誤還不好說。但若它經常絆倒,就可以拿來衡量機器人行走的質量好壞了。
研究配圖- 2:彈性可塑框架示意圖
值得一提的是,在僅僅一小時的走路學習後,機器狗Morti 就已充分掌握其複雜的腿部力學。
在貝葉斯優化的指導學習下,足部傳感器測得的信息,可與程序建模的虛擬脊髓目標數據相匹配。
通過不斷比較發送和預期的傳感器信息,機器狗得以找到循環反饋的改進,調整其電機控制模式來學習行走。
研究配圖- 3:模擬與實踐試錯的對比參照
學習算法能夠適應中央模式生成器(CPG)的控制參數,在人類和動物中,CPG 就是脊髓中的神經元網絡。
它能夠在不依賴大腦輸入的情況下,產生週期性的肌肉收縮,可在步行、眨眼或消化等有節奏的任務中提供幫助。
至於反射,則由腿部傳感器和硬編碼的神經通路,來觸發非自願運動的控制動作。
研究配圖- 4:CPG 參數與彈性反饋活動
只要幼小動物在完全平坦的路面上行走,CPG 就足以控制來自脊髓的運動信號。但只要地面上有個小顛簸,其步行方式就會發生改變。
為避免跌倒,反射會介入並調節運動模式。而運動信號的這些瞬時變化,又是可逆或“彈性的”。即使受到干擾,後續也能夠恢復如初。
但若動物在多次運動循環中不停地跌跌撞撞—— 即使反應活躍—— 那也必須通過重新學習運動模式、並使其具有不可逆轉的“可塑性”。
研究配圖- 5:塑性適應的結果
新生動物最初的CPG 調節還不夠號,導致其在平坦或不平坦的地形上蹣跚而行,本文介紹的機器狗Morti 也是如此。
更重要的是,在大約一小時內,機器狗已能夠做到比小動物更快地優化其運動模式—— 這得益於Morti 的CPG 在控制機器腿部運動的小型輕量計算機上進行了模擬。
這個虛擬脊髓被放置在了四足機器狗的頭背部位置,在平穩行走的一小時內,來自其足部的傳感器數據能夠與CPG 的預測效果不斷進行比較。
研究配圖- 6:扭矩性能的標準化測量
若機器人絆倒,學習算法會改變其腿的來回擺動距離、擺動速度、以及落地行程。同時調節後的運動,也會影響機器人靈活運用其腳力的能力。
在學習過程中,CPG 會向電機發送經過調整的信號,以便機器狗從此減少磕絆並優化其行走。
但是在這一框架中,虛擬脊髓並沒有對機器人的腿部動作設計、電機和彈簧的物理特徵有明確的了解。
(來自:Nature Machine Intelligence)
Flix Ruppert 解釋稱:這台機器狗實際上有些“天生”的特性,即使對自己的腿部解剖結構或工作原理一無所知,內置CPG 還是可以自然且智能地幫助其行走。
計算機產生了控制腿部電機的信號,起初有些跌跌撞撞。但從傳感器不斷回流的數據,還是可以通過與虛擬脊髓CPG 產生的進行比較。
若傳感器數據與預期結果不匹配,則學習算法會讓它改變行走行為,直到機器人能夠在不被絆倒的情況下良好行走。
綜上所述,在保持反射活躍的情況下改變CPG 輸出、並監測機器狗絆倒的學習過程,就是其中最核心的部分。
更棒的是,Morti 的板載電腦,只會在行走過程中消耗5 瓦的電力。
最後,儘管來自某些知名製造商的工業四足機器人已學會在復雜的控制器的幫助下運行,但它們的功耗也要大得多。