機器人現在可以利用MIT新開發的”熟能生巧”演算法進行自我訓練
研究人員已經開發出一種演算法,讓機器人自主地找出自己技能的弱點,然後進行系統性的練習來改進。這相當於給機器自己的家庭作業。由麻省理工學院計算機科學與人工智慧實驗室(CSAIL)和人工智慧研究所開發的新型”估計、推斷和定位”(EES)演算法最近在機器人:科學與系統大會上發表。下面是它的工作原理:
首先,機器人利用視覺系統評估周圍環境和手邊的任務,例如打掃房間。然後,演算法會估算機器人目前執行特定動作的能力,例如操作掃帚進行清掃。如果EES 認為對某項技能進行額外練習可以提高整體表現,它就會開始練習。
研究人員在波士頓動力公司(Boston Dynamics)的Spot 四足機器人上測試了EES,該機器人在完成類似任務方面已經有了很好的記錄,尤其是在背上裝有手臂附件的情況下。不過,這次它工作得更聰明,而不是更賣力。
演算法指導機器人練習和完善有用的技能。在一次試驗中,EES 讓Spot 只花了大約三個小時就學會如何將球和戒指穩穩地放在傾斜的桌子上。在另一項試驗中,經過大約兩小時的集中練習,機器人在將玩具掃入垃圾箱這一看似隨意的任務上取得了進展。
研究人員指出,雖然這些任務相對基礎,但這項技術最終可以製造出機器人,讓它們學習如何在工廠、咖啡店、家庭或醫院等各種環境中提高自己的表現。
展望未來,他們希望整合模擬器,使機器人能夠結合虛擬和實體練習,從而加快學習過程。他們的目標還包括開發能夠對一系列練習進行推理的演算法,而不是只專注於孤立的技能。
“讓機器人能夠自主學習既非常有用,又極具挑戰性,”佐治亞理工學院教授、NVIDIA AI 研究科學家Danfei Xu 告訴《麻省理工新聞》(MIT News)。 “未來,家用機器人將被出售給各種各樣的家庭,並被期望執行各種各樣的任務。我們不可能事先對它們需要知道的一切進行編程,因此它們能夠在工作中學習是至關重要的。
有了像EES 這樣的數位道場作為依托,未來的機器人也許能像人類一樣透過老式的練習輕鬆掌握新技能。此項目論文可在Arxiv上查閱。