研究人員介紹可讓機器人在幾分鐘內完成訓練的快速學習方法
在今日的《TC Sessions:Robotics》大會上,加州大學伯克利分校的一支研究團隊,介紹了一套可讓機器人在幾分鐘內站起來的加速學習方法。傳統依靠人工智能(AI)學習新任務的機器人,往往需要經歷繁瑣且重複的訓練過程。而通過新穎的學習技術,其有望簡化並縮短這一過程。
該校研究員Stephen James 解釋稱:新技術旨在讓機器人快速補足短板,而不是從頭開始訓練。
我們採用的技術是一種對比學習設置,它會分析YouTube 視頻並嘗試重建各個區域的圖像,以理解並推斷後面可能有什麼。
此外通過物理或VR 方式操控機器人本體時,操作者也需要結合填充的視頻圖像信息,對環境做一個大致的了解。
好消息是,這套方案已經產生了不錯的效果。通常某些任務可能需要數百次演示,才能讓機器人學會如何去執行。但現在只需提供少量的演示(比如10 次),便可教會它。
據悉,Alejandro Escontrela 擅長設計從YouTube 視頻中提取的相關數據模型,比如動物、人類或其它機器的動作。
機器人能夠利用這些模型來訓練自己的行為,並判斷給定的動作是否看起來與需要嘗試的操作類似。
有趣的是,儘管許多同類機器人都是先在類似VR 的模擬環境中學習並測試,但Danijar Hafner 更進一步地提升了流程效率。
通過直接跳過測試階段,讓機器人在現實環境中直接展開訓練—— 從行走、絆倒、被推搡等互動中實時學習。
讓機器人在幾分鐘內站起來的加速學習(via)
這麼做的好處是機器人系統可以邊工作邊學習,而不必回到模擬器來整合新信息,從而極大地簡化了工作任務,目前伯克利研究團隊正在向著這個目標大舉邁進。
最後,Danijar Hafner 認為—— 機器人學習的聖杯,就是在現實世界中展開盡可能多的快速學習。