科學家利用強化學習培訓四足機器人守門員
某些機器人挑戰有著明確的應用場景,而有些挑戰則需要機器人系統根據場景的變化靈活應變。而教小型機器人玩足球屬於後者。近日發表的一篇論文[ PDF ]中,詳細介紹了使用強化學習來教MIT 的Mini Cheetah 機器人扮演守門員角色:
使用四足動物的足球守門是一個具有挑戰性的問題,它將高度動態的運動與精確和快速的非抓握物體(球)操縱相結合。機器人需要在很短的時間內(通常不到一秒)使用動態運動機動對潛在的飛行球做出反應並攔截。在本論文中,我們建議使用分層無模型RL 框架來解決這個問題。
實際上,機器人需要鎖定足球並在不到一秒鐘的時間內自行移動以阻擋球。機器人的參數在模擬器中定義,Mini Cheetah 依靠三個動作——迴避、俯沖和跳躍——通過確定運動時的軌跡來阻止足球進門。