機器人的護球像亨利?MIT的DribbleBot在現實條件下學習運球
麻省理工學院的Improbable人工智能實驗室已經開發出一種靈巧的帶腿機器人(DribbleBot),可以在類似於人類球員所遇到的真實條件下運球。自20世紀90年代中期以來,機器人足球(有些人認為是足球)已經出現,儘管這些比賽往往是人類比賽的一個相當簡化的版本。然而,對於機器人學家來說,讓機器人操縱足球也是一個非常有吸引力的研究課題。
通常情況下,這些研究工作的中心是在一個非常平坦、均勻的表面上行進的輪式機器人,追趕一個滾動的球。對於DribbleBot,該團隊使用了一個帶有兩個魚眼鏡頭的四足機器人和一個具有神經網絡學習能力的板載計算機,用於在一個具有真實球場的不平整地形並包括沙地、泥地和雪地的區域追踪一個3號足球。這不僅使球在滾動時不容易預測,而且還提高了跌倒的危險,不僅如此,一旦跌倒,這個40厘米(16英寸)高的機器人還必須從跌倒中恢復過來,然後像人類球員一樣追回球。
DribbleBot的高度為40厘米(16英寸)。
波士頓動力公司的機器人經常演示在不平整的地面上跑來跑去,做後空翻,這可能看起來很簡單,但在運球方面,技術上有很大的區別。一個行走的機器人可以依靠外部視覺傳感器,為了保持平衡,它依靠分析它的腳對地面的抓握程度。在不平坦地形上滾動的球要復雜得多,因為它對不影響運球者的小因素作出反應,要求機器人自己發現在球和它都在運行時控制球所需的技能。
為了加快這一過程,MIT研究人員對機器人進行了4000次數字模擬,包括所涉及的動力學以及如何對模擬球的滾動方式作出反應,這些模擬都是實時平行進行的。當機器人學會運球時,它得到了正強化的獎勵,如果它犯了錯誤,則得到負強化,這些模擬使得數百天的比賽被壓縮到了幾個小時。
然後在現實世界中,機器人的機載攝像頭、傳感器和執行器使它能夠應用它所學到的數字技術,並在更複雜的現實中磨練這些技能。
DribbleBot通過試驗和錯誤以及獎勵來學習
麻省理工學院教授、CSAIL首席研究員、Improbable人工智能實驗室主任Pulkit Agrawal說:”如果你今天看看周圍,大多數機器人都是有輪子的。但想像一下,有一個災難場景,洪水,或地震,我們希望機器人在搜索和救援過程中協助人類。我們需要機器走過不平坦的地形,而有輪子的機器人無法穿越這些地貌。研究腿部機器人的全部意義在於走當前機器人系統所不能走的地形。我們為腿部機器人開發算法的目標是在具有挑戰性的複雜地形中提供自主性,這些地形目前是機器人系統無法企及的。”
這項研究將在2023年5月29日開始的倫敦IEEE國際機器人和自動化會議(ICRA)上發表。