人類幼兒正在啟發機器人學習的新方法
數十年來,各組織一直在構建複雜的數據集,並不斷探索不同的方法來教授系統執行新任務。在部署能夠快速適應和學習的技術方面,我們似乎正處於實現真正突破的邊緣。去年,我們看到了大量引人入勝的研究。就拿卡內基梅隆大學在今年6 月展示的VRB(視覺機器人橋)來說,該系統能夠將從YouTube 視頻中學到的知識應用到不同的環境中,因此程序員不必考慮每一種可能的變化。 上個月,Google的DeepMind 機器人團隊展示了RT-2(機器人變形金剛2),令人印象深刻。該系統能夠抽像出執行任務時的細枝末節。在所舉的例子中,讓機器人扔掉一個垃圾,並不需要程序員教機器人識別特定的垃圾、撿起來並扔掉,就能完成一項看似簡單(至少對人類而言)的任務。 CMU 本週重點介紹的其他研究將其工作與人類的早期學習進行了比較。具體來說,機器人人工智能代理被比作三歲的幼兒。從上下文來看,學習水平分為兩類–主動學習和被動學習。在這種情況下,被動學習是指通過向系統播放視頻或在上述數據集上進行訓練,教它執行任務。主動學習則如其所言–去執行一項任務並不斷調整,直到正確為止。RoboAgent 由CMU 和Meta AI(沒錯,就是那個Meta)聯合開發,它將這兩種學習方式結合在一起,就像人類一樣。在這裡,這意味著通過互聯網觀察正在執行的任務,並通過遠程遙控機器人的方式進行主動學習。據該團隊介紹,該系統能夠從一個環境中吸取經驗,並將其應用到另一個環境中,這與上文提到的VRB 系統類似。CMU機器人研究所的Shubham Tulsiani說:”具有這種學習能力的代理讓我們更接近於一種通用機器人,它可以在不同的未知環境中完成各種任務,並隨著積累更多經驗而不斷發展。RoboAgent 可以使用有限的域內數據快速訓練機器人,同時主要依靠互聯網上大量可用的免費數據來學習各種任務。這可以讓機器人在家庭、醫院和其他公共場所等非結構化環境中發揮更大的作用”。所有這一切中最酷的一點是,該數據集是開源的,可以普遍訪問。它還可以與現成的機器人硬件一起使用,這意味著研究人員和公司都可以利用並建立一個不斷增長的機器人數據和技能庫。機器人研究所的阿比納夫-古普塔(Abhinav Gupta)說:”與其他公司相比,RoboAgents 的技能複雜性要豐富得多。我們已經展示了比現實世界中任何單一機器人代理所能實現的更多樣化的技能,其效率和對未知場景的泛化規模都是獨一無二的。”在構建和部署多用途機器人系統方面,這一切都大有可為,有望最終成為通用機器人。我們的目標是創造出一種技術,能夠超越我們在提到工業機器人時往往會想到的高度結構化環境中的重複性機器。當然,實際應用和擴展說起來容易做起來難。說到這些機器人學習方法,我們更接近於起步階段,但對於新興的多用途系統來說,我們正在經歷一個令人興奮的時期。