生成式人工智慧讓機器人離通用目標又更近一步
大多數關於仿人機器人的報道都集中在硬體設計上,這是可以理解的。鑑於仿人機器人的開發者們經常把”通用型仿人機器人”這句話掛在嘴邊,我們應該更多地關注第一點。經過幾十年單一用途系統的發展,向更通用系統的跳躍將是一個大問題。只是我們還沒到那一步。
研究人員一直在努力開發一種機器人智能,使其能夠充分利用雙足仿人設計所帶來的廣泛運動能力。在機器人技術中使用生成式人工智慧也是近期的熱門話題。麻省理工學院的最新研究表明,後者可能會對前者產生深遠影響。
在通往通用系統的道路上,最大的挑戰之一就是訓練。我們已經掌握了培訓人類從事不同工作的最佳方法。機器人技術的方法雖然前景廣闊,但卻支離破碎。有許多有前景的方法,包括強化學習和模仿學習,但未來的解決方案可能會涉及這些方法的組合,並透過生成式人工智慧模型加以增強。
麻省理工學院團隊提出的主要用途之一,就是從這些小型特定任務資料集中整理相關資訊的能力。這種方法稱為策略合成(PoCo)。任務包括有用的機器人動作,如敲釘子和用鍋鏟翻轉東西。
團隊指出:”[研究人員]訓練一個單獨的擴散模型,學習一種策略或政策,利用一個特定的資料集完成一項任務。然後,他們將擴散模型學習到的策略組合成一個通用策略,使機器人能夠在各種環境下執行多項任務。
根據麻省理工學院公佈的數據,採用擴散模型後,任務表現提高了20%。這包括執行需要多種工具的任務的能力,以及學習/適應陌生任務的能力。該系統能夠將來自不同資料集的相關資訊整合到執行任務所需的行動鏈中。
“這種方法的好處之一是,我們可以將政策結合起來,以獲得兩個世界的最佳效果,”論文的第一作者王立瑞說。 “例如,在真實世界資料基礎上訓練的政策可能會更靈巧,而在模擬基礎上訓練的政策可能會更通用”。
這項具體工作的目標是創建智慧系統,使機器人能夠交換不同的工具來執行不同的任務。多用途系統的普及將使該行業離通用夢想更近一步。