Meta發布可模擬真實環境的Habitat 3.0 用於AI智慧機器人訓練
Meta Platforms 基礎人工智慧研究團隊的研究人員今天表示,他們將發布更高級版本的人工智慧模擬環境Habitat,該環境用於教導機器人如何與物理世界互動。
在推出Habitat 3.0 的同時,該公司還宣布發布Habitat 合成場景資料集(Habitat Synthetic Scenes Dataset),這是一個由藝術家撰寫的三維資料集,可用於訓練人工智慧導航代理;同時也發布了HomeRobot,這是一個經濟實惠的機器人助手軟硬體平台,可在模擬和真實環境中使用。
FAIR的研究人員在一篇部落格文章中解釋說,新發布的產品代表了他們在”具身人工智慧”方面的不斷進步。他們所說的”具身人工智慧”是指人工智慧代理能夠感知環境並與其互動,與人類夥伴安全地共享環境,並在數位和實體世界中與人類夥伴交流並為其提供幫助。Habitat 是一個虛擬環境目錄,如辦公空間、住宅和倉庫等,可用於訓練和改進人工智慧機器人在現實世界中的導航能力。其中的虛擬環境是利用紅外線捕捉系統精心建造的,該系統可以精確測量桌椅甚至書籍等物體的形狀和大小。在這些環境中,研究人員可以訓練機器人完成複雜的、多步驟的任務,這些任務需要機器人具備觀察和理解周圍環境的能力。Habitat 3.0 在這些現有功能的基礎上,同時支援機器人和人形化身,使人類和機器人能夠在許多不同的任務中進行協作。例如,人類和機器人可以共同清理客廳或在廚房準備食譜。FAIR表示,這為研究人類與機器人在各種現實任務中的協作開闢了新途徑。FAIR 表示,”Habitat 3.0″中的人類化身非常逼真,步態和動作自然,可以實現最逼真的低級和高級互動。研究人員寫道:”人類和機器人在模擬環境中的這種共處,使我們首次能夠在類似家庭環境的人形化身面前學習機器人人工智慧策略,並在日常任務中與真人一起評估這些策略。”FAIR表示,”Habitat 3.0″將把機器人人工智慧代理的學習時間從幾個月甚至幾年縮短到幾天。它還能在安全的模擬環境中更快速地測試新模型,而不會有任何風險。棲息地合成場景資料集(Habitat Synthetic Scenes Dataset)被稱為H SSD -200,它也將有助於加速人工智慧的研究,因為真實世界場景的三維模擬對於訓練至關重要。FAIR 解釋說,HSSD-200 優於其先前提供的資料集,因為三維場景比以前更準確地反映了物理世界的場景。它由211 個高品質的三維場景組成,這些場景複製了現實世界中的房屋和其他環境,並包含466 個語義類別中的18,656 個物理世界物體模型。據FAIR 稱,HSSD-200 提供了與WordNet 本體相對應的細粒度語義分類,同時其資產壓縮功能可實現更高性能的體現式人工智慧模擬。單一物件均由專業3D 藝術家製作,在外觀和尺寸上與真實世界品牌的家具和電器精確匹配。最後,FAIR 引入了一個新的HomeRobot 庫,這是一個硬體和軟體規範,供希望創建實體機器人的研究人員使用,以便將他們在Habitat 中訓練的模型應用於物理世界。HomeRobot 基於用戶友好的軟體堆疊和經濟實惠的硬體組件,這意味著可以快速、輕鬆地進行設置,並為實際測試做好準備。它是專為開放詞彙移動操縱研究而設計的,移動操縱是指機器人能夠在任何看不見的環境中拾取物體並將其放置到指定位置。要做到這一點,機器人必須能夠感知和理解它們遇到的新場景。Constellation Research Inc.的霍爾格-穆勒(Holger Mueller)說,Meta公司的聲明表明,該公司取得了超越生成式人工智慧炒作的真正進展,其強大的軟體可用於在虛擬世界中訓練和測試智慧機器人。他說:”Habitat 3.0 現在的重點是人機交互,因為這是一個關鍵的里程碑,如果我們要製造能夠在日常生活中發揮作用的機器人,就必須完善人機交互。HSSD-200數據集非常有用,因為在這些環境中產生物理物件的成本很高,而且需要大量時間。”FAIR表示,這些開發成果還有很多。它正在進行的體現式人工智慧研究下一步將重點放在機器人如何在動態、不斷變化的環境中與人類協作,以反映我們所處的真實世界。研究人員解釋說:”在下一階段的研究中,我們將使用Habitat 3.0 模擬器來訓練我們的人工智慧模型,以便這些機器人能夠協助人類夥伴並適應他們的喜好。我們將結合Habitat 3.0 使用HSSD-200 ,收集有關大規模人機互動和協作的數據,從而訓練出更強大的模型。我們將重點把在模擬中學習到的模型部署到物理世界中,以便更好地衡量它們的性能。”