DeepMind新型AI模型可協助機器人執行實體任務甚至不需訓練
Google DeepMind 正在推出兩個新的人工智慧模型,旨在幫助機器人”執行比以往更廣泛的現實世界任務”。 第一個模型名為”雙子座機器人”(Gemini Robotics),它是一個視覺-語言-動作模型,能夠理解新的情況,即使沒有經過訓練。

雙子座機器人基於雙子座2.0(Google旗艦人工智慧模型的最新版本)建構。 在一次新聞發布會上,Google DeepMind 高級總監兼機器人技術主管卡羅琳娜-帕拉達(Carolina Parada)說,Gemini Robotics”借鑒了Gemini 對多模態世界的理解,並通過添加物理動作作為一種新的模態,將其轉移到現實世界中”。
新模型在三個關鍵領域取得了進步,Google DeepMind稱,這三個領域對於打造有用的機器人至關重要:通用性、互動性和靈巧性。 除了概括新場景的能力外,”雙子座機器人”還能更好地與人和環境互動。 它還能執行更精確的物理任務,例如折疊一張紙或取下一個瓶蓋。

Google DeepMind 的全新雙子座機器人模型讓機器人更加靈巧。
帕拉達說:”過去,我們在這些領域中的每一個領域都單獨取得了進展,而現在,我們正在用一個單一的模型[大幅]提高所有三個領域的性能。這使我們能夠製造出能力更強、反應更靈敏、對環境變化更穩健的機器人。”
Google DeepMind 也推出了雙子座機器人-ER(即具身推理),該公司將其描述為一種先進的視覺語言模型,能夠”理解我們複雜多變的世界”。
正如帕拉達解釋的那樣,當你在打包午餐盒時,面前的桌子上擺放著各種物品,你需要知道所有東西的位置,以及如何打開午餐盒、如何拿取物品、放在哪裡。 這正是雙子座機器人-ER 需要完成的推理工作。 它的設計目的是讓機器人專家與現有的底層控制器(控制機器人運動的系統)連接,使他們能夠啟用Gemini Robotics-ER 支援的新功能。

Gemini Robotics 也能幫助機器人執行一系列任務。
在安全性方面,Google DeepMind研究員維卡斯-辛德瓦尼(Vikas Sindhwani)告訴記者,該公司正在開發一種”分層方法”,並補充說,雙子座機器人-ER模型”經過訓練,可以評估在特定場景下執行潛在動作是否安全”。 該公司還發布了新的基準和框架,以幫助人工智慧產業進一步進行安全研究。 去年,Google DeepMind 推出了”機器人憲法”,這是一套受艾薩克-阿西莫夫(Isaac Asimov)啟發而製定的機器人規則。
Google DeepMind 正與Apptronik 合作”打造下一代仿人機器人”。 Google DeepMind 也允許”可信任測試人員”存取其Gemini Robotics-ER 模型,包括Agile Robots、Agility Robotics、Boston Dynamics和Enchanted Tools。 “Parada說:”我們非常專注於建構能夠理解物理世界並在物理世界中採取行動的智慧。我們非常高興能夠在多種體現和多種應用中利用這一點。 “