「地表最強」人形機器人亮相:視覺+語音推理能力每天打工20多小時
獲得微軟、英偉達、OpenAI投資的人形機器人明星企業Figure如期發布最新人形機器人Figure 02。基於機載算力和各個組件的全方位升級,AI人形機器人朝著「進廠打工」又邁進了一大步。
順便一提,隨著人工智慧大模型的飛躍式發展,這款被不少媒體稱為「地表最強人形機器人」的AI設備,也已經具備視覺推理和聊天溝通的能力——操作機器人的默認UI就是語音控制。
新產品有哪些亮點?
與2023年發布的第一代產品相比,Figure 02最為明顯的區別在於外觀的徹底重構——機器人完全採用外骨骼結構(由外皮承擔負載和壓力),機器人的電源和算力佈線集成在機體內部,因而提高了機器人的可靠性,也使得封裝更加緊實。
(兩代產品外觀差異顯著,來源:Figure)
Figure的創辦人兼執行長 Brett Adcock 透露,為了這個設計,該公司也重新客製化了電線端子和連接器。
當然,人形機器人最關鍵的升級點,依然是如何從一堆電線、晶片和演算法,拼出一個活靈活現的「打工(機器)人」。
公司揭露,Figure 02身上總共裝了6個RGB攝像頭,分別位於頭部、胸前和後背,因此這個機器人也擁有「超人」視覺。
配合輸入的影像資料,機器人能夠透過AI驅動的視覺系統感知和理解真實的物理世界。 Figure 02配備了機載的視覺語言模型(VLM),使其能夠進行快速的常識性視覺推理。
愛德考克表示,相較於上一代產品,Figure 02的機載運算和AI推理能力翻了3倍,使得許多真實世界的AI任務能夠完全自主執行。該公司的AI數據引擎將持續提供最新的模型,供機器人在本地GPU上運作。
除了視覺以外,Figure 02也搭載了公司投資人OpenAI專門訂製的語音到語音推理模型,透過機上麥克風和揚聲器與人類進行對話。愛德考克也透露,這個機器人的預設UI是語音。
雖然在Google和OpenAI的較勁升級後,AI即時語音聊天不再是奪人眼球的新鮮功能,但對於人形機器人而言,應用這項技術仍有重大的意義。畢竟這個70公斤的大鐵塊,遲早有一天將會與人類在同一個屋簷下“打螺絲”,能夠響應語音指令,將會是人類重要的安全工具。
在投資人最關心的連結器等方面,Figure並沒有給予明確的訊息。公司僅表示,Figure 02上搭載的第四代機械手具備16自由度,擁有與人類相當的力量,能夠完成許多近似人類的工作。同時整個機械手的機械、電器、控制和感測器設計,都是由公司內部完成的。
最後,這台機器人還有一個不怎麼起眼但很重要的升級,機器人內部的電池組容量提高了50%至2.25KWh。愛德考克解釋稱,這個設計旨在最大限度地延長機器人的運行時間,該公司希望Figure 02能夠實現每天實際有效的工作時間超過20小時。
值得一提的是,公司官網的參數說明一欄中,顯示Figure 02的續航時間只有5小時。合理推論愛德考克提供的應該是「充電+工作」的極限工作時間。
稍有遺憾的是,Figure公司目前並沒有廣泛推出Figure 02的時間表,僅暗示各位吃瓜群眾不要把想像力局限在「機器人進廠打螺絲」上。該公司表示,Figure 02將人類形態的靈巧性與先進的人工智慧相結合,可以在商業應用中執行各種任務,並且在不久的將來,還可以在家中執行各種任務。
已經“進廠”
作為發布前的試驗,<span id=usstock_BMWYY>BMW汽車的組裝廠已經接納過一批Figure 02「實習工人」。除了主動執行汽車組裝的程序外,AI也能自動辨識並修正已習得行為習慣的錯誤。
寶馬集團也在周二發表公開聲明稱,Figure 02在美國斯帕坦堡工廠試運行期間,從事的是將鈑金部件插入特定裝置的工作,機器人必須特別靈巧才能完成這個工作。 BMW集團表示,使用機器人可以避免員工從事不符合人體工學的笨拙、累人任務。集團正在與Figure一起測試和評估,如何在汽車生產中安全地使用人形機器人。
(圖片來源:寶馬官網)
BMW集團生產管理委員會成員Milan Nedeljković表示,透過早期的測試,雙方現在正在確定人形機器人在生產中的可能應用。