馬斯克的通用人形機器人招來群嘲 學者:先像人手一樣抓取吧
矽谷「鋼鐵俠」馬斯克又放大招:Tesla Bot——身高1.72米,體重56公斤,身材苗條,外形優美。 馬斯克在PPT上說,Tesla Bot的原型機(prototype)明年就要來了。 不過,外界的群嘲來得更快——知名科技媒體The Verge對此標題便是:《別想太多,馬斯克的Tesla Bot就是個笑話》。
當下,從真實應用場景出發設計的機器人,執行抓取任務的看起來像機械臂,能跑起來的四足機器人看起來像狗。 即使強如波士頓動力,設計出來的機器人Atlas也是手長腿短,頭重腳輕——它身高150cm,體重86公斤,與其說像人,不如說像黑猩猩。
波士頓動力家族機器人合影
Tesla Bot
波士頓動力的Atlas可以5. 4Km/h的速度移動。 而Tesla Bot可以8km/h速度運動,這意味著Tesla Bot不僅更好看,運動性能還更好。 另外,波士頓動力的機器人是沒有手指的。 而Tesla Bot則有一雙「美手」。。
不僅外觀像人,馬斯克還想讓這個機器人像人一樣具有”通用智慧”。 一位卡內基梅隆大學的人工智慧和機器人學博士接受澎湃新聞採訪時表示:”現代的人工智慧基於學習演算法,但是目前在機器控制領域這些演算法的效果還難以令人滿意,從這個角度說,一個可以在明年發佈的’通用’機器人肯定不會像人們期待的和終結者一樣先進。 ”
這位卡內基梅隆大學的人工智慧和機器人學博士表示,”從另外一個角度說,機器人領域的硬體和演算法是高度相關的,在關節控制、手部精細操作、視覺資訊理解等幾乎所有的技術細節上,現在的硬體層面上也有太多要攻克的難題。 在現在的學術界和業界發展狀況下,『特斯拉能否在明年發佈一個通用人形人工智慧機器人』還不應該是一個可以被嚴肅討論的問題。 除非特斯拉重新定義了『通用人形人工智慧機器人』。 不過在嚴肅的科研攻關和學術討論之外,馬斯克把這些技術領域的願景帶入公眾的視野,從星鏈計劃、完全自動駕駛到移民火星,都是如此。 我覺得長期來看這種技術討論的大眾化是有它的正面作用的。 ”
其實,就運動能力來說,要在一年內做出已經很難。 工程類知名學術期刊 IEEE Spectrum 的Evan Ackerman表示,「像波士頓動力公司和敏捷機器人公司這樣的公司幾十年來一直在研究可以在人類環境中導航的機器人,但這仍然是一個非常困難的問題。 我不知道為什麼馬斯克認為他可以突然做得更好。 ”
CNN(美國有線電視新聞網,Cable News Network)稱伊隆·馬斯克又向其長長的”明年”就發佈清單中增加了一項(標題為《Elon Musk just added a robot to his list of things always coming ‘next year.’ For now he’s got a guy in a suit》)。 報導中指出,雖然馬斯克在特斯拉和SpaceX中的工作顛覆了汽車和航太業,但他也以錯過最後期限和過度承諾聞名。
彭博社分析,馬斯克常常在僅僅有原型的時候就公開產品——基本是在一個想法成為實際產品前就售賣它。 2017年的11月,特斯拉公開了他們的Semi卡車,但該車最早要被推遲到2022年上市,部分原因是製造更大的電池面臨挑戰。 華爾街風投機構Loup Ventures知名分析師Gene Munster表示,「伊隆有遠大的願景。 對投資者來說,特斯拉機器人是他們可以發揮想像的新事物,D1晶元更具實質意義,但對於大多數投資者來說卻很無聊。 ”
當天現場,特斯拉CEO馬斯克通過幾張PPT介紹了Tesla Bot的基本情況:機器人面部是一個顯示幕,顯示幕背後是多個攝像頭,手部達到人類水準(Human-level hands)。
機器人面部配備了特斯拉在自動駕駛中使用的Autopilot攝像頭充當感知系統,胸腔里內置FSD自研晶元。 Tesla Bot可以8km/h的速度運動,提起約20公斤的重物,有約68公斤的硬舉能力。 特斯拉已有的多攝像頭神經網路、規劃能力、標記能力都會應用到Tesla Bot中。
馬斯克在8月20日的特斯拉AI日上稱,Tesla Bot將用來處理”無聊、重複和危險的工作”,比如讓機器人幫忙跑雜貨店拿東西,目標將是用於通用機器人的人工智慧技術。 在他們的計劃中,Tesla bot將會達到和人類的尺寸以及重量相近的物理特性,並且會具有用於自動駕駛的相機系統和計算單元。
馬斯克簡短介紹完Tesla bot不久之後,一位形似日本超級變變變的演員穿著緊身衣就在舞臺上尬舞起來,除了開頭登臺是機械舞,之後不知道是什麼舞蹈。 馬斯克笑著說,「演員不是真正的機器人,但特斯拉機器人將是真實的。 ”
對於特斯拉所稱的將於明年發佈Tesla Bot的前景如何,上海交通大學副教授馬道林在接受澎湃新聞採訪時表示,發佈機器人硬體樣機本身,一定可以實現。 真正的難度在於這個機器人能做什麼,而對於這方面特斯拉並沒有承諾什麼。 “我個人覺得他們是開了一條嶄新的任務線,馬斯克口中承諾的是一年後拿出Tesla Bot樣機(Prototype)。 通常樣機的核心功能是做概念驗證,並不會期待它能真的去執行多麼複雜的任務。 在前期積累的基礎上經過未來一年的持續研發,我猜測,他們拿出來的應該是一款可以慢慢走並和觀眾招招手、點點頭和顯示笑臉的產品。 ”
馬道林進一步解釋,特斯拉的技術長處除了硬體製造之外,很大程度在於基於人工智慧的導航(Navigation)能力,特斯拉會將自動駕駛汽車所具備的對周圍環境的三維重建和感知以及決策能力移植到機器人上。
“在能做什麼方面,我估計他們一定會突出導航和移動能力,比如說通過讓機器人所在的房間或商店很複雜來展示他們強大的導航能力,而弱化甚至於不展示操作能力。” 馬道林預計,「理想情況下,明年的demo會正如馬斯克所舉例的那樣,演示人員說」去某某地方把某某物品拿給我『,Tesla Bot通過語音識別理解了這一任務,導航並走到那裡,以簡單的方式拿到物品並送到演示人員面前。 演示結束。 ”
一位在機器人和人工智慧領域發表了多篇高影響力論文的機器人抓取和操控(Grasping and manipulation)領域的資深研究者向澎湃新聞(www.thepaper.cn)表示:”從物體抓取操作(grasping / manipulation)的角度來說,基於五指的演算法都還不成熟,機器人領域的演算法都是跟機械結構適配的,連硬體都沒有的時候,對相關演算法的討論是沒法進行的。 我不認為Tesla在明年可以發佈人們期待的通用人形機器人,馬斯克的這個專案很可能會一直擱置下去。 ”
“只能說那是一種願景,人類覺得一個足夠智慧的機器人應該可以被造的和人外觀類似,但是為了實現這個目標,需要做的還有很多。 另外,為了讓他『像人』有時候需要付出額外的努力,現在在感測器、感知演算法、控制演算法、機器人硬體等領域的差距還很遠。 馬斯克在發佈會上沒有介紹相關細節,我只能從我了解的情況判斷,明年發佈的機會應該是不大的,或者說可以發佈的東西和一些公眾基於科幻做出的想像是有很大落差的,”一位美國頂尖大學機器人領域教授表示。
雖然對於特斯拉所說的能在明年發佈通用人形機器人並不看好,但馬道林認為,”不管怎麼說,更多的大型科技公司進入機器人領域,利用其強大的工程和製造能力刷新硬體製造的海平面,對這一領域的研究和發展都是很好的事情,讓我們拭目以待吧! ”
馬道林本科和博士畢業於北京大學,後進入麻省理工學院進行博士後研究,並於去年加入上海交通大學船舶海洋與建築工程學院擔任副教授。 馬教授的論文”基於觸覺測量的相對運動跟蹤和外部接觸感知” (Extrinsic Contact Sensing with Relative-Motion Tracking from Distributed Tactile Measurements)於今年的機器人領域頂級會議ICRA上獲得最佳論文獎。
以下為馬道林接受澎湃新聞採訪實錄:
澎湃新聞:週五的Tesla AI Day中,馬斯克表示,將”自動駕駛”和其他技術結合,遷移到人形機器人身上是順理成章的。 您認同這個通往通用人形機器人的路徑嗎? 相較於自動駕駛等技術,實現人形機器人的獨有的難點有哪些?
馬道林:特斯拉,是一家智慧設備硬體科技公司,這個通往通用人形機器人的路徑,我的理解,一是特斯拉有優秀的硬體工程師和一流的加工工廠,他們擅長去製造機器人所需的電池、驅動電機、感測器等硬體,這些公司運用已知技術做起硬體反覆運算來可以遠遠比大學實驗室更強大;二是,特斯拉有在自動駕駛領域積累的強大的人工智慧計算硬體和演算法基礎,特斯拉自動駕駛汽車所具備的基於視覺對周圍環境的重建和感知能力,可以輕鬆地移植到機器人上,去輔助機器人的導航和決策。 三是,技術之外,特斯拉現在很有錢,而且在全球新能源政策走向的支援下,未來也十分看好,不差錢,對他們來說,燒點錢做些高風險但有很大媒體關注度的事情,應該挺划算。
從學術界的進展來看,人形機器人的難點還是很多的。 一方面是硬體設計方面,雖然波士頓動力已經展示了很強大的硬體設計,但世界上似乎還沒有另外一家公司的人形機器人能接近波士頓動力。 雖然人們早就知道如何去實現幾十個關節的運動結構設計,但是在驅動方面,有著大量的工程和技術挑戰,這幾十個關節所需要的驅動器有多種不同大小或規格,在許多關節處的驅動結構在結構體積受到限制的情況下還要滿足扭矩和速度方面的苛刻需求,難度不小。 波士頓動力在液壓驅動方面的造詣恐怕是其他公司所望塵莫及的。 而另一方面是運動平衡。 和四足機器人不同的是,人形機器人兩條腿在運動中需要兩條腿交替支撐,一旦其中一條腿的節拍跟不上就會摔倒。 因此人形機器人更多地要在運動中實現自身的動態平衡,而在移動或執行操作任務中保持如此複雜多體系統的動態順滑的自平衡,是很有挑戰性的規劃和控制問題。 2015年DARPA機器人挑戰賽中機器人屢屢跌倒的現狀給許多人留下了深刻的印象。
澎湃新聞:目前對人形機器人一個很重要的期待是手部的精細操作,這和馬老師你在機器觸覺領域的研究息息相關。 今年您在ICRA上獲得的best paper也是這個領域的成果,請問這個領域目前的困難有哪些呢?
馬道林:前面還只是說了人形機器人的移動或運動問題,要讓人形機器人對人類有用,很大程度上要依賴於解決機械手精細操作或者說靈巧操作問題。 把機械手靈巧操作作為一個獨立的機器人子系統來理解的話,要解決的問題要包含硬體驅動,感感與感知,以及規劃與控制這三個方面。 其中,硬體設計是基礎,也是相對來說最容易理解並進行仿生設計的部分;但另外的兩個方面則還困難重重。
對於感感和感知部分。 我們今年在ICRA上發表的工作,是解決了觸覺感測和感知方面的一個重要問題,實現了對手中物體運動狀態的精確跟蹤和對物體外部接觸的定位感知,我們期待在未來的工作中將觸覺感知和與現在業已取得巨大進展的視覺感感和感知相結合,為機器人操作提供較為完備的感知資訊。
而對於精細操作所需的規劃和控制,相對於人們的期待,目前大家的研究還只是嬰兒階段,有相當長的路要走。 這裡面的挑戰既有硬體不完備帶來的研究限制,更有來自於操作問題本身的難度。 首先,機器人操作要解決的問題是通過對機械手自身的控制,調節手中物體與外界(各種並不規則的)環境的接觸行為,以實現物體位姿或物體與環境相互關係的改變,在問題複雜度上顯著高於機器人行走問題。 其次是機器人操作的任務包羅萬象,從研究的角度也很難找到一個操作任務去代表所有任務,難以找到理想的benchmark問題並攻關解決。 最後,機器人操作,非常關鍵的是各種操作中接觸行為的理解和利用。 多關節的手指、手掌以及外部環境,甚至於胳膊和身體等,處處都可以和物體發生接觸,需要理解和預測這些接觸行為對物體運動狀態的影響並妥善加以合理利用,這是非常複雜和困難的規劃任務。 而且,在這些規劃和控制中,還要與我們前面提到的觸覺感測和感知能力以及視覺感測和感知能力相結合,才可以形成完整的控制閉環。
澎湃新聞:特斯拉給出了在一年內發佈「通用人形機器人」Tesla bot的時程表,您覺得這麼短的時間內完成這個目標是可能的么?
馬道林:我個人覺得他們是開了一條嶄新的任務線。 馬斯克口中承諾的是一年後拿出Tesla Bot樣機(Prototype)。 通常樣機的核心功能是做概念驗證,並不會期待它能真的去執行多麼複雜的任務。 在前期積累的基礎上經過未來一年的持續研發,我猜測,他們拿出來的應該是一款可以慢慢走並和觀眾招招手、點點頭和顯示笑臉的產品。 特斯拉的技術長處除了硬體製造之外,很大程度在於基於人工智慧的Navigation能力,也就是導航,特斯拉會將自動駕駛汽車所具備的對周圍環境的三維重建和感知以及決策能力移植到機器人上。 我預計,理想情況下,明年的demo會正如馬斯克所舉例的那樣,演示人員說”**,去某某地方把某某物品拿給我”,Tesla Bot通過語音識別理解了這一任務只會,導航並走到那裡,以簡單的方式拿到物品並送到演示人員面前。 演示結束。
所以,發佈機器人硬體樣機本身,是一定可以實現的。 因為問題的真正難度在於這個機器人能做什麼事,特斯拉也沒有承諾什麼。 在這方面,我估計他們一定會突出導航和移動能力,比如說通過讓機器人所在的房間或商店很複雜來展示他們強大的導航能力,而弱化甚至於不展示操作能力。 但不管怎麼說,更多的大型科技公司進入機器人領域,利用其強大的工程和製造能力刷新硬體製造的海平面,對這一領域的研究和發展都是很好的事情,讓我們拭目以待吧!