特斯拉Optimus 機器人進展:已經生產數百台、還擰不好螺絲
「就算我明天被外星人綁架,特斯拉也會解決自動駕駛問題。但我不知道特斯拉怎麼在Optimus 上贏。」今年4 月的財報會上,馬斯克給他該拿500億美元薪酬的理由。
文丨賀乾明李梓楠
編輯丨賀乾明黃俊傑
一位接觸過特斯拉團隊的人告訴我們,在馬斯克說這番話前不久,他就要求人形機器人團隊在今年內拿出有意義的突破——讓機器人能上產線完成部分工作,如果達不到就進一步裁員,「團隊承受的壓力越來越大」。
我們得知,Optimus 人形機器人目前已經生產數百台,但還不到可以上產線工作的狀態,目前只能用來收集數據、測試不同的設計方案。
這個2021 年開始推進的人形機器人計畫與特斯拉開發其他產品的邏輯截然相反。造車,特斯拉從高利潤的電動跑車Roadster 起步,逐步提升生產效率,打造便宜的Model 3。自動駕駛也是從低到高,邊賣邊提升。
而在人形機器人上,馬斯克要一步到位,量產就得是終極形態:成本低到2 萬美元以內——低於一個美國藍領的年收入;但足夠智能,能替代一部分工人的工作。
過去3 年,馬斯克公開場合中談論Optimus 的次數迅速追上自動駕駛、Robotaxi,將其視為撐起特斯拉估值的希望,「如果我們擁有具備感知能力的人形機器人,能根據要求執行任務,生產力會大幅提高,經濟成長就不存在限制。
中國的股市已經炒作了幾輪特斯拉機器人供應鏈概念股,但馬斯克的宏偉故事並沒有怎麼提振特斯拉的股價。自2022 年的高點以來,特斯拉的市值已經跌掉近40%。
特斯拉機器人團隊面前的挑戰是,一步到位造出像人一般行動的機器人基本上不可能。目前他們只能採取一些工程上的妥協,可能針對特定的工作場景,例如擰螺絲,專門訓練模型,讓人形機器人先發揮一部分作用。至於妥協的結果馬斯克能不能接受,還不得而知。
最大的困難:造人,而不是造人形機械裝置
根據《馬斯克傳》,2021 年初,馬斯克在特斯拉高管會上播放了波士頓動力人形機器人Atlas 的視頻,畫面中人形機器人可以像人一樣,靈活完成高難度動作。他告訴參會的高管,“不管你喜不喜歡,人形機器人都會出現。我們應該入局。”
他的目標很明確:必須是一款人形,而且體態和人一樣的機器人,而不是波士頓動力公司或其他公司造的四條腿或帶輪子的機械裝置。而且機器人得像人一樣以視覺觀察學習,學會用手完成工作,而不是像波士頓動力或傳統的機械手臂公司那樣,讓工程師預先輸入每一行工作指令。
波士頓動力2020 年底發布Atlas 機器人影片。來源:波士頓動力。
先前的機器人都針對專門場景設計,導致不夠通用,產能有限。根據國際機器人聯合會數據,2023 年,全球工業機器人的總銷售量只有59 萬台——大約是勞力士手錶產量的一半。這59 萬台還是至少數十種互不通用的專門型態,大部分年產幾百台,完全沒有規模經濟。
現在所有人形機器人公司都在講特斯拉機器人的故事:我們的工作場所和工具都是為人而設計。如果人形機器人成真,不需要客製化開發,就能以一套硬體完成多種任務,大規模生產同一種型號就有了可能。馬斯克談論人形機器人專案時,經常把規模掛住嘴邊,要生產百萬台、千萬台,甚至十億台,「量產對於人形機器人來說同樣重要,這樣才能做到不那麼貴。 」
差別在於,沒有幾家家庭機器人公司在堅持做人形,它們通常選擇折中路線,用各種夾具替代人手或用輪子替代雙腿,先解決一部分問題、產生部分商業價值,再一步步向人形迭代。
但馬斯克不妥協。在每週召開的人形機器人討論會上,他拒絕了大量不像人的設計方案,例如在機器人手臂上裝不同的工具,執行不同任務,他認為只用手就足夠了。
特斯拉的工程師還覺得機器人的小拇指沒什麼用,但因為拿掉小拇指「太驚悚」、太不像人,保留了下來,替代方案是延長小拇指長度,讓它能發揮更多作用。馬斯克也非常具體地要求,機器人的手指要有女性手指的錐度。他設定機器人身高為5 英尺8 英寸高(接近1 米73),比美國成年男性平均身高略矮;要求機器人看上去像雌雄同體的精靈,這樣“你就不會覺得它可能要傷害你”。
一位接觸過特斯拉團隊的投資人說,馬斯克對人形的堅持,是為了換掉限制汽車製造的最後一個環節──工人。那時特斯拉已經徹底擺脫產能地獄,去年賣出50 萬輛車,持續攀升的股價推動馬斯克成為世界首富。但特斯拉位於加州的汽車工廠每週生產8,550 輛車,逼近產能極限。特斯拉意識到工人的效率已經到達極限,想要更快,只能製造比人更強的工具。
汽車製造是自動化程度最高的工業生產工序之一。 1960 年代誕生的機械手臂,首要場景就是用到汽車工廠搬運、焊接零件。特斯拉的汽車工廠中,只有最後的組裝環節還需要大量工人參與,用他們的腿在工站中小範圍移動,用手組裝零件,或拿著電鑽擰螺絲等。想要取代他們,最根本的方法就是創造出類似的人。
如果機器人能透過機器學習的方式「理解」 如何運作,像人一樣行走、抬手完成特斯拉汽車工廠裡的工作,那它應該也能用在其他工作中,產生規模效應。這是一個自然的邏輯推導,只是裡面的每個前提都困難重重,三年下來,特斯拉的團隊甚至還沒有明確的實現路徑。
模糊的探索:如何用機械部件模擬人
特斯拉之前,全球的科學家已為製造一台能用的人形機器人研究了近50 年。他們面臨的任務從頭到尾都很容易理解,用金屬、塑膠、矽等材料模擬人的骨頭和血肉,創造出一個能像人一樣思考、運動的機器。
業界最有名的人形機器人是波士頓動力製造的Atlas,能後空翻、在不平整的草地上快速奔跑、在室內靈活跳舞。但波士頓動力在一開始就放棄製造人最獨特的兩個器官——手和大腦。 Atlas 能完成高難度動作,但僅限於提前設定好的動作,雙臂的末端是哆啦A 夢那樣的圓疙瘩。
特斯拉開發人形機器人時,最先做的就是人手。人手有27 個自由度、行動靈活,遍佈高敏感的觸覺神經,力控能力強大。
在早期的方案中,特斯拉為機器手裝了6 個驅動電機,讓Optimus 能握住大部分物體,但遠稱不上靈活。五根手指中,只有大拇指裝了2 個電機,能夠向內彎曲和左右搖擺,剩餘4 根手指只裝了能控制彎曲的單一電機搖擺。手部的每個驅動器上都有連著馬達的金屬線,馬達收放金屬線時手指會相應彎曲伸展。
第二代Optimus 的手目前只有11 個自由度。今年5 月,馬斯克聲稱今年內會將Optimus 手部自由度提升到22 個,並向人手靠近。現在特斯拉已經有了新一代機械手的方案。
但人手是血肉長在一起的,而不是像機器手那樣由不同的零件焊接或鉚接而成。人手在運動時,手腕不會碰撞前方的手掌,動力也不會在人手內部損耗,但這些問題可能在機器手上發生。機器手結構的整體性,關係到手部動作的穩定性和連貫性。特斯拉拿掉了Optimus 手部的諸多連桿裝置,改用電纜製成的繩驅來模仿人手肌肉組織,希望盡量減少機器手運動時產生的動力損耗和遲滯。
人類透過肢體變形和神經末梢收到的擠壓感知壓力,Optimus 則是透過致動器的電流大小測量壓力,執行器為Optimus 提供握住物體的動力,電流大小對應輸出的力量大小。人手有數以萬計的觸覺感測器,Optimus 的手只有6 個壓力感測器,而且無法感受溫度。
在腿部關節上,特斯拉採用了部分線性執行器,與傳統的旋轉執行器相比,線性執行器可以縱向佈局,最大限度利用腿部內部空間,佈置更大更長的電機,提供更大的推動力,第二代Optimus 的腿部執行器強度足以拉起一架半噸的鋼琴。但這樣做的壞處是,機器人腿部的平衡更難控制,控制演算法的開發難度也成倍上升。
在讓Optimus 走路之前,特斯拉還測量了人腿每個關節在行走時的傳動機制和每個關節的扭矩,讓Optimus 的動作盡可能像人。從結構上看,人的膝蓋是一個高效的四連桿裝置,四根骨頭加上骨頭的膝關節就能勝任走路、跳、下蹲等動作,並精確控制重心讓人保持平衡不摔倒。 Optimus 目前只能做到緩慢行走,還無法順利完成下蹲等動作。
數百根骨頭和數十個關節連接而成人體有超過200 個自由度,特斯拉簡化到Optimus 驅乾的28 個自由度。這些自由度由三種不同尺寸的旋轉致動器和三種線性致動器實現。旋轉致動器分佈在需要大角度旋轉的肩膀和髖部,線性致動器分佈在膝、肘等擺動角度小的部位。
每個執行器都配備絲槓、減速器、馬達、感測器和編碼器等部件。馬達為執行器提供動力,螺桿將部件旋轉的力轉化為拉伸的力,控制關節收縮和伸展;減速器的作用類似人類骨骼和關節的連接處,能透過槓桿作用放大力量。
提升身體自由度只是用Optimus 模擬人的第一步。特斯拉還在持續為Optimus 減重,這能讓它相同的功率下完成更多任務。第二代的Optimus 重量為56.6 公斤,輕於成人類。
要做好人形機器人,靈活、耐用、穩定且成本可控的硬體零件和材料只是基礎。例如人能接住移動的物體,是因為人腦對重力、加速度等物理規律有認知,因而能預判軌跡,身體又有運動能力,才能完成這個看似簡單的動作。
2022 年,特斯拉把汽車上的FSD(完全自動駕駛)中的機器視覺神經網路移植到Optimus 上。像教汽車開車那樣,讓Optimus 認識現實世界並做出適當的反應,讓它從人類的動作中學習並進步。
「自動駕駛是要求汽車在一個2D 世界裡避免碰撞任何物體,但機器人的任務是在3D 世界裡主動碰撞、接觸無窮多的事物。」一位接觸過特斯拉團隊的投資人說,整個自動駕駛需要面臨的技術複雜度還遠不如機器人的一隻手。
「更大的問題是機器人領域沒有Scaling Laws。」一位機器人領域投資人說,這是整個智慧機器人產業面臨的難題,一方面是他們找不到足夠多的資料訓練機器人模型,另一方面是沒有合適的模型架構能消化大量資料。
特斯拉從去年開始招募人類來當Optimus 的老師,明確要求身高在170cm-175cm 之間,與機器人相仿。這些人要帶著感應器遍佈全身的動作捕捉裝置,向機器人示範,人如何運用自己的關節進行活動。一些分析師猜測,特斯拉未來可能會從大量的影片中抽取人類運動的關鍵數據,餵給Optimus 學習,這或許能加快它的學習速度。
依照目前的進度,人形機器人要達到馬斯克的最低要求,去特斯拉的汽車工廠取代一部分工人,還需要漫長的學習和訓練。一位特斯拉分析師說,到今年年中,Optimus 在長度超過500 公尺的行走測試中通過率只有不到60%。
它的對手是時薪22 美元的美國得州小時工,這些工人基本上能在50 秒內完成拾取零件、找對位置完成組裝、複核質量等一系列複雜任務。這些人不會走500 公尺路就跌倒等人扶,能與其他人完成複雜的溝通、協作,他們還遠遠不是全球效率最高、薪資最低的工人。
馬斯克目前只能說出兩個Optimus 強於人類的地方,它比人類更認真,不開小差;它充滿電可以連續工作16 個小時。
超前的準備:概念階段就開始考慮量產
「(人形機器人)量產極度困難,是被低估的。」2021 年8 月的AI Day 召開時,特斯拉的人形機器人計畫還是一個概念,馬斯克就預示了即將面臨的困難。
設計人形機器人時,特斯拉的團隊正在尋找各種方法降低量產的成本和難度。根據《馬斯克傳》,一個典型的例子是如何讓機器手控制施加的壓力和感受壓力。
工程師提出了多種方案,例如用指關節中執行器的電流測量壓力,在指尖上放置類似手機觸控螢幕上用到的電容器,或是嵌入氣壓感測器或晶片,以及放置一個微型攝影機。
機器人產業慣常的做法是在人手的關節處安裝壓力感測器,這樣成本更高且更難造。
看到這些方案,特斯拉首席設計師馮霍爾茲豪森(Von Holzhausen)只提出了一個問題:成本上有什麼區別?最後確定的方案是用關節中的電流,因為不會增加零件-成本可控,容易生產。
特斯拉造車累積的經驗和資源,也遷移到了人形機器人計畫。人形機器人中的馬達、電池、軟體系統等,早期版本都是從電動車上類似的零件改造而來,後續也會用特斯拉建立多年的軟體基礎設施優化。
就像分析馬達如何驅動電動車在城市中穿行的那樣,他們用模擬系統,模擬人形機器人的28 個關節各自執行多種動作的性能,找出其中的共性,簡化成6 種單位成本和重量較低的方案。
現階段的Optimus 有許多顯而易見的問題。接近特斯拉的人士稱,軟體團隊還在想辦法用程式碼取代Optimus 腳踝上的兩個六維力感測器,它們笨重又昂貴,而且只給機器人的穩定性提供了部分冗餘。
對特斯拉來說,量產人形機器人最大的挑戰就是讓它有用,夠好用。目前特斯拉還未建成機器人流水線,只能手動組裝,單台機器人的造價約等於10 萬美元,但它現在能創造的價值微乎其微。
等開發完夠有用的機器人,特斯拉還要從頭開始建造一條低價的供應鏈。
人形機器人中使用的各種零件,整個產業雖然有生產經驗,但通常用在高端製造場景中,價格居高不下。例如滾珠螺桿一般用在造價高昂的重型機械或航太設備。特斯拉做了超前準備,機器人設計還沒定型,團隊就開始著手搭建低成本的供應鏈。
從2022 年中開始,特斯拉就開始讓中國的零件供應商送零件測試。其中比較有代表的是特斯拉電動車供應商拓普和三花智控,組裝執行器。它們是特斯拉長期供應商,供應車上的鑄鋁結構件。具體到零件層面,還有鳴志電器為特斯拉送樣機器人手用到的空心杯馬達、綠地諧波送樣了關節致動器中用到的諧波減速器等。
這些零件供應商最終能否進入特斯拉機器人產業鏈,仍有許多不確定性。成本是中國供應商的優勢。一位機器人領域分析師說,同一個零件,中國公司的價格至少比海外知名公司便宜30%,甚至有些會便宜80%。但雙方的性能還有不小差距。我們了解到,今年中開始的C 輪第一批送樣中,基本沒有中國零件供應商通過特斯拉的要求。
一位接觸過特斯拉團隊的投資人說,特斯拉內部的目標是在中國之外建立人形機器人供應鏈。這意味著,中國公司想為特斯拉機器人供貨,需要先海外投資蓋工廠。
特斯拉在美國的奧斯汀工廠組裝了一批用來測試的人形機器人,截至今年6 月只有兩台在工廠搬運電池。用成本超過10 萬美元的人形機器人搬運鋰電池並無任何價值。電池工廠一般用成本不到1 萬美元,附托盤的無人移動小車裝電池,一次能搬上千隻。
馬斯克再一次啟動了他習以為常的循環:用不切實際的時間表,推著團隊成員超越極限,在一次次延期中逼近目標。不過有時候,預期與現實之間的鴻溝會大到一、兩代人也填不滿,例如愛迪生一百年前力推的電動車。
來源:晚點LatePost