特斯拉落後Waymo四年就如同下西洋棋與跳棋的差別
特斯拉粉絲以及CEO馬斯克(Elon Musk)本人對特斯拉全自動駕駛(FSD)軟體的前景感到興奮。 Tesla在3月發布了其軟體的重大升級版本12.3。隨後,在4月,馬斯克宣布特斯拉將於8月8日推出一款專用robotaxi(自動駕駛計程車)。 5月8日,馬斯克宣布新版本的FSD 12.4將在未來幾天內推出,「每次幹預的里程數將提高5到10倍」。
但我認為期待特斯拉在不久的將來推出無人駕駛計程車服務的粉絲們將會感到失望。
在3月底去舊金山的一次旅行中,我有機會嘗試了特斯拉和GoogleWaymo的最新自動駕駛技術。
在特斯拉Model X的45分鐘試駕過程中,我必須兩次幹預以糾正FSD軟體的錯誤。相比之下,我乘坐無人駕駛Waymo車輛兩個多小時,沒有發現任何錯誤。
因此,雖然Tesla的FSD 12.3版本看起來比之前的FSD版本有了重大改進,但它仍然落後於Waymo的技術。
不過,Waymo令人印象深刻的表現也帶有星號。雖然在我乘坐的過程中沒有人在駕駛,但Waymo有遠端操作員,他們有時會為車輛提供指導(Waymo拒絕告訴我在我乘坐的過程中遠端操作員是否介入,或者介入的頻率)。特斯拉的FSD適用於所有道路類型,而Waymo的計程車則避開高速公路。
許多特斯拉粉絲將這些限制視為Waymo走向技術死胡同的跡象。他們認為特斯拉的FSD能夠在所有城市和所有道路類型上運行,是一種更通用的技術,很快就會超越Waymo。
但這從根本上誤解了情況。
在公共道路上安全駕駛無人駕駛車輛非常困難。由於駕駛座上沒有人,一個錯誤就可能致命,尤其是在高速公路上。因此,Waymo於2020年在它所能找到的最簡單的環境——鳳凰城郊區的住宅區街道——推出了無人駕駛服務,並隨著對其技術的信心增強而逐步提高難度。
相比之下,特斯拉還沒有開始無人駕駛測試,因為它的軟體還沒準備好。目前,不需要地理限制和遠端協助,因為方向盤後面總是有人。但我預測,當特斯拉開始無人駕駛轉型時,它將意識到安全需要Waymo式的漸進式推廣。
所以,特斯拉並沒有找到不同的、更好的方式將無人駕駛技術推向市場。 Waymo只是太超前了,它正在應對特斯拉甚至還沒有開始考慮的挑戰。
Waymo在下上西洋棋,而特斯拉還在下跳棋。
特斯拉落後Waymo幾年
目前圍繞著特斯拉FSD的興奮讓我想起了2018年圍繞Waymo的炒作。那一年年初,Waymo宣布將從捷豹購買2萬輛I-Pace轎車,從菲亞特克萊斯勒購買6.2萬輛Pacifica小型貨車。
但Waymo在2018年12月推出的服務卻令人失望。在大多數乘車過程中,方向盤後面仍然有安全駕駛員,而且僅限於一群精挑細選的乘客使用。
直到2020年10月,Waymo終於在鳳凰城地區推出了完全無人駕駛的計程車服務,並向公眾開放。即便在那之後,Waymo的擴張速度也很緩慢。
Waymo於2023年開始在舊金山提供商業服務,目前正在向洛杉磯和奧斯汀擴張。如今,該公司的商業車隊只有幾百輛車,遠遠少於6年前計畫購買的8.2萬輛車。
出了什麼問題?在2018年8月的一篇文章中,記者Amir Efrati報導了Waymo技術的限制。 Efrati寫道,「Waymo貨車在鳳凰城地區的許多無保護左轉和併入繁忙交通時都會遇到困難。」此外,「汽車很難將成群結隊的人或騎自行車的人分開,尤其是購物中心附近或停車場的人。
Efrati的報導讓Waymo在2018年的技術聽起來比FSD 12.3差,但也差不了多少。 FSD有時仍然難以在繁忙的交通中並線,也難以繞過成群的行人。
Waymo的技術在2018年後穩定提升。 2020年底,Waymo在鳳凰城地區推出完全無人駕駛服務後,我採訪了Joel Johnson。他是一名大學生,曾搭乘過幾十次Waymo,並在YouTube上發布了一些搭乘影片。
“他們確實解決了像無保護左轉這樣的問題。”約翰遜在一段影片中說道,“隨著時間的推移,情況肯定有所改善。”
在10月份的一段影片中,一輛Waymo汽車正駛過一個擠滿行人的Costco停車場。它耐心地等待著,直到行人讓開,然後自信地向前行駛。
“2020年3月,如此多的行人會導致剎車失靈。”Johnson在一份屏幕註釋中寫道,“到2019年7月,它就會完全放棄。再也不會了!”
我在3月嘗試過的FSD版本顯然還沒準備好進行無人駕駛操作。例如,我必須進行幹預,以防止Model X撞上塑膠車道分隔線,而這是Waymo在2020年都不會犯的錯誤。因此,雖然FSD 12.3似乎優於Waymo 2018年左右的技術,但它不如Waymo 2020年底的技術。
Waymo依賴遠端操作員
2018年的Waymo自動駕駛小型貨車,可以看到車上坐著安全駕駛。
早年,Waymo的所有測試都是由安全駕駛員完成的。當軟體出現錯誤時,駕駛會介入以防止撞車,然後仔細記錄下事故經過。工程師利用這些險情數據來改進Waymo的軟體。
自動駕駛軟體越好,這種測試策略的成本就越高。如果自動駕駛軟體每行駛50英里就會出錯一次,那麼安全駕駛員在一個工作天內可能就會經歷數次錯誤。但如果軟體每行駛5000英里就出錯一次,那麼安全駕駛員可能要花費數週的時間,才能收到一份錯誤報告。
如果Waymo繼續使用安全駕駛員進行測試,直到其軟體被證明比人類駕駛員更安全為止,那麼它的成本將高得令人望而卻步。因此,Waymo開始部署由遠端操作員支援的無人駕駛汽車。
Waymo對其無人駕駛車輛進行了編程,使其默認行為變得極為謹慎。如果Waymo無人駕駛汽車沒有百分之百的把握可以安全行駛,它就會減速停下,並請求遠端協助。我們希望,隨著時間的推移,軟體的平均可信度會越來越高,車輛需要遠端協助的次數也會越來越少。
Waymo表示,遠端操作員從不直接駕駛車輛。相反,操作員會回答問題並給予提示,引導車輛朝正確的方向行駛。以下是Waymo提供給我的兩個例子:
在一段影片中,一輛Waymo被一輛逆向行駛的大卡車擋住了去路。遠端操作員讓Waymo駛入右側車道,為卡車留出通過空間。
在另一段影片中,一輛Waymo正在接近一個有多輛消防車的十字路口。 Waymo向遠端操作員提出了兩個問題——“緊急車輛是否堵塞了所有指示車道”和“道路是否封閉?”,這有助於它自信地通過現場。
這種策略在高速公路上會變得棘手。如果無人駕駛車輛請求幫助但沒有及時回應,則需要停下來等待。但這很難在時速70英里的高速公路上做到。
因此,儘管Waymo已經在高速公路上測試了十多年的技術(有安全駕駛員),但Waymo的無人駕駛計程車還沒有使用高速公路。這讓Waymo的服務變得不那麼有用。
今年3月,我第一次搭乘Waymo從舊金山市中心前往Bayview社區的麥當勞。對Waymo來說,這是一趟28分鐘的地面街道行程。 Uber或Lyft司機走101高速,大約15分鐘就能到達。
Waymo正在努力解決這個問題。今年1月,該公司開始在鳳凰城地區的高速公路上測試無人駕駛。如果測試進展順利,Waymo可能會在未來幾個月內為其商業車隊提供高速公路駕駛服務。
根據Waymo公佈的統計數據,至少從安全角度來看,Waymo的謹慎做法效果顯著。在Waymo最初的700萬英里無人駕駛里程中,其車輛發生造成傷害的車禍的頻率僅為同類人類駕駛員的四分之一。
特斯拉有更好的方法嗎?
許多特斯拉粉絲認為Waymo目前服務的限制——避開高速公路、依賴遠
程操作員以及限制在幾個大都會地區-證明Waymo的技術有根本缺陷。
在去年的一條推文中,一位特斯拉支持者認為Waymo和通用汽車旗下的Cruise已經「開發的技術極其狹窄、非常脆弱,無法擴展」。
馬斯克回答:“是的,對當地條件來說非常脆弱,而且無法擴展。”
2024年4月15日,美國德州奧斯汀,特斯拉Model Y停放在特斯拉經銷店的停車場。
這論點的關鍵部分與神經網路有關。 Waymo在15年前作為Google自動駕駛汽車計畫起步,當時還沒有出現2010年代的深度學習革命。其最早版本的軟體可能使用的是手動編碼的規則,而不是機器學習。一些特斯拉的支持者似乎認為Waymo仍在使用相同的過時技術
事實上,Waymo現在廣泛使用神經網路。
例如,在2020年的這篇文章中,Waymo介紹如何將神經網路用於其感知系統——用於識別和追蹤附近物體的軟體。在2024年2月的演講中,一位Waymo工程師解釋了該公司如何使用Transformer(Google發明的大型語言模型背後的架構)來預測其他車輛的行動。
因此,Waymo十年前的軟體堆疊可能很脆弱,但該公司並沒有停滯不前。
造成自動駕駛困難的一大因素是駕駛在現實世界中可能遇到的「長尾」異常情況。濕水泥。綁在汽車上的自行車。卡車後面的一棵樹。一個坐在輪椅上的女人在追趕一隻鴨子。
開發自動駕駛技術的公司需要進行數百萬英里的測試,以盡可能發現這些「邊緣情況」。而這正是特斯拉比Waymo更有優勢的地方。
正如我們所看到的,Waymo必須為每英里的監督測試向安全駕駛員支付費用。相比之下,特斯拉已經說服成千上萬的客戶免費測試其完全自動駕駛軟體。事實上,客戶為此支付了數千美元!
這樣,特斯拉就能獲得實際上無限的數據。從理論上講,更多的數據應該能讓特斯拉有效識別其自動駕駛軟體需要處理的邊緣情況。更多的數據還能讓特斯拉訓練出更好的神經網路。
雖然取得更多的數據肯定是有幫助的,但這並不是靈丹妙藥。一個問題是,特斯拉收集的數據是沒有標籤的。 Waymo的安全駕駛員會記錄每次脫離,以幫助識別Waymo軟體中的缺陷,但特斯拉用戶不太可能這樣做。
另一個問題是,有些邊緣情況比其他情況更難處理。
第一響應者問題
讓我們以與警察和消防員的互動為例。去年,Waymo和通用汽車的Cruise就在這個問題上糾結了很久。我曾在9月寫過相關文章。
根據舊金山消防局的記錄,幾輛Waymo或Cruise車輛堵塞了狹窄的道路,迫使消防車繞道前往火場。自動駕駛汽車被困在消防作業區域附近,迫使消防員在放置軟管和梯子時必須在它們周圍工作。幾輛自動駕駛汽車停在消防局前,將消防車困在裡面。
問題並不在於這些車輛撞上了消防車(特斯拉過去也曾遇到這樣的問題)。而是它們太謹慎了,以至於被卡住。這就是為什麼在Waymo和Cruise開始無人駕駛營運後,這些事件變得令人擔憂;安全駕駛員本可以在幾秒鐘的不作為後進行幹預。這也是為什麼這還沒有成為特斯拉的問題:每輛特斯拉的方向盤後面都有一個人,如果FSD卡住了,他可以接手。
大多數時候,駕駛需要遵循簡單、確定的規則:保持在車道中央、避免撞到其他道路使用者、遵守紅綠燈和停車標誌等等。
但是,在火災或車禍現場穿梭則要棘手得多。緊急情況會完全擾亂交通流,迫使駕駛隨機應變,創造新的交通模式。駕駛者往往需要細緻地了解他人的意圖,這樣才能避免妨礙他人。如果警察或消防員正在指揮交通,駕駛員就需要了解他們的手勢。
總之,在火災或車禍現場進行導航有時需要推理技能,這遠遠超出了當今人工智慧系統的能力範圍。因此,對於特斯拉的FSD來說,緊急場景至少在未來幾年內仍可能是一個“corner case(邊角案例)”,就像Waymo的軟體一樣。
2024年3月11日洛杉磯市中心的Waymo自動駕駛計程車內部。
意識到這一點後,Waymo透過多種方式對其軟體進行了後備處理。 Waymo車輛如果不確定該怎麼做,可以請Waymo遠端操作員的指導。急救人員可以靠進車內與遠端操作員對話,也可以跳進車內親自駕駛。城市管理者可以設置地理圍欄,讓Waymo車輛遠離緊急事件現場。 Waymo也為鳳凰城、舊金山和其他地方的數千名急救人員提供如何與其車輛互動的培訓。
這些努力似乎已見成效。 《舊金山紀事報》(the San Francisco Chronicle)在今年2月的一篇報道中稱,自8月以來,消防隊員提交的有關車輛行為不當的報告有所減少。部分原因是Cruise在10月停止了在舊金山的營運。但Waymo的報告數量似乎也在下降。
如果特斯拉推出支援完全無人駕駛的FSD更新,我估計我們就會開始看到與去年關於Waymo和Cruise的報導相同的故事:特斯拉車輛碾壓水管、阻擋救護車、無視警察指示、幹擾消防員梯子放置等。
考慮到其車隊的規模,特斯拉可能會面臨來自急救人員的反擊,其規模遠大於Waymo和Cruise去年在舊金山面臨的反擊。正如Waymo和Cruise所發現的那樣,警察和消防員擁有很大的政治影響力。
如果特斯拉真的想提供無人駕駛計程車服務,它將需要Waymo近年來一直在建設的基礎設施和支援服務。這包括在車輛被困時進行幹預的遠端操作員,以及與當地政府合作的人員。相反,特斯拉一直朝著相反的方向發展。 The Information上個月報道,特斯拉正在解散其公共政策團隊。
服務,而不僅僅是軟體產品
今天的FSD是一種軟體產品,但robotaxi服務不僅僅是軟體。這裡有一個簡單的例子:如果特斯拉robotaxi爆胎了怎麼辦?
如果你正在開車,車胎爆了,那是你自己的問題。如果你搭乘的計程車爆胎了,那是司機的問題。但如果沒有司機,誰來換輪胎呢?
特斯拉的設想是,人們購買一輛特斯拉,然後透過特斯拉營運的叫車網路出租。因此,從理論上講,特斯拉可以說爆胎是車主的問題。但這在實踐中行不通。車主可能在開會,甚至在度假。在特斯拉試圖聯繫車主的時候,把車擱置在路邊幾個小時,甚至可能還有乘客在車內,這種做法是不可接受的。
因此,如果特斯拉想涉足計程車行業,它就需要一批行動技術人員來救援受困的特斯拉汽車。這些技術人員可以是特斯拉的員工,也可以是獨立承包商,但在公司開始在特定地區提供服務之前,這些安排必須到位。當FSD軟體不可避免地卡住時,這些人也可以被派去救援特斯拉。
這意味著,特斯拉很可能希望逐步推出無人駕駛版的FSD,一次只在一個城市推出。出於其他原因,這也是合理的。特斯拉將有時間向當地官員介紹自己,並為當地警察和消防部門提供培訓。雖然遠端操作員和客戶服務人員不一定是本地人,但分階段推出也會為特斯拉留出時間招募這些職位的人員。
我希望大家現在能明白,為什麼我不認為Waymo目前的服務限制——地域限制和使用遠端操作員——特別糟糕。每項計程車服務都有地理限制,Waymo有充分的理由一個城市一個城市地推出服務。
一個痛苦的教訓
我和很多特斯拉的粉絲聊過,所以我很清楚他們會怎麼說:我低估了特斯拉自動駕駛技術的進步速度,因為特斯拉會投入更多的數據和運算能力來解決這個問題。
一些特斯拉的支持者喜歡引用著名的理查德·薩頓(Rich Sutton)的文章《一個痛苦的教訓》(“The Bitter Lesson”)。薩頓認為,人工智慧研究人員歷來花費太多時間,試圖用手工編碼的方式,讓人類找到解決電腦西洋棋或影像辨識等問題的最佳方法。最終,人們透過在大量資料上訓練的通用學習演算法獲得了更好的結果。
薩頓是在2019年寫下這篇文章的。從那時起,大型語言模型的成功以驚人的方式證明了薩頓的洞察力。早期的人工智慧研究人員試圖理解自然語言的特性,然後將他們的見解編碼到人工智慧系統中。這些系統運作得不好。效果好得多的是採用簡單的Transformer架構,並將其擴展到數千億個參數,從而創建出像GPT-4這樣的LLMs。
馬斯克打賭,在自動駕駛方面,這種動力也將對特斯拉有利。他將FSD的第12版描述為使用「端對端神經網路」。他正投資數十億美元購買硬件,利用從特斯拉客戶收集的大量數據來訓練這些神經網路。如果你相信薩頓的論點,你可能會期待特斯拉能跳到Waymo的前面。
但我認為人們對薩頓的論點解讀多。薩頓的觀點是,經過大量資料訓練的大型神經網路往往比手工編碼的人工智慧系統表現更好。但這並不意味著,向任何特定的神經網路投入更多的數據和運算能力,就能實現任意高水準的效能。
LLMs就是一個很好的例子。 LLMs會產生幻覺。它們無法完成簡單的任務,例如計算物體和讀取模擬時鐘。 LLMs非常適合精度並不重要的應用,或由人工在生成輸出後進行檢查的應用。但如果你需要非常高的精度,它們就不是一個好的選擇。
自動駕駛系統確實需要非常高的精度。而擁有足夠數據和運算能力的端對端神經網路是否一定能達到這項要求,這一點並不明顯。
商科教授伊森·莫里克(Ethan Mollick)寫過一篇關於「鋸齒狀邊界」(jagged frontier)的文章:複雜的人工智慧系統往往在某些任務上表現出色,但在另一些任務上卻出人意料地糟糕。特斯拉可能非常擅長在高速公路、十字路口和交通環島中導航,但在避開潮濕的水泥地或理解警察的手勢方面卻進展甚微。
Waymo會遇到「Just Walk Out」問題嗎?
Waymo解決這個問題的方法是建立一個大部分自動化的系統,能夠在需要時優雅地依靠人工輔助。
雖然從安全的角度來看,這種方法效果不錯,但我開始懷疑它的經濟性。如果Waymo的車輛不斷要求遠端指導,Waymo可能需要雇用大量的遠端操作員,以至於抵消了不需要司機帶來的成本節約。
今年4月,亞馬遜宣布從亞馬遜生鮮雜貨店移除名為「Just Walk Out」的免結帳技術。
位於加州惠提爾的Amazon Go商店採用「Just Walk Out」技術。
與Waymo一樣,亞馬遜在2018年也看好自己的技術。那一年,彭博社報道稱,亞馬遜計劃基於Just Walk Out技術開設3,000家Amazon Go便利商店。
但這從未發生過,The Information的Theo Wayt的報導有助於解釋原因。 Wayt去年報導,亞馬遜的技術——與Waymo的技術一樣——並不是完全自動化的。亞馬遜在印度有1000多名工人手動驗證客戶的選擇。 Wayt說,在2022年中期,「Just Walk Out」每1000筆銷售需要大約700個人工審核。
亞馬遜的目標是將這一數字降低到每1000件商品20到50次人工審核,但該公司「屢屢未能實現」這一績效目標。
Waymo會有類似的問題嗎?我不知道。毫不奇怪的是,Waymo拒絕就遠端幹預的頻率發表評論。
我最樂觀的猜測是,這對Waymo來說不會是個嚴重的問題。在我3月的乘坐過程中,Waymo的車輛行駛平穩,信心十足。如果它們一直在尋求遠端指導,我估計會出現更多的猶豫和不穩定駕駛。
最後,Waymo的擴張似乎也相當迅速。 5月早些時候,該公司宣布其每週服務量已從9個月前的每週1萬次增加到5萬次。除非管理層有信心實現盈利,否則Waymo似乎不太可能發展得這麼快。
無論如何,我不認為特斯拉發現了解決這個問題的更好方法。大型、複雜的神經網路往往擅長某些事情,但在其他方面卻不盡人意。然而,控制兩噸重汽車的人工智慧系統必須始終非常可靠。至少在未來幾年內,只有在人類的支持下才能做到這一點。 (原作者Timothy B. Lee是報道科技政策與未來交通的資深記者,曾在Arstechnica任職。文中配圖來自蓋蒂圖片社。)