“差生”特斯拉和“頭牌”Waymo 做自動駕駛有什麼不同?
資訊機構Navigant Research 最近公佈的報告再次將兩家公司推向風口浪尖。一個是在排名中墊底的特斯拉,另一個則是拔得頭籌的Waymo。至於評判標準,是根據每家公司在“願景”、“商業化策略”、“合作方”、“量產計劃”、“技術”以及“產品持久力”這幾個方面的綜合表現打分排名。
(2019 自動駕駛領導力排行榜,來源:Navigant Research)
在去年的報告中,Waymo 和特斯拉的排名分別為第七位和第十二位。對Waymo 而言,去年開始的大規模商業化試運營應該是其領先的重要原因。但特斯拉墊底就有點說不過去了,排名竟然比蘋果都低。在一些業內人士看來,這份報告在成文的視角和方法論上略有偏差,缺失了對“政府關係”和“數據”這兩個重要標準的考量。
和政府搞好關係的重要性自不必說。一旦硬件實現商品化,軟件就成了關鍵。實際上不能說是軟件,而是“數據”。數據是驅動自動駕駛技術發展的“燃料”,或者如前英特爾首席執行官Brian Krzanich 提出的觀點,“數據是新的石油資源”。世界上最先進的人工智能也需要數據支持——它依靠浩如煙海的數據將信息傳化為下一步的行動。
顯然,如果只考慮“科技”和“數據收集”這兩個維度,排在榜首的應該是Waymo 和特斯拉。至於誰最終會在這場“曠日持久戰”中勝出,我們暫且不討論。今天想和大家聊聊關於特斯拉和Waymo 在技術層面的一兩點差異性。
“貌合”“神離”的兩套方案
二月底,Waymo 首席科學家Drago Anguelov 在MIT 首次開講,他分享的內容主題為“解決自動駕駛中的長尾問題”(Taming The Long Tail of Autonomous Driving Challenges),這應該是外界對Waymo 自動駕駛研發目前能夠了解到的最深度、最詳細的內容了。
(Waymo 首席科學家Drago Anguelov 在MIT 開講自動駕駛課程)
近些年,使用大量標註過的數據對深度學習網絡進行監督訓練,使得物體感知和行為預測能力有了大幅提升,這些技術在Waymo 自動駕駛開發過程中得到了大規模應用。我們也從Drago Anguelov 口中第一次知道了Waymo 在使用“模仿學習(imitation learning)”,這裡先稍微科普一下。
模仿學習屬於機器學習的一種,它的神經網絡能夠通過“觀察”人類的行為將某些特定的動作和場景進行匹配。如果使用不同類型的“人類行為”作為數據源來訓練,最終神經網絡就能夠根據感知的結果輸出相對應的決策動作。例如,“如果你看到停車標誌,馬上停車”、“如果前方有輛停著的車擋路了,繞開它”等等。
(“行為克隆”(behaviour cloning)與“模仿學習”(imitation)是一回事)
隨著商業化試運營的推進,谷歌能夠採集數據的場景更多了,模仿學習算法也就有了更頻繁的用處。但Drago Anguelov 也指出,人類駕駛行為存在著很多不確定性,一些罕見的場景(所謂的“長尾”問題),Waymo 的數據集中並沒有足夠的案例來訓練算法應對。出現這種情況就只能依靠開發人員手動編寫算法。Drago 認為這種“折中”的做法遲早是會被機器學習代替的。
根據Waymo 官方披露的數據,Waymo 目前已經累積了約1500 萬英里的行駛里程。按照平均每3000 萬英里才會出現一起事故的概率來計算的話,Waymo 可能到現在都沒有得到一個特定的“長尾”案例。假設行駛每100 萬英里會發生一起事故,waymo 也不過積累了15 個數據而已。按照普通機器學習神經網絡需要的數據量(每個圖像分類需要至少1000 個樣本)的標準來看,Waymo 似乎還差得有些遠。
儘管Drago Anguelov 表示希望通過採集盡可能多的人類駕駛行為(包括“長尾”案例)來進行模仿學習,但“數據量的缺失”是個很大的問題。
而為了彌補這方面的缺陷,Waymo 已經構建出了一套仿真模型,仿真出盡可能多的場景來進行測試。因為有時會得出截然相反的結果,所以要加強系統的魯棒性,做出足夠多的仿真模型,確保系統的準確性。
(仿真測試是自動駕駛研發中的關鍵一環)
不過仿真模型的建立依然需要真實世界數據的支持,解決“長尾”問題也需要對人類駕駛行為進行大量地模仿學習。所以這就又回到了問題的原點,Waymo還需要更大量級“數據”的支持。
對比之下,似乎“差生”特斯拉在“數據”問題上還真是不發愁。
特斯拉目前預計有超過40 萬輛搭載了Autopilot 系統的車子在道路上行駛,單日行駛里程超過了1300 萬英里。如果未來這個車隊的規模增加至超過100 萬輛,那麼每月產生的有效行駛里程將到達10 億英里的量級。對一家已經有成熟產品落地的車企而言,這種真實世界產生的“數據”根本不是問題。
至於特斯拉在自動駕駛研發上的獨特性,根據外媒 The Information 曾經透露的信息,特斯拉同樣在利用“里程累積”上的優勢進行模仿學習。原文(https://0x9.me/yRgBO)是這麼說的:
据熟悉特斯拉这套系统的线人爆料称,特斯拉的车子在行驶过程中会将摄像头及其他传感器的数据搜集起来,Autopilot 是否运行并没有关系。之后工程师可以将这些数据中人类的驾驶行为与不同的场景进行匹配,之后遇到类似的场景机器就可以模仿人类去执行。比如怎样拐弯或躲避障碍物。当然这种被叫做“行为克隆”的方法也有局限性,但特斯拉的工程师认为只要有足够的数据支撑,神经网络就能够给出正确的决策结果,例如在绝大多数场景中如何转向、刹车以及加速。在特斯拉看来,未来不再需要人类手动编程控制无人车应对特定场景。
不過按照個人的理解,特斯拉軟件工程師提到的“行為克隆”和Waymo 的“模仿學習”是一個意思,等同於大家都在講的“端到端學習”的方案,即使用一個巨大的神經網絡,輸入傳感器數據後得到關於轉向、加速和剎車的整體執行策略。
假設特斯拉採用的是端到端學習方案,那它肯定是不需要對圖像進行標記的。唯一需要“標記”的是人類駕駛員的行為,比如轉向角是多少、加減速的力度等。將整個傳感器數據輸入到一個巨大的神經網絡後,系統會學習如何將傳感器數據與人類駕駛員的行為進行匹配。但我們知道特斯拉是在做圖片標記的,所以從這一點出發考慮,它採用的就不大可能是和Waymo 一樣的“端到端學習”的策略。
(“端到端”與“語義抽象”的差異)
針對自動駕駛感知的算法差異,Mobileye 創始人Amnon Shashua 曾經對“端到端學習(End-to-End Learning)”和“語義抽象(Semantic Abstraction)”這兩個概念做過詳細的講解。
(Mobileye 創始人Amnon Shashua 對自動駕駛感知的內容進行了講解)
而根據外媒 The Information 報導的內容來推斷,特斯拉可能是在開發一套用於路徑規劃或執行控制的神經網絡。而用來訓練這套神經網絡的數據並非來自傳感器,而是由感知神經網絡輸出的元數據。這樣人類駕駛員的直接行為—轉向、加速和剎車可以對元數據進行“標記”,類似端到端學習中,駕駛行為與傳感器數據的匹配。
這種將感知層和執行層神經網絡分開的做法能夠規避Shashua 教授上面提到的端到端學習可能產生的一系列問題:如“不常見場景”出現的機率會大幅下降;對先備知識( Prior Knowledge)的要求提高,深度神經網絡在解決一些簡單問題上可能會“慘敗”。
(“端到端”機器學習的局限性)
假設特斯拉用於訓練的數據來自特斯拉車主,通過人工的方式將一些“壞的”行為去掉,這樣可以避開人工編碼算法的局限和模擬測試的不真實。當然特斯拉還可以使用強化學習或監督學習來進一步優化。可以把路徑規劃或執行控制的神經網絡放在運行Autopilot 或其他駕駛輔助功能的車子上,一旦出現系統脫離、失效、碰撞等情況,工程師就可以通過bug 報告來定位原因。這些“錯誤”之後還可以用來訓練新的神經網絡。
如果上面猜測正確的話,這種方法可以用相當快的速度來解決路徑規劃和執行控制方面的問題。考慮到目前搭載硬件2.0 版本的特斯拉車型每個月可以獲得近10 億英里的行駛里程,獲得的數據量之大是Waymo 無法企及的。之後硬件3.0 版本上線後,搭載了AI 芯片的這套系統會更有利於特斯拉算法的迭代。
一場馬拉松式的長跑
儘管Waymo深受“數據”的困擾,但光憑對這個維度的考量自然是沒辦法斷言什麼的。只不過Waymo要解決自動駕駛中的“長尾”問題,自然需要更多的數據支持。Waymo近日宣布將在亞利桑那州的梅薩市開設新的技術服務中心,進一步擴大無人車出行服務的規模。顯然Waymo是奔著蒐集更多“數據”的目的來的。
也有人認為,Waymo可以效仿特斯拉開發一套類似Autopilot的駕駛輔助系統,僅使用成本低廉可量產的傳感器。一旦在市場鋪開後,蒐集真實場景的駕駛數據也就不是什麼難事了。當然,Waymo自己要完成這件事比較困難,肯定需要來自主機廠領域的合作夥伴。
上周有消息稱,“Waymo正在尋求外部投資人”。意料之中的計劃。如果有車企成為Waymo的股東,要獲得海量的駕駛數據自然容易得多。而且Waymo作為自動駕駛解決方案的供應商,始終只有借助OEM的平台才能最終獲得商業化成功。不管是手中的全棧自動駕駛技術亦或是正在進行的移動出行業務,Waymo對很多車企而言,都是有十足吸引力的合作夥伴。Cruise和通用、福特與Argo.AI,這些都是比較成功的先例。
對特斯拉而言,之前因為Model 3陷入“量產地獄”,Autopilot的研發進程似乎出現了停滯,硬件3.0也遲遲沒有發布。儘管在“數據”容量上有先天優勢,但率先量產以及頻發的幾次事故使其屢陷輿論風波。所以,特斯拉在自動駕駛上到底能有怎樣的成就,還在還很難說。
不過我個人倒是蠻欣賞之前馬斯克說過的一段話。
他說,“我不認為哪家企業能在特斯拉之前打造出一套綜合性的自動駕駛解決方案。除非它們保密工作做得太好了,到時候要拿出驚人的成果來。我覺得這種可能性不大,對特斯拉而言,任何車企都不是我們的競爭對手”。
希望這種“目中無人”的狂妄自大,可以給特斯拉帶來點好運氣。