北京大雨,地平線低調秀高階智駕餘凱和大眾老闆都在車上
昨天北京強降雨,各位晚上下班沒少折騰吧?和大家一塊堵在路上的,還有這兩位──大眾中國CEO貝瑞德,以及地平線創辦人、CEO餘凱博士。倆這麼大老闆,低調到拼一輛大眾ID.4下班。但背後動機不「低調」:不期而至的北京大雨,成了地平線高階智駕實力展現最好的舞台。
地平線智駕,什麼實力?
根據官方發布的消息,這輪北京強降水持續30個小時,城區平均降水量24.3毫米,地平線所總部所在的西北部30毫米左右,已經達到大雨級別:
這種極端天氣對於一般人類駕駛已經構成很大挑戰,明顯昨天路上的各類突發事故多了很多,尤其是在不規則路口轉彎、匯入匯出等等複雜場景。
但地平線SuperDrive依然全程無接管,成功在暴雨中應對了一系列複雜路況。
例如在一個紅綠燈已經明顯不起作用的壅塞路口,完成了一次跟老司機沒差的博弈+左轉:
不規則的施工路段,SuperDrive也成功辨識了可通行區域,順利完成左轉:
以及在複雜的車流中識別出了公車專用道,即使變換車道避讓,也可以看成是面對擁堵情況的綜合判斷變換車道:
針對突發狀況,如鬼探頭、加塞等等,也能及時避讓:
還有一個城市場景高難度挑戰-環島而且是不規則環島:
說兩點SuperDrive最亮眼的表現,首先是避讓動作,流暢優雅,也就是沒有急促的煞車、猛打方向這樣的動作。
第二是變換車道動作,旁車道空間小,多數系統會放棄變換車道或減速等待,但SuperDrive能根據前方空間條件主動加減速或調整轉向角度,創造變換車道機會。
總結一下,SuperDrive在北京暴雨的測試中表現出的最大特點,反而不是零接管,而是「擬人」——駕駛策略擬人,以及執行動作擬人。
之前我們說過,各種智駕測試視頻,含金量其實各有不同。通常最真實可信的,是普通用戶在日常使用過程中記錄的真實體驗,前後不太可能有調試或剪輯,相當於智駕系統的「閉卷」考試。
還有車企老闆的直播、4S店試乘路線等等,一般會針對特定路線進行優化,但控制不了突發情況,屬於提前劃過重點的「半開卷」考試。
當然也有「開卷」了,就是最常見的發布會或者官方帳號發出來的「XX公里零接管」類小視頻,大家也能想到,這種材料從策劃到成品,最忙的要數剪輯師了。
那麼地平線SuperDrive系統在昨天北京大雨的測試,屬於哪個等級?
其實一個最關鍵的點就能看出來:地平線的拍攝計劃,可能很早就做好了,可以從影片中不少恰到好處的第三視角機位看出來。但是,昨天北京的暴雨不是地平線能預料或掌控的。
屬於老師本來給你劃好了重點考四則運算,但到考場上發現題目變成了微積分。
因為暴雨惡劣天氣,對感測器就是一個巨大的挑戰,攝影機擷取的影像品質大幅下降,雷達也會傳回更多的雜波點雲,以及濕滑的路面對於規控也提出更高要求。
但地平線的高階智駕方案SuperDrive,極為優秀的應對了暴雨氣候。
以及從官方發佈時間也看得出來。昨天北京普遍降暴雨是在晚上五、六點鐘開始,但地平線官方夜裡11點左右就火速發布,加班加點。
按照通常的劇本,拍智駕影片遇到這樣的突發,要嘛延後拍攝,要嘛後期精剪一番晚一點。不得不說地平線的團隊頭很鐵啊,車上帶著自己的大老闆,還有客戶爸爸的大老闆,直接就開乾了…
不過從另一個角度考慮,也許對地平線來說暴雨來了反而更興奮,等的就是這樣一個機會。
對技術能力不足的玩家來說是個挑戰,但於能力夠強的來說,暴雨是證明實力的絕佳case:偶發,且不可複製。
背後是什麼技術支撐
剛剛我們把「變換車道」當作亮點單獨說,為啥?
不擬人的變換車道策略,基本上就是屢試屢敗,最後只能提示接管,錯過出口,把高階智駕體驗搞得支離破碎。
但現實就是這樣:大部分量產高階智駕,都是用手寫規則應對變換車道場景,判斷變換車道時機的策略和執行方式僵硬刻板,十分勸退。
所以,變換車道是直接區分NOA水平高下的試金石;使用者層面,它是智駕「可用」與否最關鍵的因素。
因為說實話,辨識紅綠燈、行人,嚴格跟著導航這些功能,只要數據到位,沒啥難的,現在基本上各家都能做的很好。
地平線一直強調SuperDrive“擬人”,就是能在這些細節上為智駕體驗帶來巨大提升。
兩個最主要的技術手段:端到端感知架構,以及資料驅動的互動式博弈演算法。
一個是為了智駕系統看的更清楚更明白,一個是讓智能代駕的「腦子」更有彈性、更有效率。
端到端感知架構的優勢,是避免了模組化演算法架構中,數據多級傳遞造成的“損耗”,演算法模型一端直接輸入感測器數據,另一端直接輸出軌跡預測,包括本車的,也包括道路其他交通參與者的。
端到端體現在SuperDrive將動態、靜態、OCC(Occupancy佔用網路)三網合一,統一在一個Transformer架構下,不需要對感知資料進行抽象化和逐級傳遞,「所見即所得」:實現感知端到端同時,也保證了每個子網路的可解釋性。
實際上SuperDrive的演算法基礎,正是來自於智慧車參考前幾天才介紹過的CVPR 2023最佳論文成果——UniAD,地平線學者一作。
動態、靜態、Occupancy三網合一的感知端到端架構下,有效解決感知架構時延高、規則多、負載重的問題。
感知端對端網路輸出的結果,會接著進入資料驅動的互動博弈演算法,這項演算法也是基於蒙特卡羅樹搜尋的端到端深度學習演算法。
名震一時的圍棋AI AlphaGo背後的主要技術之一就是蒙地卡羅樹搜尋。簡單來說,它的基礎就是一個機率模型,所要求解的問題是某種事件出現的機率。
在智駕場景中,這個「機率」可以是物件來車軌跡、前車變換車道意圖、變換車道時多個目標的運動軌跡等等…
蒙特卡羅樹搜尋會通過某種「試驗」的方法,得到這種事件出現的頻率,或是這個隨機變數的平均值。
試驗方法,可以是人為定義,不過地平線選擇的是透過10000小時高品質駕駛資料來訓練,讓演算法最大程度理解效仿人類老司機的駕駛方法。
這就是上面例子中SuperDrive果斷乾脆變換車道的技術核心。
演算法之外,SuperDrive「擬人化」還有一個獨特優點-軟硬結合,征程6系列運算硬件,CPU、BPU()、GPU、全功能的MCU四芯合一。
單顆征程6旗艦即可支援感知、規劃決策、控制、座艙感知等全端運算任務。同時,高整合度令開發難度進一步降低。
J6這一代產品,BPU納許架構是核心,概括來說是支援大參數AI模型在車端的部署運作。
所以SuperDrive在北京暴雨遭遇戰中的優秀表現,其實是「一個時代有一個時代運算架構」這個核心思想的體現。
怎麼解讀
地平線在北京暴雨中用智駕送老闆下班,確實挺厲害的,但有啥用呢?
地平線不是一直稱呼永遠作Tier 2,專注硬體嗎?
其實透過SuperDrive能力本身,地平線展現出關鍵的幾點。
首先是證明只有在技術體系上重建、改變才能徹底解決城市NOA量產普及問題。
SuperDrive是一個最好的樣品屋,而實現這個目標的基礎,是新的旅程6系列。
而從地平線本身來說,SuperDrive方案搭配征程6系列硬件,從智慧車和自動駕駛演算法演變的角度設計硬體架構,提出專門為端到端模型和資料驅動演算法服務的新平台。
說明生態正成為智駕的壁壘和新護城河。
最後是對於大眾以及其他國際OEM來說,與地平線合資合作已經不是秘密,而聯合最近安徽金標大眾強調的「自主權」…
合資和自主的力量對比,後續可能變數更多。
One more thing
餘凱和貝瑞德乘坐的ID.4,是地平線高階智駕方案SuperDrive的工程版,現在店裡賣的ID.4量產車是沒有這樣的高階城區NOA能力的。
不過這也直接證明,迪斯當年主導推動的大眾新能源革命是多麼的前瞻性:
基礎電子電氣架構,仍能支援近10年後的高階智慧駕駛功能。
迪斯的遺產,目測大眾還能享用3-5年。
至於後續嘛,何小鵬又給大眾續上了: