智慧駕駛的「GPT時刻」 怎麼就被特斯拉搞出來了?
針對特斯拉FSD(Full-Self Driving,全自動駕駛)付費選裝率僅2% 的消息,特斯拉CEO 馬斯克在X 平台上回复稱,實際情況遠遠超過了這個數字。這項回應是針對知名特斯拉投資者加里布萊克對未來FSD 接受率的質疑而作。根據信用卡數據供應商YipitData 提供的數據,在試用了一個月FSD 的美國特斯拉車主中,只有2% 的用戶選擇繼續訂閱該服務,遠低於預期的6%。
布萊克認為,這可能是因為FSD 服務的附加價值不高,或者訂閱價格(每月99 美元)過高。他呼籲特斯拉需認真評估這些因素,以便更能迎合車主需求。
同時,馬斯克4 月底訪華,引發了特斯拉FSD 在中國落地的討論。不過,據中國日報報道,儘管特斯拉提出在中國推出“無人駕駛出租車”,但中國政府尚未完全批准FSD 在中國全面落地,可能會先支持其在國內進行測試和示範。
那麼,處於風口浪尖的特斯拉FSD 實際體驗如何?是否會再次引發鯰魚效應?
01智慧駕駛的ChatGPT 時刻
隨著新能源汽車進入智慧化下半場,智慧駕駛一直是業界追逐的技術制高點之一。人們不僅關注駕駛場景通過率和通勤效率,更關心智慧駕駛是否更人性化。
之前特斯拉FSD 的V11 版本,和許多智慧駕駛系統一樣,速度控制生硬,處理突發狀況時會突然煞車或加速,帶有明顯的機械感。尤其是在狹窄路段或惡劣天氣等特殊情況下,這種生硬的速度控制會讓使用者感到不安。
但現在,特斯拉FSD V12 的出現改變了這個格局。體驗過特斯拉FSD V12 的知乎部落客「EatElephant」表示,它最大優勢之一是其擬人化的能力。 V12 版本的最大提昇在於速度和轉向控制的順暢度。乘客即使在後排坐著,也幾乎感覺不到在紅綠燈啟停和路口轉彎時的任何頓挫感。
第二,V12 在處理一些非結構化場景(例如缺少車道線與交通規則的約束)有了很大的提升,例如在轉彎的時機和幅度、減速的具體程度等方面。例如,在V11 版本中,當車輛在直行時遇到前方遠處左轉的車輛時,智慧駕駛系統的反應是明顯減速。雖然這樣可以規避碰撞風險,但減速的幅度通常過大,導致明顯的頓挫感,也增加了被後車追撞的風險。
而在V12 版本中,面對類似情況,系統似乎能夠更準確地判斷前方車輛的行駛路線和速度。因此,它可以以非常合適的速度減緩,讓車上乘客幾乎感覺不到,同時又留出足夠的安全距離,避免了不必要的不舒適感和後方車輛的追撞風險。
第三,V12 應對各種場景的能力顯著提升,大大減少需要人工介入的次數。例如,特斯拉FSD V12 不僅能夠辨識並繞過路面上的鐵皮等障礙物,還能在道路施工時根據引導標誌在臨時開闢的道路上行駛,就像人類駕駛一樣靈活應對。即使需要駛向對向車道,也能夠不受逆行標識和中心黃線的限制。在夜間行駛時,它能夠像人類一樣先右轉駛入兩輛靠邊的停車之間巧妙的避讓對向來車,待對向來車駛離後再向左打方向盤繼續前進,展現出了出色的駕駛技能。
同時,知乎部落客「EatElephant」也提到,FSD V12 展現了一些類似智慧湧現的能力。在測試中,車輛遇到這樣一個難題:路口前有一個車道,V12 無法使用倒車檔完成掉頭。在乘客等待時,V12 發現了一個小停車場,果斷改變路線繞過,嘗試代替標準掉頭。儘管最後出口處系統提示接管,但這一行為是自動駕駛技術中的重大突破,因為通常系統會嚴格遵循導航路線,自行偏離導航的行為幾乎不可接受。
這些進步也體現在人工幹預的次數。相比之前版本,V12.3 版本在城市環境下的無關鍵接管行駛里程大幅增加,從約100 多英里(約合160 公里)提升到了386.7 英里(約合622 公里)。
相較之下,同濟大學教授、汽車學院副院長熊璐曾表示,北京、上海、廣州等地的自動駕駛企業,平均每百公里需要接管3.5 次到10 次不等,基本上每行駛十幾或幾十公里就需要人工接管一次。
目前,特斯拉FSD 或許正迎來自己的“ChatGPT 時刻”,儘管仍存在一些不足之處。例如係統在駕駛時有時會讓人感覺距離路邊太近,讓人有些擔心;對來車的識別和避讓不夠及時,例如遇到消防車時的反應不夠靈敏;對一些特殊路標或車道的識別可能出現錯誤,對於坑洞的辨識與避讓也有些問題。
不過,這並不妨礙特斯拉大幅增加對智慧駕駛的投入。據了解,今年底,特斯拉計畫在自動駕駛技術上累計投入達100 億美元。考慮到2016 年至2023 年的總支出在20 億美元左右,這意味著今年特斯拉在智慧駕駛上的支出將達到80 億美元左右。這是一筆巨額投資,顯示特斯拉對進一步提升FSD 技術的決心。
02 FSD V12 是如何煉成的?
特斯拉FSD V12 的體驗顯著提升背後,是其技術路徑逐漸收斂的結果。
自2020 年推出FSD 功能以來,特斯拉一直在引領智慧駕駛技術發展方向。與傳統的依賴雷射雷達和高精度地圖的方法不同,特斯拉堅持採用了純視覺技術,使得車輛能夠更好地理解周圍環境。
2022 年特斯拉AI Day 上的佔據柵格技術框架| 圖片來源:特斯拉
在隨後的兩年中,特斯拉透過一系列活動,如AI Day 等,公佈了大量關於FSD 技術的方案。這些方案涉及資料閉環、共享主幹網路、BEV 感知以及佔據網路等概念。儘管這些技術處於行業領先地位,但先前的版本一直受到用戶詬病,認為其用戶體驗改進不夠明顯。
然而,隨著FSD 的發展到V12 階段,情況發生了變化。與FSD 11 相比,FSD V12 最大的變化在於採用了端對端神經網路技術(End-to-End Neural Network, E2E NN)。這種技術使系統能夠更好地理解和處理複雜的駕駛環境,減少駕駛員的干預,並提高了自動駕駛的精確度和自動化程度。
以往,FSD 的基本流程通常包括感知、決策和執行三個階段。在早期版本中,感知階段需要透過視覺或雷達來獲取周圍物體訊息,並對其進行識別和分類,而決策階段則依賴預先編寫的控制規則。
特斯拉FSD 車輛變換車道| 圖片來源:特斯拉
然而,在FSD V12 中,採用了端對端神經網路技術,這些步驟發生了革命性的變化:感知階段不再需要手動識別和分類物體,決策階段也不再需要預先編寫的控制規則。系統只需要透過大量視訊輸入來讓神經網路學習,就能夠在不同情況下做出正確的決策。這使得特斯拉在FSD V12 中能夠減少大量程式碼,使系統更加輕巧、靈活,同時即使在沒有網路連線的情況下,也能夠在陌生的環境中正常運作。
馬斯克去年底曾表示,特斯拉的FSD Beta V12 從頭到尾沒有編程,沒有程式設計師寫一行程式碼來識別道路、行人等概念,全部交給了神經網路自己思考,C++程式碼只有2000 行,而V11 有30 萬行。
其實,端到端模型並不是新概念,早在之前就有人提出過。然而,許多人對神經網路的可解釋性和可靠性一直存在疑慮。儘管端到端系統提高了模型的能力上限,但也放大了神經網路作為「黑盒」的不可解釋性問題,這會為研發迭代和問題解決帶來巨大挑戰。所以,很多公司不敢輕易嘗試。
特斯拉FSD 讓大家看到端到端模型的潛力。當然,這個過程並不是一蹴可幾的。特斯拉一直在自動駕駛技術中,強調端到端的「純度」。從V10.9 版本開始,他們去掉了車道線感知的後處理程式碼,改為由模型直接輸出車道線。在AI Day 上,特斯拉也展示如何將學習型軌跡產生和神經網路決策模型引入規劃控制模組。
然而,特斯拉的技術更新主要集中在技術棧的中上游,如感知和預測,而控制行車功能的決策規劃模組卻很少改變。這導致用戶體驗的改善不夠顯著。
V12 的重大突破在於打通了整個技術堆疊的最後一環(決策規劃),使系統能夠進行端到端資料驅動,最終實現了更自然、更智慧的駕駛行為。
隨著V12 採用了端到端技術架構,直接優化了規劃控制輸出,因此使用者體驗的改善將會更加迅速。 5 月初,馬斯克宣布,特斯拉的FSD 系統即將迎來三大更新版本,分別為V12.4、V12.5 和V12.6。
其中,V12.4 版本預計將在5 月中旬推出,該版本將全面更新模型訓練,以提高系統的準確性和可靠性。其次,針對使用者回饋的加速過猛和煞車過急問題,V12.4 以及後續版本將重點優化駕駛舒適度,從而提升乘客的駕駛體驗。
回到本文開頭,馬斯克造訪中國,似乎正在讓FSD「落地中國」這件事變得更具可信性。甚至,外網盛傳比亞迪和特斯拉在FSD 將展開合作的消息,更將FSD 入華的潛力獲得更大的釋放——世界上最大的兩家新能源車公司的合作,會產生怎樣的結果?
如果傳言成真,特斯拉FSD 是否會改變當前智慧駕駛領域的局面?中國車企的智慧駕駛「故事」又將如何繼續發展?
這大概是所有人都會幻想,卻不太敢問的問題。