特斯拉FSD V12在美國推送:AI演算法黑箱端對端控制摒棄人類規則程序
特斯拉FSD V12,一般車主也能用了。特斯拉FSD V12在美推送,不只是特斯拉內部員工,一般車主也有機會體驗端對端自動駕駛了,告別傳統的規則驅動,駕駛決策交由AI演算法產生。儘管FSD V12的更新稱得上是“飛躍”,然而實測視頻,仍帶有Beta後綴的Version 12還稱不上是“終極答案”。
特斯拉FSD V12在美推播
FSD V12 Beta在美推送,不依賴光達,數據驅動AI演算法,媒體示範影片可應付多數場景。
雨夜無保護上坡後左轉:
等待小朋友過完馬路再走:
馬路靠邊側停車:
避讓前方車輛突然煞車停:
整體來看,純視覺的FSD V12 Beta的能力大大提升,針對不規則障礙物等的辨識很準確,有些細節也還原的很好。
程式相容性也提高,這次不僅推送給了原來的HW3.0硬體方案,HW4.0也收到了推送。
但仍有不足,例如不依賴光達,目前純視覺方案在惡劣天氣下的表現不夠好。
首批測試的部落客稱,在大雨天氣下測試FSD V12 Beta多次出現接管。
這也和約一個月前馬斯克給網友的回覆吻合,當時網友在社群平台上催更馬斯克,馬斯克回應FSD V12程式在加州表現還不錯,但還需要多在雨水多的地區訓練。
所以目前推播的v12.1.2版本顯然能力還不夠完善。發布測試影片的部落客隨後也表示:
FSD Beta v12.1.2(最新版本號)並不能實現自動駕駛。
這也許就是為什麼推送的FSD V12仍然帶有Beta(測試版)後綴,此前馬斯克曾公開表示,FSD V12不會是Beta版。
而雖然這次確實是推送給了普通車主,而不僅限於特斯拉內部員工,但推送的車主數量還比較小,特斯拉對此還比較謹慎,也許等後面全員推送,正式公測後會將“Beta”移除也說不定。
要是以目前的表現直接落地中國,怕是會讓很多人告別「FSD崇拜」。
不過儘管存在不足,但FSD V12的更新仍可以稱得上是飛躍,為自動駕駛發展開闢了新道路。
V12和以往FSD版本有什麼不同
特斯拉在最新的OTA註解中表示,V12用海量視訊資料訓練出的端到端神經網絡,替換掉了超過30萬行C++程式碼。
不再是規則驅動的,而是數據驅動的,這是FSD一大進化。
所謂規則驅動,就是過去傳統的自動駕駛程序在根據感知做出決策時,用程式設定規則,if-else的邏輯判斷。
Corner Case(邊緣場景)無窮無盡,很難寫出一段程式覆蓋盡可能多的場景,遇到特殊情況就補一段,長此以往程式碼的冗餘和程式的複雜程度不斷提高,系統最後難免被程式設計師封為「屎山」。
現在轉向數據驅動,用大量的視訊資料訓練神經網絡,不斷改進模型趨向人類老司機。
用一位早前參與FSD V12內測的特斯拉員工所說,過去難以優化的問題迎刃而解──(模型)模仿人類就行了。
FSD V12也不像過去的自動駕駛還要分為三個感知、規劃和控制三個模組,用一個統一體實現了端到端,這頭輸入週邊感知到的數據,那頭輸出駕駛決策。
端到端的神經網路有什麼好處?
從研發來看,過去分成感知、規劃和控制,最終是實現把車開好,但三個模組各自的最佳化目標是不同的,每個模組都會產生bug或是誤差,這些誤差累積下來會導致最終輸出結果出問題。
就好像快過年了咱們一起包餃砸,和餡,和麵,下餃子,最終目標是做好這盤餃子,但是餡、面和下餃子各自所追求的目標是不一樣的,每一步都可能會出問題,導致最終餃子煮爛了。
從商業化落地來看,每個模組獨有體系和機制,這意味著要針對每個模組投入團隊和資金,卻不一定能換回升級迭代效率。
而轉換成端對端這種單一模型後,工程複雜度沒原來高,只需要圍繞著一個最終目的來優化,統一可控。模型的主幹也可以共享提高運算效率。
端到端也使得純粹依靠資料完善程序成為可能。
當然,新的突破帶來新的問題。
過去分成多個模組,升級最佳化更靈活,C++程式可解釋性也更好,從組譯到到編譯,程式運作很清晰。
而端到端自動駕駛是個“黑盒子”,解釋性不太好,增加了人們對自動駕駛的信任成本。
但正如AI大牛何愷明先前在香港中文大學講座中談到的:
你搭計程車遇到的司機師傅是個陌生人,為什麼你會信任他?
你信任他是因為他的大腦是可解釋的,還是你認為一個訓練有素、經驗豐富的司機應該會開的很穩?