特斯拉FSD 12直播首秀45分鐘僅一次干預視頻“餵”出AI“代駕”

2023-08-30 Comments 0 Comment

正如之前承諾的一樣，馬斯克上週末用一輛搭載HW3的Model S，向外界直播展示了特斯拉FSD 12測試版。在這場45分鐘的直播中，坐在方向盤後、舉著手機的馬斯克僅干預了一次車輛行為，車輛在非預設道路上，便能自行禮讓行人、避開路障、路口轉向、在兩條直行道中選擇一條車少的。

馬斯克表示，FSD 12可以在不熟悉的環境中離線使用；若有乾預行為發生，系統會記錄並發回特斯拉分析。

而在直播開始後約20分鐘時，馬斯克進行了全程唯一一次干預接管。當時，這輛Model S需要直行，因此停下等待紅燈。但當左轉信號燈轉綠時，車輛竟然也緊跟啟動，好在馬斯克與一旁的工程師及時制止。

在這之後，馬斯克表示，要給FSD“投餵”更多左轉紅綠燈的視頻。

▌投餵視頻就能“餵”出“AI代駕”？

實際上，在這場直播中，當車輛自行在減速帶減速、避開滑板車騎行者時，馬斯克多次強調， FSD 12中沒有任何一行相應代碼，人為設定車輛作出這些動作——其沒有被訓練過如何讀取路標，也不知道什麼是滑板車，FSD 12完成這些行為完全是大量視頻訓練的結果。通過視頻訓練數據，AI可以自己學習駕駛，“像人類一樣做事”。

如果FSD在特定場景下沒有作出正確決策，特斯拉便會向其神經網絡訓練投入更多數據（主要是視頻）。

當然，平庸隨意的數據是不夠的，供給神經網絡的數據需要精心挑選。馬斯克也特別強調，來自優秀駕駛員的高質量數據，才是訓練特斯拉自動駕駛的關鍵。

“大量平庸的數據並不能改善駕駛，數據管理相當困難。我們有很多軟件，可以控制系統選擇什麼數據、訓練什麼數據。”

而對特斯拉而言，其數據的一大主要來源便是來自全球各地的車隊。馬斯克還透露，特斯拉在世界各地擁有多名FSD測試駕駛員，包括新西蘭、泰國、挪威、日本等。

從2020年起，特斯拉便開始將Autopilot決策從編程邏輯轉向神經網絡與AI。經過3年的發展，從本次馬斯克的FSD 12直播也能看到，幾乎整個決策與場景處理已轉移至特斯拉神經網絡與AI上。

FSD 11獨占控制堆棧中有超過30萬行C++代碼，而12中代碼寥寥。之前馬斯克也曾指出，車輛控制（vehicle control）是“特斯拉FSD AI拼圖”上的最後一塊拼圖，其將使得這30萬行以上的C++代碼減少約2個數量級。

▌全AI端到端駕駛控制

特斯拉FSD 12是其最重要的一次升級，實現了全AI端到端的駕駛控制。

至於為何選擇端到端方案？馬斯克直播之前與WholeMars連線時，給出了更多細節。

“人類就是這麼做的，”他表示，“光子輸入，手腳動作（控制）輸出。”——人類依靠眼睛和生物神經網絡開車，對於自動駕駛而言，攝像頭與神經網絡AI便是正確的通用決策方案。

雖說AI神經網絡難以解釋具體細節，但相應地，人類乘客在打車時，也無法準確地知道司機在想什麼，只能看到司機的評價。

券商指出，端到端方案與之前的關鍵區別之一就在於，傳統的模塊化架構是將智能駕駛拆分稱單獨任務，交由專門的AI模型或模塊來處理，例如感知、預測、規劃等；而端到端AI則是“感知決策一體化”，即將“感知”與“決策”融合到一個模型中。

目前，特斯拉絕大多數訓練還是需要依靠英偉達的GPU，特斯拉自家的Dojo超算則是作為輔助。今年以來，特斯拉已為訓練花費了20億美元。

特斯拉還正在加班加點，籌備一個新算力集群，其中包含1萬顆英偉達H100，有望在本週一（8月28日）上線。值得一提的是，該集群使用的是Infiniband進行連接傳輸，馬斯克更坦言，如今Infiniband比GPU更缺。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

WONGCW 網誌

記錄生活經驗與點滴

特斯拉FSD 12直播首秀45分鐘僅一次干預視頻“餵”出AI“代駕”

2023-08-30 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆