特斯拉FSD 12直播首秀45分鐘僅一次干預視頻“餵”出AI“代駕”
正如之前承諾的一樣,馬斯克上週末用一輛搭載HW3的Model S,向外界直播展示了特斯拉FSD 12測試版。在這場45分鐘的直播中,坐在方向盤後、舉著手機的馬斯克僅干預了一次車輛行為,車輛在非預設道路上,便能自行禮讓行人、避開路障、路口轉向、在兩條直行道中選擇一條車少的。
馬斯克表示,FSD 12可以在不熟悉的環境中離線使用;若有乾預行為發生,系統會記錄並發回特斯拉分析。
而在直播開始後約20分鐘時,馬斯克進行了全程唯一一次干預接管。當時,這輛Model S需要直行,因此停下等待紅燈。但當左轉信號燈轉綠時,車輛竟然也緊跟啟動,好在馬斯克與一旁的工程師及時制止。
在這之後,馬斯克表示,要給FSD“投餵”更多左轉紅綠燈的視頻。
▌投餵視頻就能“餵”出“AI代駕”?
實際上,在這場直播中,當車輛自行在減速帶減速、避開滑板車騎行者時,馬斯克多次強調, FSD 12中沒有任何一行相應代碼,人為設定車輛作出這些動作——其沒有被訓練過如何讀取路標,也不知道什麼是滑板車,FSD 12完成這些行為完全是大量視頻訓練的結果。通過視頻訓練數據,AI可以自己學習駕駛,“像人類一樣做事”。
如果FSD在特定場景下沒有作出正確決策,特斯拉便會向其神經網絡訓練投入更多數據(主要是視頻)。
當然,平庸隨意的數據是不夠的,供給神經網絡的數據需要精心挑選。馬斯克也特別強調,來自優秀駕駛員的高質量數據,才是訓練特斯拉自動駕駛的關鍵。
“大量平庸的數據並不能改善駕駛,數據管理相當困難。我們有很多軟件,可以控制系統選擇什麼數據、訓練什麼數據。”
而對特斯拉而言,其數據的一大主要來源便是來自全球各地的車隊。馬斯克還透露,特斯拉在世界各地擁有多名FSD測試駕駛員,包括新西蘭、泰國、挪威、日本等。
從2020年起,特斯拉便開始將Autopilot決策從編程邏輯轉向神經網絡與AI。經過3年的發展,從本次馬斯克的FSD 12直播也能看到,幾乎整個決策與場景處理已轉移至特斯拉神經網絡與AI上。
FSD 11獨占控制堆棧中有超過30萬行C++代碼,而12中代碼寥寥。之前馬斯克也曾指出,車輛控制(vehicle control)是“特斯拉FSD AI拼圖”上的最後一塊拼圖,其將使得這30萬行以上的C++代碼減少約2個數量級。
▌全AI端到端駕駛控制
特斯拉FSD 12是其最重要的一次升級,實現了全AI端到端的駕駛控制。
至於為何選擇端到端方案?馬斯克直播之前與WholeMars連線時,給出了更多細節。
“人類就是這麼做的,”他表示,“光子輸入,手腳動作(控制)輸出。”——人類依靠眼睛和生物神經網絡開車,對於自動駕駛而言,攝像頭與神經網絡AI便是正確的通用決策方案。
雖說AI神經網絡難以解釋具體細節,但相應地,人類乘客在打車時,也無法準確地知道司機在想什麼,只能看到司機的評價。
券商指出,端到端方案與之前的關鍵區別之一就在於,傳統的模塊化架構是將智能駕駛拆分稱單獨任務,交由專門的AI模型或模塊來處理,例如感知、預測、規劃等;而端到端AI則是“感知決策一體化”,即將“感知”與“決策”融合到一個模型中。
目前,特斯拉絕大多數訓練還是需要依靠英偉達的GPU,特斯拉自家的Dojo超算則是作為輔助。今年以來,特斯拉已為訓練花費了20億美元。
特斯拉還正在加班加點,籌備一個新算力集群,其中包含1萬顆英偉達H100,有望在本週一(8月28日)上線。值得一提的是,該集群使用的是Infiniband進行連接傳輸,馬斯克更坦言,如今Infiniband比GPU更缺。