馬斯克:如果能自動駕駛特斯拉將比以前更值錢
德國《商報》網站5月5日報導,根據埃隆·馬斯克的說法,其新項目TruthGPT的人工智能意在拯救世界。但實際上,這項技術對於特斯拉的自動駕駛汽車——以及汽車行業的未來——至關重要。自ChatGPT去年秋季發布以來,世人一直在討論這種新的生成式人工智能模型帶來的機會和風險。
馬斯克曾一再對人工智能的發展表達批評之意,之前甚至呼籲在監管框架建立前要有一段冷靜期。根據馬斯克的說法,人工智能甚至應該弄清宇宙的真相。這聽起來是一個崇高的目標,但馬斯克對人工智能感興趣可能有一個更簡單的原因。
專家認為,人工智能是電動汽車製造商特斯拉最終接近實現全自動駕駛這一目標的一個途徑。最近,馬斯克想在已售出的汽車中安裝必要的軟件。他宣稱:“如果能自動駕駛,我們的汽車將比以前更值錢。”
像ChatGPT那樣的人工智能模型可以在所有全自動駕駛系統中發揮重要作用。但在所有致力於實現這一目標的汽車製造商中,特斯拉最需要突破。這有什麼原因?人工智能可以解決哪些問題?
算法優化
特斯拉今天已經在以1.5萬美元的額外價格銷售名為“全自動駕駛”(FSD)的套件。然而,與名稱所承諾的相反,FSD並不能讓車輛實現自動駕駛。FSD對應當前自動駕駛等級中的二級,即只輔助駕駛員。全自動駕駛相當於五級。德國奔馳汽車公司已經提供了三級系統。因此,特斯拉提供的東西相對較少。
問題是,馬斯克在自動駕駛方面採取了一種幾乎沒有其他汽車製造商青睞的特殊方法。早在幾年前,特斯拉就禁止在其汽車上使用雷達等額外的支持性傳感器。馬斯克還拒絕了奔馳和“字母表”公司(Google母公司)旗下自動駕駛汽車研發企業“出行新方式”公司使用的更先進的激光雷達傳感器。
結果是,特斯拉汽車只能藉助攝像頭拍攝的圖像來導航。這導致錯誤和事故,其中一些是致命的。多年來,馬斯克一直承諾要推出全自動駕駛汽車,但一再食言。他最終會在新的人工智能模型的幫助下實現突破嗎?
人工智能可以大大改善對攝像頭拍攝圖像的解讀。法國凱捷諮詢公司的汽車專家彼得·芬特爾說:“未來,這項技術可以讓自動駕駛實現質的飛躍。”
重要的關鍵詞是轉換器(Trans-former)。它是ChatGPT等語言模型的核心,也可能是未來自動駕駛計算機的核心。與以前的模型相比,它有許多優勢。
在很長一段時間裡,所謂的“卷積神經網絡”是人工智能圖像分析的唯一標尺。“卷積神經網絡”自2012年以來流行,能在自己的框架內理解圖像。然而,它也有弊端:為了應對大量的數據,它會“忘記”數據。而且,儘管它會隨著用於訓練的數據量的增加而優化,但只能優化到一定程度。在那之後,它的“進步曲線”就會變平。
“算法沒有直覺。”人工智能芯片開發商以色列海洛技術公司的汽車部門負責人亞尼夫·蘇爾克斯解釋說。算法不知道新圖像是關於什麼的。算法不善於區分重要的像素和不重要的像素,蘇爾克斯解釋說,“它不知道要關注圖像的哪個區域。”
Google在2017年推出的轉換器帶來了轉機。轉換器就是GPT中的T代表的含義,GPT是“生成式預訓練轉換器”的英文首字母縮略語。它對輸入數據進行加權,例如,它會分析一個詞在一個句子中的重要性以及它與其他詞的關係。如果對像素做同樣的事,就可以分析和創建圖像。
專家們談到“注意力”。轉換器可以針對不同的輸入數據設置其“注意力”。《注意力是你所需要的一切》是“Google大腦”項目2017年發表的研究論文的標題。德國慕尼黑大學人工智能教授比約恩·奧默爾說:“模型越來越好。”
奧默爾介紹了大約兩年前取得的驚人成功,例如,當時他開發的人工智能模型第一次能夠在圖像中創造出水面上的山峰倒影——該模型事先並未被要求這樣做。
奧默爾說:“這些模型可以在圖像中創造出以前不可能實現的參照物。對交通圖像分析而言,這極具重要性。汽車可以利用人工智能建立一個環境模型,更好地了解交通動態。它們可以篩選出更多的數據,更好地評估交通狀況。例如,如果道路一側有一隻鹿,另一側也有一隻鹿,那麼人工智能就會關注圖像中“鹿”的部分,並建立一種聯繫:在這種情況下,整個鹿群可能會穿過道路——這意味著有發生事故的風險!
預先訓練
“轉換器能夠根據無標籤的數據重構有意義的內容。”科技老牌企業國際商業機器公司(IBM)的人工智能主管羅布·托馬斯說。這意味著,轉換器不只可以正確解釋在過去10年人工智能發展過程中被大量人類僱員分類的數據,它還可以處理抽像數據,比如交通標誌或車輛輪廓。
只有轉換器能給模型提供必要的背景,使今天的應用成為可能。托馬斯說:“轉換器是下一代人工智能基本模型的基本組成部分。”
以ChatGPT為例可以看出,新算法在實踐中能做什麼。人工智能可以更快地分析和理解大量文本。而且,它可以寫出看起來像人類作品的文章或詩歌。
特斯拉公司對這一理念進行了仔細研究。在幾個月前的投資者日上,該公司自動駕駛研發部門的新負責人阿肖克·埃盧斯瓦米說:“我們採用的原理與ChatGPT相同。”他說,轉換器已經是一些自動駕駛系統的一部分。
但是,有望實現突破的不僅僅是轉換器算法的新分析能力。它的生成能力也有助於實現自動駕駛。換句話說,轉換器可以在自動駕駛汽車上路前對其進行訓練。
在這方面,GPT也是參照對象。GPT中的P代表“預訓練”,G代表“生成式”。轉換器可以生成文本、聲音和圖像。這使它能夠生成“合成的”交通數據,比如雪地或雨中的停車標誌。這些圖像可以用於訓練和優化自動駕駛系統的人工智能。“合成圖像只能是一種補充,”奧默爾說,“但它們在自動駕駛系統中正變得越來越重要。”
數據氾濫
每輛特斯拉汽車配備8個攝像頭,用於拍攝交通狀況。它們每秒鐘提供幾十張圖像。特斯拉的“廣義視覺系統”必須對這些圖像進行評估。這樣一來,該系統產生的數據量多到令人難以置信。即使是一張郵票大小的照片,也包含超過6.5萬個像素。
特斯拉匯集了2015年推出的Autopilot和2016年推出的FSD採集的圖像數據。僅在FSD的應用過程中,特斯拉就掌握約2億公里行駛里程的數據。特斯拉說,它已經存儲了超過1600億張圖像。“沒有人擁有這種數據優勢,”馬斯克說,“任何了解人工智能的人都明白數據等重要性。”
應對這種數據氾濫勢頭是人工智能研究人員的一項主要任務。一個相對較新且前景光明的方法是Google提出的,即把圖像分成16×16像素的小方塊。然後,可以用一個轉換器來分析和理解這些圖像“瓦片”,這極大地提高了速度和效率。
在美國佐治亞大學人工智能教授約翰·吉布斯看來,這些新方法正中特斯拉下懷。他說:“到目前為止,特斯拉擁有最多的數據。”未來,該公司將能夠更好地利用它們。
蘇爾克斯說,新的GPT模型將帶來重大進步,整個汽車行業都在關注這一發展勢頭,有了這樣一些轉換器和足夠的數據,人工智能的圖像識別能力將達到與人類相當的水平”。但這並不代表它們能解決自動駕駛面臨的所有挑戰。
蘇爾克斯懷疑轉換器能否解決最難的問題:長尾/邊緣情況,也就是交通中特別具有挑戰性的獨特情況。他警告說,在這些情況下,未來仍然需要額外的傳感器,而不僅僅是攝像頭。“無論轉換器模型有多好,如果輸入數據不好,哪怕是最好的模型也會失敗。”
他說,一個例子是,當一輛汽車駛出隧道時,在刺眼的陽光照耀下,攝像頭所拍圖像完全是白的。蘇爾克斯說:“在那一秒,沒有數據,無論轉換器有多好。這是一個問題。如果沒有數據,任何機器學習模型都無法施展魔法,這是一個事實——不管使用什麼模型。”
芬特爾說:“人工智能技術的進步,比如轉換器模型,有一天會摘得安全自動駕駛領域的聖杯,在盡可能多的操作領域達到四級。但是,對於能否在沒有激光雷達或先進雷達傳感器的情況下純粹依靠攝像頭來實現這一點,我持懷疑態度。”
只有安裝這些傳感器,才能在大雪、大雨或大霧等“邊緣情況”下讓汽車前方的物體變得清晰可見,進而防止事故發生。但特斯拉老闆馬斯克繼續拒絕接受這種觀念。