馬斯克:自動駕駛依賴激光雷達注定失敗專家表示不服
8月13日報導在眾多生產商著手研發自動駕駛汽車的大環境下,幾乎所有的汽車都使用了激光雷達,並用以打造一種傳感器。這種傳感器可以藉助雷達展現三維地圖中車輛周圍的情況。然而特斯拉的首席執行官埃隆·馬斯克卻表示,這樣的做法是錯誤的。
原標題馬斯克:自動駕駛依賴激光雷達注定失敗,專家表示不服
編譯Liam
資料圖
先有特斯拉於今年4月份舉辦展示活動,介紹其自動駕駛技術。馬斯克在這次展會中表示,這些生產商終將放棄激光雷達,因為任何利用激光雷達研發自動駕駛汽車的人都注定失敗。
後有特斯拉人工智能專家Andrej Karpathy表示,激光雷達確實為研發提供了一條捷徑,但是這種方法並沒有考慮到一個基本問題,那就是視覺識別在這當中的重要性。這個方法帶給他們一種進步的錯覺。
許多專家對該說法發出了質疑。
首先來自密歇根大學自動駕駛汽車試驗場MCity的研究員Greg McGuire就指出:從某種意義上來說,這些傳感器都是一種依賴。作為工程師,他們就是這麼做的,即創造依賴性。
McGuire還表示,只有當自動駕駛汽車真的非常安全可靠時,它才能被社會所接受。想要達到高度的可靠,就要堅持一個重要的原則——冗餘。任何傳感器最終都會失靈,但如果使用幾種不同類型的傳感器,那就可以降低因為某一個傳感器發生故障導致事故發生的可能性。
其後,又有行業分析師(及前汽車工程師)Sam Abuelsamid表示,一旦你將這些理論技術用於現實,有很多未知數你是無法避免的。理論上,你或許可以僅憑相機來採集數據,但若要百分百相信系統的判斷是正確的,最好是有其他正交傳感模式的輔助,例如像激光雷達這樣的傳感模式。
4月22日,就在特斯拉展示自動駕駛技術的同一天,康奈爾大學的三位研究人員發表了一篇研究論文,部分支持了馬斯克關於激光雷達的說法。計算機科學家們只用了立體相機,最終在KITTI(一種熱門的自動駕駛系統圖像識別基準)上取得了突破性的成果。該項新技術性能遠遠優於之前的純相機技術,並且和“相機+激光雷達”的搭配相比也相差無幾。
可惜,媒體對該論文的報導混淆了研究人員的實際發現。例如Gizmodo在報導中表示,這三名研究人員的論文是關於汽車上攝像頭的安裝位置的,但實際上該論文並沒有提到這一點,而Gizmodo也在研究人員聯繫他之後,修改了他這篇報導。
想要恰當地理解這篇論文,我們就需要了解軟件是如何將原始的相機圖像轉換成有標識的三維模型,在地圖上生動地展示汽車周邊情況。在KITTI的測試中,如果該算法能夠精準地識別汽車周邊的每一個對象,並用三維的框框將其標示出來,那麼該算法就被認為是成功的。
通常軟件處理這種測試分為以下兩個步驟。首先,軟件通過某一算法運行圖像,為圖像的每個像素定一個距離估計值。這可以通過一對相機和視差效應的原理來實現。研究人員還研發了其他技術,使用單個相機來估算像素間距。在這兩種情況下,第二步就是通過高度估計值將像素分組,組成不同的對象(比如汽車、行人或自行車)。
康奈爾大學的研究人員將每個立體圖像對應的像素轉換成由激光雷達傳感器生成的三維點雲(點雲數據指的是:掃描資料以點的形式記錄,每一個點包含有三維坐標,有些可能含有顏色信息或反射強度信息)。然後,研究人員將點雲數據輸入到現有的目標識別算法中。
三位研究人員在其論文中表示,他們的方法在圖像識別能力上取得了巨大進步。例如,在KITTI測試的一個版本中,以前純相機採集數據的準確率最高為30%,而現在藉助他們的技術,準確率已經提高到66%。
換句話說,“相機+激光雷達”的模式比純相機使用更加精準,這和激光雷達測量距離時精度更高無關,其主要是因為激光雷達生成的“原生”數據格式恰好更容易讓機器學習算法使用。
這篇論文的作者之一Kilian Weinberger指出,他們的論文寫的是通過將基於相機的數據轉換成激光雷達的點雲數據,顯著縮小兩者之間的差距。
不過,Weinberger也明確表示,激光雷達和非激光雷達之間仍有相當大的差距。在KITTI測試中,康奈爾大學的研究人員將數據的準確率提高到了66%,但在使用相同算法的條件下,直接使用激光雷達生成的點雲數據準確率高達86%。