達摩院再獲自動駕駛測評第一可識別厘米級障礙物
在自動駕駛權威數據集Semantic KITTI上,達摩院憑藉全新算法在“單幀3D點雲語義分割”排行榜獲得第一。該技術用於達摩院的無人物流車後,大幅提升了車輛的環境精細化理解能力,使車輛能夠識別“厘米級”障礙物。
KITTI數據集是全球最權威的自動駕駛計算機算法評測數據集,為促進基於激光的語義分割研究,KITTI推出了細分數據集Semantic KITTI,通過全類別分割平均交並比(mIOU)和整體準確率(accuracy)兩大指標,考察參賽者的技術能力。達摩院團隊在兩項指標的評比中均拿下第一。
點雲(Point Cloud)是擁有三維坐標、強度等信息的激光點的集合,是計算機視覺領域常用的三維數據表示方式。自動駕駛車輛通常藉助激光雷達、攝像頭、毫米波雷達等傳感器識別環境信息。對於激光雷達獲取的周圍環境的3D點雲,識別每個點的語義標籤,就是“3D點雲語義分割”。
圖左為原始點雲,圖右為經過語義分割的點雲,自動駕駛車輛辨別出了行人、車輛、樹木、建築等物體。
除了行人、車輛等常規檢測目標,道路周圍的建築、綠化、不明障礙物也會影響自動駕駛車輛的駕駛行為,3D點雲語義分割技術的目標,便是幫助車輛更精細地理解道路環境。
達摩院自動駕駛實驗室資深算法專家卿泉介紹,業界通用的點雲局部上下文特徵建模方法難以滿足自動駕駛實時、精準的感知需求。達摩院提出的新算法以激光點為載體,結合每個3D點在鳥瞰、前視等視角下的鄰域特徵,通過多層級聯編碼進行特徵學習,很大增強3D點的特徵表示能力,由此提高了語義識別的準確性。
該算法應用於達摩院的無人物流車後,車輛對障礙物的精細化識別水平大幅提升。比如在行駛途中遇到臨時拉起的警戒線,即便線寬僅有3厘米,物流車也能輕鬆識別並繞道而行。