特斯拉收購初創公司專注自動駕駛“深度神經網絡”
特斯拉收購計算機視覺初創公司DeepScale的交易開始收穫回報,通過收購完整團隊開始為這家電動汽車製造商提供新的專利。2019年年底,有消息稱特斯拉收購了位於舊金山灣區的初創公司DeepScale,該公司專注於開發自動駕駛汽車的“深度神經網絡”,收購金額未披露。
DeepScale專注於計算節能的深度學習系統,這也是特斯拉關注的重點領域,特斯拉決定設計自己的電腦芯片來驅動自動駕駛軟件。有猜測稱,特斯拉收購這個團隊是為了加速其機器學習的發展。
現在,特斯拉公佈了名為“用擴充數據訓練機器模型的系統和方法”的新專利,我們也看到了這筆收購帶來的成果。這項專利的發明者包括DeepScale的三名成員,分別是馬修·庫珀(Matthew Cooper)、帕拉斯·賈因(Paras Jain)和哈西姆蘭·辛格·西杜(Harsimran Singh Sidhu )。
目前在特斯拉旗下工作的DeepScale團隊正在嘗試申請的這個系統,它與利用幾個不同傳感器觀測場景的數據來訓練神經網絡有關,比如特斯拉司機輔助駕駛系統Autopilot傳感器陣列中的八個攝像頭。
特斯拉在專利申請中描述了這種情況的困難:“在典型的機器學習應用中,數據可以通過多種方式進行擴充,以避免過度擬合用於獲取訓練數據的捕獲設備的特徵模型。例如,在用於訓練計算機模型的典型圖像集中,圖像可能代表許多不同捕獲環境的對象,這些環境具有與被捕獲對象相關的不同傳感器特徵。例如,這樣的圖像可以通過不同的傳感器特性來捕獲,就像不同的尺度、焦距、鏡頭類型、預處理或後處理、軟件環境以及傳感器陣列硬件等等。這些傳感器在不同的外部參數方面也可能有所不同,例如成像傳感器的位置和方向相對於捕獲圖像時的環境。所有這些不同類型的傳感器特性都會導致所捕獲的圖像在圖像集中呈現不同的形式,使正確地訓練計算機模型變得更加困難。”
對此,特斯拉團隊總結了他們應對這個問題的解決方案:
第一個部分是用於訓練預測計算機模型一組參數的方法。該實施例可以包括:1)識別由一組攝像頭捕獲的圖像,該圖像被附加到一個或多個圖像收集系統中;2)對於圖像集合中的每一幅圖像,識別該圖像的訓練輸出; 3)對於該組圖像中的一幅或多幅圖像,通過以下特定步驟生成增強圖像:通過用維護圖像的攝像頭屬性的圖像操縱功能修改圖像來為該組圖像生成增強圖像,並將該增強訓練圖像與該圖像的訓練輸出相關聯;4)訓練預測計算機模型的該組參數以基於包括該圖像和該組增強圖像的圖像訓練集來預測訓練輸出。
第二部分包括具有一個或多個處理器和存儲指令的非暫時性計算機存儲介質系統,該指令在由一個或多個處理器執行時,會使處理器執行相關操作,這些操作包括:1)識別由一組攝像頭捕獲的、同時附著到一個或多個圖像採集系統的圖像集合;2)對於所述圖像集合中的每幅圖像,識別圖像的訓練輸出;3)對於該組圖像中的一幅或多幅圖像,通過以下步驟為一組圖像生成增強圖像:通過用維護圖像的攝像頭屬性的圖像處理函數修改圖像來為該組圖像生成增強圖像,並將該增強訓練圖像與該圖像的訓練輸出相關聯;4)訓練預測計算機模型的參數集來預測基於圖像訓練集的訓練輸出,包括圖像和增強圖像集。
第三部分以包括具有供處理器執行指令的非暫時性計算機可讀介質,該指令在由處理器執行時使得處理器能夠:1)識別由一組攝像頭捕獲的、同時附著到一個或多個圖像採集系統的一組圖像;2)對於該組圖像中的每幅圖像,識別該圖像的訓練輸出;3)對於該組圖像中的一幅或多幅圖像,通過以下步驟為一組圖像生成增強圖像:通過用維持圖像的攝像頭屬性的圖像操作功能修改圖像來為一組圖像生成增強圖像,並將增強的訓練圖像與圖像的訓練輸出相關聯;4)訓練計算機模型以學習基於包括圖像和該組增強圖像的圖像訓練集來預測訓練輸出。
正如之前報導的那樣,特斯拉正在經歷“對特斯拉Autopilot的重大基礎性重寫”。作為重寫的一部分,首席執行官埃隆·馬斯克(Elon Musk)表示:“神經網絡正在吸收越來越多的問題。”
新專利中還將包括一個標籤系統,馬斯克稱3D標籤將改變遊戲規則:汽車進入有八個攝像頭的場景,畫一條路,然後你可以用3D標記那條路。這種用多個攝像頭訓練機器學習系統的新方法,就像特斯拉的Autopilot一樣,帶有附加數據,可以成為Autopilot更新的一部分。