外國如何防疫?吳恩達旗下公司發布AI社交距離監控工具
近日,吳恩達創立的AI公司Landing AI發布了一款社交距離檢測工具,幫助疫情期間不得不工作的人,確保他們在工作場所的社交距離,該工具可以通過分析攝像頭拍攝的實時視頻流來檢測人們是否保持安全距離。
例如,在一家生產防護設備的工廠,技術人員可以將該軟件集成到他們的安全攝像系統中,通過簡單的校準步驟來監視工作環境。如下面的演示所示,探測器可以用紅色高亮顯示距離低於最小可接受距離的人,並在兩者之間畫一條線進行強調。該系統還能發出警報,提醒人們在違反協議時保持安全距離。
作為人工智能和機器學習領域國際上最權威的學者之一,吳承恩也是原Google Brain項目創始人,關於他曾轟動一時的事件是,其開發的人工神經網絡通過觀看一周YouTube視頻,自主學會識別出關於貓的視頻。這個案例為人工智能領域發展翻開嶄新一頁。
2014年,被冠以“谷歌大腦之父”的吳恩達加入百度,負責Baidu Brain計劃,此次加盟被認為是中國互聯網公司迄今為止引入的最重要的外援。2017年,吳恩達離開百度,創立了Landing AI。
Landing AI對此次開發軟件的技術方法進行了詳細的介紹,搭配攝像機的軟件技術包含三個主要步驟:校準、檢測和測量。
校準
由於輸入的視頻由任意的透視角度拍攝,因此視頻輸入的第一步是利用計算將透視視圖轉變為鳥瞰視圖,即將自上而下視圖轉為單應性矩陣視圖(計算機視覺中意思是從同一個源發出的光而得到的變化圖,即射影變換),這個過程被稱為校準。由於輸入幀是從單個攝像機獲取的單眼圖像,因此最簡單的校準方法是在透視圖中選擇四個點,並將它們映射到鳥瞰視圖中的矩形角,這是假設每個人都站在同一平面上。這個原理可以應用於整個透視圖的轉換。這種方法雖然廣為人知,但能在現實中正確地應用卻並不容易。因此,Landing AI開發人員構建了一個輕量級工具,即使是非技術用戶也可以實時校準系統。
在校正步驟中,他們還考慮了鳥瞰圖的比例係數,例如現實生活中6英尺對應多少像素。
圖片來自Landing AI 官網
左邊是原始的透視圖,上面覆蓋了一個校準網格。右邊是由此產生的鳥瞰圖。街道的兩邊完全平行於綠色網格。
檢測
視頻輸入的第二步涉及到將行人檢測器應用到透視圖上,以便在每個行人周圍繪製邊界框。為了簡單起見,開發者使用了一個基Faster於R-CNN架構的開源行人檢測網絡。為了清除輸出邊界框,採用最小的後置處理,如非極大值抑制(NMS)和各種基於規則的啟發式算法; Landing AI方認為,開發者應該選擇基於現實生活假設來選擇規則(例如,識別人類的身高而非寬度),以最大程度降低過度擬合的風險。
測量
第三步,給定每個人邊界框,預估他們的在鳥瞰圖中的坐標位置(x軸, y軸)。由於校準步驟輸出一個平面圖的變換,因此開發者將該變換應用到每個人的邊界框的底部中心點,從而得到他們在鳥瞰視圖中的位置。最後一步是計算出每兩人之間的鳥瞰圖距離,並根據標定得到的比例係數對距離進行縮放處理。用紅色突出那些距離低於最小可接受距離的人,並在兩者之間劃一條線進行強調。
考慮到計算機視覺的興起帶來了隱私和個人權利問題, Landing AI表示,他們目前的系統不會識別個人,也將敦促任何使用此系統的人必須做到公開透明且僅在當事人知情同意的情況下使用。
Landing AI總部位於美國矽谷,由前百度首席科學家、前谷歌大腦創始人之一吳恩達於2017年底創辦,專注於為傳統企業提供人工智能轉型方案及服務。截至目前,Landing AI已獲得包括三星、阿里巴巴、聯想、英特爾、AIFund等多家機構的投資。
據悉,國際權威諮詢機構Gartner發布了《2020人工智能核心技術最酷供應商報告》,Landing AI憑藉其助力企業實現人工智能落地與規模化應用方面的成績成功入選。