“聽聲避險”?這個AI可精確辯聲幫助防盜和規避交通事故
位於英國劍橋的聲紋識別技術供應商Audio Analytic公司,正致力於將以人工智能(AI)為核心的聲音識別技術應用於消費設備中。就像語音識別可以識別說出的語句一樣,這家公司的聲音識別技術也可以分辨出狗的叫聲和嬰兒的哭聲。
Audio Analytic首席執行官克里斯·米切爾(Chris Mitchell)表示:“這相當於一種語言模型,但它只適用於聲音。”
Audio Analytic公司的聲音識別AI系統AuditoryNET具有極其廣泛的用途。該公司正與德國耳機製造商Bragi合作,生產擁有AI支持功能的耳機,它可通過識別救護車的警報器,並提醒用戶其接近的方向,來優先考慮用戶的安全。
米切爾說,這個想法是為了保護用戶免受“各種危險情況的傷害,因為人們正讓自己在城市裡完全失聰”。
Audio Analytic公司還將AuditoryNET嵌入到智能家居設備中,如Hive Home Hub 360,它可以檢測煙霧和一氧化碳探測器、吠叫的狗或窗戶被打破的聲音。AuditoryNET不需要互聯網連接就能運行,這對注重隱私的人來說是個好消息。
為了訓練AuditoryNET的算法,Audio Analytic公司使用了世界上最大音頻數據收集平台Alexandria提供的數據。米切爾說:“我們最近做的事情是繪製出我們整個聲音世界的地圖。”
Audio Analytic公司的聲音地圖包含600萬份音頻文件,包括六種類型的餐廳窗戶玻璃碎裂的聲音。
Audio Analytic公司已經創建了一個包含600多萬個音頻文件的聲音地圖。它看起來就像是個彩虹蜂巢:在視覺上代表著相似的聲音聚集在一起的彩色塊,或稱為“色調島嶼”。
米切爾表示,通過調整音量,他們的技術可以識別出有細微差別的聲音。比如來自餐廳玻璃的破碎聲就有6種,其中由玻璃製成的層壓板的碎裂聲與其他聲音截然不同。
Alexandria的音頻樣本數據池必須從頭開始構建。電影中常見的聲音是沒有用的,因為它們並不真實。米切爾說:“如果你去看最新的《復仇者聯盟》電影,我敢肯定綠巨人會把什麼東西掉在車上。”
他說:“那個汽車警報器發出的聲音並不是真正的汽車警報器。”這種聲音將訓練AI面對虛假的現實,通常是災難性的,比如需要檢測是否有人闖入汽車。因此,該公司建立了自己的實驗室來捕捉原始聲音,並派出團隊在各種環境中錄製其他聲音。
他們甚至依靠志願者網絡進入聲音實驗室,或者使用錄音機捕捉真實世界中的各種聲音。
Audio Analytic公司的未來計劃依然處於保密之中,但它的目標十分明確,即繼續開發識別家庭內外聲音的技術,包括那些聽起來像警報器的鳥鳴。(選自:WIRED 作者:Will Bedingfield 編譯:網易智能參與:小小)