科學家設計出一種可在擁擠的空間中用眼神分離出特定聲音的AI耳機
在一個擁擠吵雜的空間裡,很多人都在說話,很難聽清楚一個人在說什麼。這對於重聽者來說尤其如此。雖然現代助聽器採用了降噪技術,但並不能完全消除背景噪音。華盛頓大學(UW)的研究人員設計出了一種在嘈雜環境中提高聽力的解決方案。他們利用裝有人工智慧的普通降噪耳機,開發出一種只需佩戴者看一眼就能分辨出說話者聲音的系統。
華盛頓大學保羅-艾倫電腦科學與工程學院教授、本研究的資深作者希亞姆-戈拉科塔(Shyam Gollakota)說:「我們現在往往認為人工智慧是基於網路的聊天機器人,可以回答問題。但在這個專案中,我們開發的人工智慧可以根據佩戴耳機的人的喜好,改變他們的聽覺感知。也能清楚聽到單一揚聲器的聲音。
這種耳機配有麥克風和一個按鈕華盛頓大學
研究人員開發的”目標語音聽力”(THS)系統簡單而有效。現成的耳機裝有兩個麥克風,每個耳罩上一個。配戴者看著想要聽到的人,按下一次耳機側面的按鈕,持續三到五秒鐘。說話者的聲波會同時傳到兩個麥克風上(誤差範圍為16 度),然後被送到機載電腦上,由機器學習軟體學習說話者的發聲模式。然後,說話者的聲音就會被分離出來,並透過耳機傳送,即使他們走動時也是如此,無關的噪音也會被過濾掉。
下面的影片展示了耳機的功效。它能快速過濾環境噪音,將注意力集中在擴音器上,消除附近(室內)有人講電話和室外噴泉發出的吵雜聲。
人工智慧能以多快的速度處理說話者的聲音並消除不想要的聲音?研究人員在測試時發現,他們的系統的端對端延遲時間為18.24 毫秒。相比之下,眼睛眨一下的時間在300 到400 毫秒之間。這意味著,從看著你想聽的人到耳機裡只聽到他的聲音之間幾乎沒有延遲時間,一切都是即時發生的。
他們讓21 名受試者體驗了THS 系統,受試者對耳機在真實的室內和室外環境中提供的噪音抑制效果進行了評分。平均而言,受試者對說話者聲音清晰度的評分是未處理的兩倍。
他們的THS系統建立在華盛頓大學研究人員之前開發的”語義聽覺”技術基礎之上。與THS 一樣,該技術使用的是智慧型手機上運行的人工智慧演算法,該演算法與降噪耳機無線連接。語意聽覺系統可以準確辨識鳥鳴、警報和警報等噪音。
目前,新系統一次只能過濾一個目標揚聲器,而且只能在與揚聲器同一方向沒有其他大音量聲音時過濾。但如果耳機佩戴者對音質不滿意,他們可以對揚聲器的聲音重新取樣,以提高清晰度。研究人員正在努力將他們的系統擴展到耳塞和助聽器。他們還在GitHub 上公開了THS 程式碼,以便其他人在此基礎上進行開發。該系統尚未投入商業使用。
本月早些時候,研究人員在夏威夷檀香山舉行的美國電腦協會(Association of Computing Machinery,ACM)電腦-人類互動(Computer-Human Interaction,CHI)會議上介紹了他們的研究成果,並獲得了榮譽獎。未發表的研究論文可在此查閱。