微軟研究院展示虛擬麥克風陣列技術借助多設備實現高精度語音轉錄
在《蝙蝠俠》系列的《黑闇騎士》影片中,布魯斯·韋恩通過攻擊數百萬部手機,打造了一套基於麥克風陣列的龐大監聽網絡(SONAR)。不過本週,微軟研究院展示了一項類似的技術,它就是Project Denmark 。其允許使用手機和筆記本電腦中的麥克風,創建出一個虛擬的麥克風陣列,並用於高精度地收聽和會議轉錄。
(圖自:Microsoft Research)
虛擬麥克風陣列可將現有設備(如配備普通麥克風的手機或筆記本電腦等),動態組合成一個更大的陣列。
具體說來是,該系統基於連續音頻流對齊、盲波束成形、語音識別、分割聚類(Diarization)、以及系統融合等技術來實現。
(截圖via MSPU)
借助七組音頻流輸入,微軟研究院已實現22.3%的錯字率。在近距離麥克風的非重疊語段上,更是可以將錯字率控制在3%以內。
至於系統支持的用戶數量,則取決於區域內配備的麥克風數量。微軟指出,該技術可方便客戶隨時隨地地輕鬆轉錄會話內容,而不論其是否擁有專屬的麥克風陣列。