在吵雜背景中分離特定聲音AI助美國公司攻克聲學難題
如何在吵雜的背景中分離特定聲音,一直是聲學領域的難題,也被人們稱為「雞尾酒會問題」——站在滿是人的房間裡,手持雞尾酒,努力辨識賓客對話。如今,美國一家公司正利用AI技術提供新的解決想法。
根據雅虎新聞網5日報道,美國「波浪科學」公司創始人基思·麥克爾文多年前在協助美國政府處理一起戰爭罪案件時對解決「雞尾酒會問題」產生了興趣。麥克爾文說:「我們試圖弄清楚是誰下令屠殺平民。一些證據包括一群人同時說話的錄音——那時我才了解『雞尾酒會問題』是什麼」。他說,「我當時成功地從語音中去除環境噪音,但當我開始嘗試從不同人的說話聲中分離目標聲音時,發現這是一個非常困難的問題」。
為此,麥克爾文在2009年創立了「波浪科學」公司。該公司最初使用陣列波束成形技術(array beamforming)來分離聲音,但該技術成本太高且在許多情況下無法取得良好效果。經過10年的長期研究,麥克爾文最終利用AI技術找到了解決方案。
報導稱,麥克爾文編寫了一款人工智慧程序,可以透過分析聲音在到達麥克風之前如何在房間裡反射,定位其原始來源,並藉此篩選出乾擾聲音。該技術的首次應用就幫助破解一起謀殺案,此後包括英國在內的多國政府也對這項技術進行了測試。目前「波浪科學」公司正在向美國軍方推銷該技術,美國軍方已將其用於分析聲吶訊號。