新專利顯示蘋果正在研究如何利用音頻來估計設備與說話用戶的距離
新專利顯示,蘋果正在研究HomePod或其他設備如何利用音頻來估計與說話用戶的距離,還可以識別周圍的聲音。蘋果的HomePod已經很好地聽到了你的聲音,即使是在大聲播放音樂的時候。現在新專利申請顯示,蘋果希望改進這一點,並將設備的聽覺能力,提升到一個新的水平。
一項是名為”基於學習的距離估計”的專利,涉及到使用音頻不僅僅是為了識別用戶,而是為了弄清用戶的位置。蘋果在專利當中表示,設備使用緊湊麥克風陣列估計設備到用戶的距離,例如,設備可以根據用戶與設備的估計距離來調整播放音量或智能輔助設備的響應。因此,如果用戶離設備非常近,音樂或語音將不會以高音量播放,另外,如果用戶離得很遠,媒體播放或智能助理設備的響應可能會被調整到更大的音量。
這個想法也是為了改進蘋果目前令人印象深刻但又有些缺陷的系統,即多個蘋果設備都會嘗試確定你對哪個設備說了”嘿,Siri”。對此,蘋果在專利當中表示,在有多個設備的應用場景中,設備之間可以相互協調或仲裁,根據每個設備到用戶的距離來決定哪一個或多個設備應該回複查詢。
在專利當中,蘋果提出了簡單和更複雜的解決方案,這些方案都可以協同使用。比較簡單的是讓設備像HomePod一樣,先繪製出環境圖。然後,它有效地擁有一個聲學環境中的測量或模擬點的網格。在這種情況下,就可以將聲音與這個”網格”進行對比,從而大致判斷出說話的人所在的位置。
如果這不夠好,蘋果還有另一個解決方案,它涉及”基於學習的系統,如深度神經網絡(DNN),而且不需要多個設備互相協調幫助。蘋果在專利當中表示,深度學習系統可以根據緊湊的麥克風陣列接收到的語音信號,估計語音源在每個時間段的距離。這個DNN系統可以做的是確定什麼是語音,什麼是背景噪聲。然後,它可以計算出關於直接信號傳播的信息,還可以計算出混響效應和噪聲。