科學家開髮用於智能手機的“蝙蝠感知”技術可利用聲音生成圖像

據外媒報導，科學家們已經找到了一種方法，使智能手機和筆記本電腦等日常物品具有類似於蝙蝠對周圍環境的感知能力。這項技術的核心是一種複雜的機器學習算法，它利用反射迴聲來生成圖像，類似於蝙蝠使用迴聲定位進行導航和狩獵的方式。

該算法測量揚聲器發出的聲音片段或小天線發出的無線電波脈沖在室內空間內發射並返回到傳感器所需的時間。通過巧妙地分析結果，該算法可以推斷出一個房間的形狀、大小和佈局，以及挑選出存在的物體或人。結果以視頻形式顯示，將迴聲數據轉化為三維視覺。

該團隊的成就與蝙蝠的迴聲定位之間的一個關鍵區別是，蝙蝠有兩隻耳朵來幫助它們導航，而該算法被調整為與從單點收集的數據一起工作，如麥克風或無線電天線。研究人員說，該技術可用於通過潛在的任何配備有麥克風和揚聲器或無線電天線的設備來生成圖像。

格拉斯哥大學的計算機科學家和物理學家週日在《物理評論快報》雜誌上發表的一篇論文中概述了這項研究，它可以應用於安全和醫療保健領域。格拉斯哥大學計算科學學院和物理與天文學學院的Alex Turpin博士和Valentin Kapitany博士是該論文的主要作者。

Turpin博士說：“動物的迴聲定位是一種了不起的能力，科學已經成功地以多種不同的方式重新創造了從反射迴聲中生成三維圖像的能力，如RADAR和LiDAR。”

“這項研究與其他系統的不同之處在於，首先，它只需要來自單一輸入的數據–麥克風或天線–就能創建三維圖像。其次，我們相信，我們開發的算法可以將任何具有這兩件裝備中的任何一件的設備變成迴聲定位設備。”

“這意味著這種三維成像的成本可以大大降低，開闢許多新的應用。例如，通過接收入侵者反射的信號，可以在沒有傳統攝像機的情況下保證建築物的安全。同樣的方法也可以用來追踪養老院中虛弱病人的行動。我們甚至可以看到該系統被用於跟踪醫療機構中病人胸部的起伏，提醒工作人員注意他們的呼吸變化。”

該論文概述了研究人員如何使用筆記本電腦的揚聲器和麥克風來產生和接收千赫茲範圍內的聲波。他們還使用天線對千兆赫茲範圍內的無線電頻率聲音進行了同樣的處理。

在每一種情況下，他們都收集了一個人在房間裡走動時對聲波的反射的數據。同時，他們還使用一個特殊的相機記錄了房間的數據，該相機使用一個被稱為飛行時間的過程來測量房間的尺寸並提供一個低分辨率的圖像。

通過結合來自麥克風的迴聲數據和來自飛行時間相機的圖像數據，研究小組在數百次的重複中“訓練”了他們的機器學習算法，將迴聲中的特定延遲與圖像聯繫起來。最終，該算法已經學會了僅從迴聲數據中生成它自己的高度準確的房間及其內容的圖像，使它具有感知周圍環境的“蝙蝠式”能力。

這項研究建立在該團隊以前的工作基礎上，該團隊訓練了一種神經網絡算法，通過使用單像素檢測器測量閃光的反射來建立三維圖像。

Turpin博士補充說：“我們現在已經能夠利用光和聲音證明這種算法機器學習技術的有效性，這非常令人激動。很明顯，這裡有很多以新方式感知世界的潛力，我們渴望繼續探索未來生成更多高分辨率圖像的可能性。”

WONGCW 網誌