Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

MIT研究人員發明可以用聲音模擬世界的人工智能係統

MIT研究人員發明可以用聲音模擬世界的人工智能係統

2022-11-01 Comments 0 Comment

計算機視覺是一個在過去幾十年中被研究得相當多的領域,主要是因為它在建造自動駕駛汽車和其他可以像人類一樣”看”世界的工具方面有著直接和明顯的應用。然而,直到最近才看到這種水平的研究的一個領域是使用聲音而不是視覺來模擬環境。現在,麻省理工學院(MIT)的研究人員已經撰寫了一篇研究論文,涉及在這一領域訓練的機器學習(ML)模型的構建。

麻省理工學院新聞網站上的一篇博文介紹說,MIT-IBM沃森人工智能實驗室合作建立了一個ML模型,利用空間聲學來觀察和模擬環境。簡單地說,這個模型通過弄清聽眾如何聽到從某一點發出的聲音並傳播到不同的位置,實現了環境的映射。

這種技術有許多好處,因為它可以只用聲音來確定環境物體的基本三維幾何形狀。然後,它可以呈現準確的視覺效果來重建環境。潛在的應用包括虛擬和增強現實,以及增強人工智能代理,使其能夠利用聲音和視覺來更好地可視化其環境。例如,與計算機視覺相比,水下探索機器人可以利用聲學來更好地確定某些物體的位置。

圖形顯示的是房間的3D模型,下面是帶有聲音的熱視圖類型的概念

研究人員強調,建立這種基於聲音的ML模型要比基於計算機視覺的模型複雜得多。這是因為計算機視覺模型利用了一種叫做光度一致性的屬性,這意味著一個物體從不同角度看時看起來大致相同。這不適用於聲音,因為根據聆聽方的位置和其他障礙物,從一個源頭聽到的東西可能非常不一樣。

為了解決這個問題,研究人員使用了另外兩個特徵,即互易性和局部幾何學。前者基本上意味著,即使交換了說話者和聽眾的位置,聲音也會完全相同。同時,局部幾何映射涉及在神經聲場(NAF)中結合互易性來捕捉物體和其他建築組件。

為了讓ML模型在測試環境中工作,需要向它輸入一些視覺信息和光譜圖,其中包含基於發端者和聽眾的指定位置的音頻聽起來會是什麼樣子。根據這些輸入,該模型可以準確地確定當聽眾在環境中移動時,聲音將如何變化。

該研究論文的主要作者Andrew Luo指出:“如果你想像自己站在一個門口附近,對你聽到的聲音影響最強烈的是那個門口的存在,而不一定是房間另一邊離你很遠的幾何特徵,我們發現這些信息比簡單的全連接網絡能更好地概括。”

展望未來,研究人員希望進一步加強該模型,使其能夠將更大、更複雜的環境可視化,如一棟建築甚至整個城市。

您可以在這裡閱讀他們的研究論文:

按一下以存取 2204.00628.pdf

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
創始人傑克·多爾西向馬斯克轉讓了2.4%的Twitter公司股份
NEXT
強大的新藥可迫使COVID-19的SARS-CoV-2病毒自相殘殺

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2022 年 11 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
282930  
« 10 月   12 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 蘋果智慧家庭中心配備類似Pad的顯示器和機械手臂售價或達1000美元 2025-05-13
  • 研究發現人體手指皮膚浸水後產生的皺紋存在圖案的重複性 2025-05-13
  • 數十家歐盟公司起訴Google 要求其賠償120億歐元 2025-05-13
  • 華為Pura 80工程機鏡頭膜首曝仍是三角排列 2025-05-13
  • 在建大壩成功取出12層樓高混凝土芯樣 2025-05-13
  • Windows 11測試「進階設定」項目以加強對檔案總管等的控制 2025-05-13
  • SonyXperia 1 VII發布:1080P螢幕+驍龍8 Elite 售價過萬 2025-05-13
  • 研究證明有些人就是愛“抬槓” 2025-05-13
  • 消息稱日產將暫停日本部分工廠運營 2025-05-13
  • 《異塵餘生》真人劇第二季前導預告前往拉斯維加斯、已續訂第三季 2025-05-13

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • 台積電美國三座新廠產能預訂一空蘋果、NVIDIA、AMD搶著要
  • 巴西總統盧拉見證美團簽署10億美元投資協議Keeta宣布進入巴西市場
  • 海爾Leader三筒懶人洗衣機發表國補後3,999元起
  • 2024全球晶片公司排行:NVIDIA居首英飛凌、義法半導體跌出前十
  • Manus回應開放註冊:海外用戶已取消等候名單國內產品尚未發布
  • 台積電將於明年第四季在新竹Fab 20廠生產基於2nm GAA的晶圓
  • 全球首個氮化鎵量子光源晶片發表2026年可望實現多場景驗證
  • 無毒無污染:長六改火箭成功發射遙感四十號02組衛星
  • 日本研究稱手機毀了孩子腦:成績下滑發展停滯

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.