Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

Meta AI驅動的音頻編解碼器比MP3壓縮率高10倍

Meta AI驅動的音頻編解碼器比MP3壓縮率高10倍

2022-11-03 Comments 0 Comment

上週,Meta公司宣布了一種名為”EnCodec”的人工智能驅動的音頻壓縮方法,據說可以將音頻壓縮到比MP3格式小10倍的64kbps而且具有同等的質量。Meta公司表示,這種技術可以極大地改善低帶寬連接上的語音質量,例如在服務不完善的地區進行電話通話。該技術也適用於音樂。

hypercompression_graph_2.jpg

Meta公司於10月25日在一篇題為”高保真神經音頻壓縮”的論文中首次介紹了這項技術,論文作者是Meta公司的人工智能研究員Alexandre Défossez、Jade Copet、Gabriel Synnaeve和Yossi Adi。Meta公司還在其專門介紹EnCodec的博客上總結了這項研究。

Meta公司將其方法描述為一個由三部分組成的系統,經過訓練可將音頻壓縮到所需的目標大小。首先,編碼器將未壓縮的數據轉換為較低幀率的”潛空間”表示。然後,”量化器”將該表示法壓縮到目標大小,同時跟踪最重要的信息,這些信息隨後將被用於重建原始信號。(這個壓縮信號將通過網絡發送或保存在磁盤上)。最後,解碼器使用一個神經網絡在單個CPU上將壓縮的數據實時地轉變成音頻。

meta_audio_process.jpg

一個方框圖說明Meta的EnCodec壓縮是如何工作的

Meta對鑑別器的使用被證明是創造一種盡可能多地壓縮音頻的方法的關鍵,同時又不失去信號的關鍵元素,使其與眾不同並可被識別。

“有損壓縮的關鍵是識別人類無法察覺的變化,因為在低比特率下不可能實現完美的重建。為了做到這一點,我們使用鑑別器來提高生成的樣本的感知質量。這就形成了一個貓捉老鼠的遊戲,鑑別器的工作就是區分真實的樣本和重建的樣本。壓縮模型試圖通過推動重建的樣本與原始樣本在感知上更加相似來生成樣本以欺騙鑑別器”。

值得注意的是,使用神經網絡進行音頻壓縮和解壓遠非新鮮事,特別是用於語音壓縮時,但Meta公司的研究人員聲稱他們是第一個將該技術應用於48kHz立體聲音頻(比CD的44.1kHz採樣率略好)的工作小組,這是在互聯網上傳播的最典型的音樂文件。

至於應用方面,Meta公司表示,這種由人工智能驅動的”超壓縮音頻”可以在惡劣的網絡條件下支持”更快、更優質的通話”。當然,作為Meta公司,研究人員還提到了EnCodec的元數據影響,說該技術最終可以提供”豐富的元數據體驗,而不需要大幅提高帶寬”。

除此之外,也許有一天我們還能從它那裡得到更小的音樂音頻文件。目前,Meta公司的新技術仍處於研究階段,但它指向一個高質量音頻可以使用更少帶寬的未來,這對流媒體造成網絡負擔過重的移動寬帶供應商來說是個好消息。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
Google人工智能工具原型Wordcraft已經可以做到代筆寫作但品質不佳
NEXT
Windows 11在遊戲領域的份額意外減少Windows 7佔有率倒漲

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2022 年 11 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
282930  
« 10 月   12 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 繼GitHub之後OpenAI為ChatGPT推出OneDrive與SharePoint連接器 2025-05-13
  • 蘋果將阻止macOS應用秘密存取剪貼簿 2025-05-13
  • 蘋果訊息應用會阻止用戶發送包含符號「&」的語音訊息 2025-05-13
  • NVIDIA新版驅動不再需要POPCNT指令集甚至可以在2006年的CPU上安裝 2025-05-13
  • AMD Zen5線程撕裂手9000WX首次在官方通路現身96核心好寂寞 2025-05-13
  • 三星電子發表新一代智慧型手機Galaxy S25 Edge 2025-05-13
  • 長三丙成功發射通訊技術試驗衛星十九號進行衛星通訊技術驗證 2025-05-13
  • 蘋果iOS 18.5正式版發表修復iPhone 31個漏洞國銀AI仍未上線 2025-05-13
  • 銘瑄註冊資訊確認入門級50系新卡RTX 5050 只有8GB顯存 2025-05-13
  • 5499元的iPhone 16 Pro被搶空128GB羅寶版浪費國補? 2025-05-13

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • 海爾Leader三筒懶人洗衣機發表國補後3,999元起
  • 台積電將於明年第四季在新竹Fab 20廠生產基於2nm GAA的晶圓
  • Hosts File Editor+ v1.5.10 多語言中文​​正式版-hosts文件編輯器
  • Windows 11看視頻還要錢?教你免費安裝HEVC視頻擴展
  • 微軟為Windows 11增加新功能可以在設定中調整相機解析度和幀率等
  • 完整驅動程序解決方案Treexy Driver Fusion v7.2.0 + v1.7.0 Premium
  • LED燈可誘發失明?關於“藍光危害”這些人尤其要當心!
  • R290易燃R32會爆炸?聊聊關於空調製冷劑的那些事
  • z-sms – 在線免費云短信臨時手機號接碼平台網頁版

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.