Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
    • WordPress 插件及主題下載
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

Meta AI驅動的音頻編解碼器比MP3壓縮率高10倍

Meta AI驅動的音頻編解碼器比MP3壓縮率高10倍

2022-11-03 Comments 0 Comment

上週,Meta公司宣布了一種名為”EnCodec”的人工智能驅動的音頻壓縮方法,據說可以將音頻壓縮到比MP3格式小10倍的64kbps而且具有同等的質量。Meta公司表示,這種技術可以極大地改善低帶寬連接上的語音質量,例如在服務不完善的地區進行電話通話。該技術也適用於音樂。

hypercompression_graph_2.jpg

Meta公司於10月25日在一篇題為”高保真神經音頻壓縮”的論文中首次介紹了這項技術,論文作者是Meta公司的人工智能研究員Alexandre Défossez、Jade Copet、Gabriel Synnaeve和Yossi Adi。Meta公司還在其專門介紹EnCodec的博客上總結了這項研究。

Meta公司將其方法描述為一個由三部分組成的系統,經過訓練可將音頻壓縮到所需的目標大小。首先,編碼器將未壓縮的數據轉換為較低幀率的”潛空間”表示。然後,”量化器”將該表示法壓縮到目標大小,同時跟踪最重要的信息,這些信息隨後將被用於重建原始信號。(這個壓縮信號將通過網絡發送或保存在磁盤上)。最後,解碼器使用一個神經網絡在單個CPU上將壓縮的數據實時地轉變成音頻。

meta_audio_process.jpg

一個方框圖說明Meta的EnCodec壓縮是如何工作的

Meta對鑑別器的使用被證明是創造一種盡可能多地壓縮音頻的方法的關鍵,同時又不失去信號的關鍵元素,使其與眾不同並可被識別。

“有損壓縮的關鍵是識別人類無法察覺的變化,因為在低比特率下不可能實現完美的重建。為了做到這一點,我們使用鑑別器來提高生成的樣本的感知質量。這就形成了一個貓捉老鼠的遊戲,鑑別器的工作就是區分真實的樣本和重建的樣本。壓縮模型試圖通過推動重建的樣本與原始樣本在感知上更加相似來生成樣本以欺騙鑑別器”。

值得注意的是,使用神經網絡進行音頻壓縮和解壓遠非新鮮事,特別是用於語音壓縮時,但Meta公司的研究人員聲稱他們是第一個將該技術應用於48kHz立體聲音頻(比CD的44.1kHz採樣率略好)的工作小組,這是在互聯網上傳播的最典型的音樂文件。

至於應用方面,Meta公司表示,這種由人工智能驅動的”超壓縮音頻”可以在惡劣的網絡條件下支持”更快、更優質的通話”。當然,作為Meta公司,研究人員還提到了EnCodec的元數據影響,說該技術最終可以提供”豐富的元數據體驗,而不需要大幅提高帶寬”。

除此之外,也許有一天我們還能從它那裡得到更小的音樂音頻文件。目前,Meta公司的新技術仍處於研究階段,但它指向一個高質量音頻可以使用更少帶寬的未來,這對流媒體造成網絡負擔過重的移動寬帶供應商來說是個好消息。

分享此文:

  • 分享到 Twitter(在新視窗中開啟)
  • 按一下以分享至 Facebook(在新視窗中開啟)
  • 分享到 WhatsApp(在新視窗中開啟)
  • 按一下以分享到 Telegram(在新視窗中開啟)
  • 分享到 Pinterest(在新視窗中開啟)
  • 分享到 Reddit(在新視窗中開啟)
  • 按一下即可分享至 Skype(在新視窗中開啟)
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟)
  • 點這裡列印(在新視窗中開啟)

相關


網絡資訊

Post navigation

PREVIOUS
Google人工智能工具原型Wordcraft已經可以做到代筆寫作但品質不佳
NEXT
Windows 11在遊戲領域的份額意外減少Windows 7佔有率倒漲

發表迴響 取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
ESET NOD32
WINDOWS 10 &11 INSIDER PREVIEW
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
金融資訊
WhatsApp Stickers教學
WordPress資訊
WeChat資訊
PHP資訊
Plesk資訊
TensorFlow
教學資源
開源程序
網頁工具
SEO工具
醫療健康
旅遊及消閒
其他資訊
Content from
Content to
2022 年 11 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
282930  
« 10 月   12 月 »

分類

  • 網站公告
  • 限時免費
  • ESET NOD32
  • WINDOWS 10 &11 INSIDER PREVIEW
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WhatsApp Stickers教學
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • Plesk資訊
  • TensorFlow
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 旅遊及消閒
  • 其他資訊

彙整

近期文章

  • 國產大飛機C919商業航班今天首飛:經濟艙156座餐食叫“五福臨門” 2023-05-28
  • 東航C919商業首航順利起飛後續將逐步投放更多航線 2023-05-28
  • 工信部部長金壯龍親歷東航開啟C919首次商業飛行 2023-05-28
  • 一理想車主雨天高速路躺平開車:用飲料瓶欺騙汽車“自動駕駛” 2023-05-28
  • AI搶飯碗?雷亞遊戲回應用AI創作後解僱美工:用了但沒解僱 2023-05-28
  • 蘋果公司將從6月5日開始接受Mac Studio和M2 MacBook機型以舊換新 2023-05-28
  • 華為捐贈中國移動完成1050套歐拉操作系統遷移上線 2023-05-28
  • 打擊外來物種日本6月起禁止出售或放生小龍蝦:最高罰款15萬 2023-05-28
  • 印度一官員為找手機抽空210萬升水庫 2023-05-28
  • 把廣告牌識別為真人後剎停理想客服回應:具體原因需做分析診斷 2023-05-28

熱門文章與頁面︰

  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • DP vs HDMI 誰才是遊戲玩家最佳選擇?
  • 世界上有多少個國家
  • YouTube By Click 2.2.86(含:註冊機序列號)
  • Autodesk AutoCAD 2021 正式版註冊版-簡體/繁體中文/英文版
  • 天翼網盤免登陸高速下載,直鏈解析不限速
  • REG007 – 你註冊過哪些網站?一搜便知
  • NVIDIA H100 Hopper加速計算卡上市:配備80GB顯存價格超24萬元
  • 貝貝BiliBili – 在線一鍵下載B站視頻,可解析播放!
  • ESET NOD32 LICENSE KEY (UPDATED 2023-01-17)

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2023   All Rights Reserved.