AI語音領域風起雲湧：歐洲公司發布變聲軟件高度逼真且沒有延遲

全球領先的變聲技術公司Voicemod正式更新了基於人工智能技術的變聲功能，並稱新的模板更逼真、更實時。Voicemod最新公佈了大約21種逼真的聲音模板，從20歲的女性到老年男子，都可以一鍵套用。用戶可以在電腦上免費安裝公司的軟件，設定其為一個“虛擬麥克風”，即可轉換自己的聲音。

與常見的變聲軟件不同，Voicemod的語音是通過AI系統生成的，這意味著聲音需要輸入、處理再導出，但Voicemod近乎可以在很短的時間內完成這一過程，幾乎沒有任何延遲。

官網解釋稱，Voicemod是通過讓AI系統不斷學習專業配音演員的聲音而成的。雖然公司總部位於西班牙，但收錄的配音演員主要使用的是英語，因此通過英語交流的變聲效果會更好。

另外，軟件還附帶了一個“添加場景”的功能，可以讓聲音聽起來像在辦公室、公園、學校、餐廳等地點發出的一樣。Voicemod指出，由於AI智能變聲功能需要較高CPU的工作效能，因此對使用者的電腦配置有一定要求。

目前，Voicemod已經與遊戲玩家專屬的社交應用Discord展開合作，公司首席執行官Jaime Bosch透露，語言轉換功能已成功讓一些內向的人敢於在網絡上與其他人溝通。

媒體分析稱，對於“對話式人工智能”（conversational AI）領域來說，Voicemod可以說是實現了一個里程碑。雖然今天的許多AI能生成文本、圖片等內容，但要實時完成任務要難得多。

Bosch告訴媒體，在創作模板時，他也會擔心這項技術被濫用的風險，因為它極有可能被拿來欺詐，或模仿一些重要的政治人物，“這是我每天都在想的事情。”

Voicemod還將推進一個“水印”解決方案，確保變聲技術的發布是安全的。Bosch稱，“明確的法律將會出台，我們知道歐洲正在為此努力。不過現實是，公司往往要比法律走得更快。”

WONGCW 網誌