AI語音領域風起雲湧:歐洲公司發布變聲軟件高度逼真且沒有延遲
全球領先的變聲技術公司Voicemod正式更新了基於人工智能技術的變聲功能,並稱新的模板更逼真、更實時。Voicemod最新公佈了大約21種逼真的聲音模板,從20歲的女性到老年男子,都可以一鍵套用。用戶可以在電腦上免費安裝公司的軟件,設定其為一個“虛擬麥克風”,即可轉換自己的聲音。
與常見的變聲軟件不同,Voicemod的語音是通過AI系統生成的,這意味著聲音需要輸入、處理再導出,但Voicemod近乎可以在很短的時間內完成這一過程,幾乎沒有任何延遲。
官網解釋稱,Voicemod是通過讓AI系統不斷學習專業配音演員的聲音而成的。雖然公司總部位於西班牙,但收錄的配音演員主要使用的是英語,因此通過英語交流的變聲效果會更好。
另外,軟件還附帶了一個“添加場景”的功能,可以讓聲音聽起來像在辦公室、公園、學校、餐廳等地點發出的一樣。Voicemod指出,由於AI智能變聲功能需要較高CPU的工作效能,因此對使用者的電腦配置有一定要求。
目前,Voicemod已經與遊戲玩家專屬的社交應用Discord展開合作,公司首席執行官Jaime Bosch透露,語言轉換功能已成功讓一些內向的人敢於在網絡上與其他人溝通。
媒體分析稱,對於“對話式人工智能”(conversational AI)領域來說,Voicemod可以說是實現了一個里程碑。雖然今天的許多AI能生成文本、圖片等內容,但要實時完成任務要難得多。
Bosch告訴媒體,在創作模板時,他也會擔心這項技術被濫用的風險,因為它極有可能被拿來欺詐,或模仿一些重要的政治人物,“這是我每天都在想的事情。”
Voicemod還將推進一個“水印”解決方案,確保變聲技術的發布是安全的。Bosch稱,“明確的法律將會出台,我們知道歐洲正在為此努力。不過現實是,公司往往要比法律走得更快。”