微軟宣布Azure AI Speech”Avatar”智慧語音服務上線
微軟宣布Azure AI Speech”Avatar”智慧語音服務全面上線,該服務允許開發人員建立支援自然語音的語音功能、多語言、生成式AI 應用程式。 Azure AI Speech服務中新的文字轉語音頭像功能可以將簡單的文字轉換為逼真的人以自然的聲音說話的影片。開發人員可以使用作為該服務一部分的任何預建替身,也可以創建自己的自訂替身。
新功能使開發人員能夠為其用戶創建個人化和引人入勝的內容。這項服務的輸出視訊解析度為1920 x 1080,每秒25 幀(FPS)。
下面是文字轉語音”頭像”服務的示範:
Azure Speech 文字轉語音”Avatar”具有以下功能:
- 透過Azure AI 文字轉語音技術,將文字轉換成逼真的人聲數位視頻,並配上自然的聲音。
- 提供一系列預製頭像。
- 化身的聲音由Azure AI 文字轉語音技術產生。
- 透過大量合成API 非同步或即時將文字合成為語音化身視訊。
- 在Speech Studio 中提供內容建立工具,無需編碼即可建立影片內容。
- 透過Speech Studio 中的即時聊天頭像工具實現即時頭像對話。
文字轉語音”Avatar”服務的定價有點複雜。不出所料,收費將基於視訊輸出的長度,並按秒計費。此外,作為文字轉語音頭像服務解決方案一部分的文字轉語音、語音到文字、Azure OpenAI 或其他Azure 服務將單獨收費。此外,該服務現在可在以下Azure 地區使用:東南亞、北歐、西歐、瑞典中部、美國中南部和美國西部。
您可以在這裡了解更多有關文字轉語音”Avatar”服務的資訊。