微軟AI語音新技能:玩轉情感程度調節
近期,微軟人工智能語音增加了名為“情感程度調節”的新技能。通過這一技術,多個虛擬人物已經擁有的十餘種情感變化可以進一步調節強弱程度,表現力細膩可控,更準確地還原人類情感。
以下為B站演示:
微軟人工智能語音已經在年齡、性別、性格各異的中文角色(曉曉、雲希、雲野、曉涵、曉萱、曉墨、曉睿)上實現瞭如下情感類別:開心、悲傷、憤怒、 恐懼、 不滿、 嚴厲、撒嬌、溫柔、沮喪、尷尬、平靜。
不過,人類的情感很大程度上體現於語音語調的微妙變化,比如一句“再見”,有時是平靜而含蓄的,有時是開心而輕鬆的,有時卻是決絕而憤怒的。
微軟人工智能語音以自適應神經網絡為基礎,能夠把上述人類情感以1%作為一個量化單元,以平靜語氣為0點,通過無代碼的有聲內容創作平台或者使用SSML標籤(語音合成標記語言) ,輕鬆控制情感程度。
此外,通過與自動文本情感分析技術相結合,也可自動預測情感類別,智能演繹飽含情緒變化的作品。這一技術讓音頻創作就像導演選角一樣,用最適合的聲音、最恰當的情感,演繹更出色的作品,適用於聊天機器人、有聲書朗讀、影視自動配音、遊戲等多情景。