Alexa又添新技能:用純正的播音員聲音讀新聞
亞馬遜的Alexa又在繼續學習新技能,將可以被用於進行專業的新聞解讀,幾週後,具有“播音員風格”的聲音即會被內置於Alexa中。9月初,亞馬遜智能家居副總裁Daniel Rausch在IFA大會上公佈了Alexa的各項數據:全球範圍內,Alexa已經擁有50,000個技能,與20,000種設備兼容,並與超過3,500個品牌合作。
在2018年年初,Alexa的公佈數據還只有4,000種設備,1,200個品牌。幾個月時間,各方數據上漲都很快。
亞馬遜稱,Alexa新的語音運用了公司的NTTS(neural text-to-speech)技術,這種新一代語音合成技術可以更快地使用機器學習來生成富有表現力的聲音。
目前,Alexa使用的是銜接語音合成(concatenative speech synthesis),這種方法已經存在了幾十年。該技術將語音樣本分解成獨立的聲音音素,然後縫合在一起形成新的單詞和句子。
固然,銜接語音合成效果不錯,但新的融入AI技術的方法正在將其迅速迭代。去年10月,谷歌為其穀歌助手採用了一種新型語音合成方法,該方法使用了DeepMind AI實驗室最新開發的機器學習技術。
亞馬遜稱,未來幾週內將把Alexa的聲音切換成使用神經語音合成的新語音(完整的新聞播音員的聲音)。
播音員說話的聲音來自於現實生活中新聞頻道的錄音音頻片段,然後使用了機器學習技術識別模仿,使機器可以像播音員一樣讀新聞。
亞馬遜的AI語音負責人Trevor Wood表示,這種方法更容易捕獲人類講話風格的細節。“這其間的細微差別很難用語言描述,但顯然,使用AI技術,以數據驅動,可以比人類更有效地捕捉和模擬這些細節”。
值得注意的是,亞馬遜說,他們只花了幾個小時來訓練Alexa的“新聞播音員”聲音,這表明未來亞馬遜應該還會為Alexa開發出一系列的人類聲音風格。
到目前為止,亞馬遜已經添加了Alexa耳語模式,再加上幾週內將更新的“新聞播音員”聲音,我們有望在2019年聽到Alexa模仿更多的不同風格的聲音。