全球首個AI合成女主播上崗兩會:黑科技背後的技術革命
2019年3月3日,全球首個AI合成女主播“新小萌”正式上崗新華社,而她的第一個工作任務,便是參與到當下最熱門的十三屆全國人大二次會議(後文簡稱兩會)報導中。對此,“今日俄羅斯”電視台網站、英國Daily Mail、美國Futurism等海外媒體進行了大幅報導,並表示“近年來,中國已成為全球領先的人工智能發展中心之一”。
作為第一個登上兩會的AI合成女主播,人們在驚嘆和稱讚之餘,對於其背後由搜狗所的人工智能技術都無比好奇:這個在鏡頭前播報新聞的“新小萌”,是如何誕生的呢?它未來又將有哪些應用價值呢?
什麼是AI合成主播?
比起機器千篇一律的冰冷面孔,用戶期待的是一個有溫度的真人形象。所謂AI合成主播,顧名思義,指的就是依靠搜狗的“分身”技術,來模擬出一個類似人類的AI主播進行播報。搜狗的這款產品就是以新華社主播屈萌為原型,她不僅會用和真人一樣的聲音進行播報,就連唇形、面部表情也能完全吻合。從新華社的新聞播報來看,栩栩如生的AI合成女主播“新小萌”,在鏡頭前的形象與真人主播幾乎沒有什麼區別。
AI合成主播在2018年的互聯網大會期間首次亮相,就引起了網絡上的一片熱議,被國內外諸多媒體進行報導。2019年2月21日,AI合成主播宣布再次升級,從過去的“坐著播新聞”升級成結合肢體動作的“站立式播報”,進一步提升了合成主播的表現力,保持了搜狗在這一領域的全球領先。本次首個AI合成女主播參與兩會報導,更是成為了中國人工智能與傳媒業大膽融合併付諸規模化應用的典型案例。
首個AI合成女主播的背後,有哪些“黑科技”?
作為開發AI合成主播的基礎,“搜狗分身”是搜狗人工智能的核心技術之一,誕生於搜狗“自然交互+知識計算”這一人工智能理念之下,它能通過人臉關鍵點檢測、人臉特徵提取、人臉重構、唇語識別、情感遷移等多項前沿技術,並結合語音、圖像等多模態信息進行建模訓練後,生成與真人無異的AI分身模型,進而幫助人類提高信息表達和傳遞的效率。
得益於前沿技術的加持,AI合成主播前期只需經過少量的數據訓練,就能呈現與真人相差無幾的播報狀態,同時還支持個性化定制,滿足用戶的不同需求。AI合成主播不僅可以將新聞稿快速地轉變為播報視頻,還能快速學習用戶音色、韻律、情感等多維度特徵,妥善處理聲調起伏、語言風格、情感韻律等,並提供全天候不間斷的播報服務,極大地提高廣電行業的傳播效率。
隨著“搜狗分身”技術能力的不斷提高,AI主播的定制週期也大為降低,合成效果和穩定性也有著顯著提升。僅靠少量用戶真實音視頻數據,即可快速定制出高逼真度的分身模型。本次在新華社兩會報導中驚艷亮相的首個AI合成女主播,正是“搜狗分身”技術持續複製不同類型、不同特點AI合成主播能力的一個有力體現。
為不同職業賦能,未來遠不止於主播
在兩會期間,AI合成女主播的首次登場亮相,即引發了媒體和網友關於主播行業的激烈討論,可見當科技融入到生活後所帶來的衝擊感是非同凡響的。宛如科幻大片一般的場景,正在逐步成為現實。和真人主播相比,通過“搜狗分身”技術打造的AI合成主播能夠不知疲倦地工作24小時,同時還掌握多國語言,大大提升了效率、降低了成本。
然而,AI合成主播僅僅只是一個開始。伴隨著人工智能技術的不斷升級,個性化內容生產的門檻大為降低,應用範圍愈發廣泛。未來,“搜狗分身”技術還將應用於娛樂、醫療、健康、教育、法律、金融等多個領域,通過提供個性化的行業解決方案,為不同場景展開賦能。根據不同場景而創造出虛擬教師、虛擬客服、虛擬管家、虛擬醫生等職業,深度參與到人類的內容表達和信息傳遞場景之中,提供服務並發揮更多價值。屆時,各行各業都將迎來AI技術下的新一輪變革。