谷歌AI新功能挑戰Zoom:視頻會議除了說話聲再無尷尬背景聲
新冠疫情肆虐全球,讓在家辦公成為了常態,也讓視頻會議成為了日常需求。Zoom成為了全球視頻會議市場的最大贏家。Zoom去年年底日用戶峰值還只有1000萬人,今年4月底已經達到了3億人,一個季度增長了三十倍。
今年以來,Zoom股價從68美元一路飆高到目前的220美元價位,市值超過了620億美元。市場調查機構Datanyze的數據顯示,Zoom在美國視頻會議的市場份額高達36.3%,隨後則是視頻會議應用GoToWebinar和思科Webex。
相比之下,谷歌、微軟、蘋果等傳統巨頭此前幾乎沒有發力這一領域。他們要么沒有重視開發這一需求產品,要么相關產品不夠簡潔專注。巨頭的缺失也讓視頻會議市場帶來了競爭空間,成為了新貴們爭奪的領地。
但谷歌和微軟兩大巨頭已經盯上了這塊變大的蛋糕,近期先後在Google Meet和Microsoft Teams產品上推出了系列新功能,希望吸引自己原本巨大的用戶基礎。Zoom產品的功能缺失就成為了兩大巨頭的發力重點,背景降噪就是其中之一。在這一方面,兩大巨頭雄厚的人工智能實力將提供堅實的技術支持。
Google Meet’s noise cancellation feature in action
微軟5月份就表示,近期會在Teams推出無關背景聲的降噪功能。不過,Google Meet還是比微軟更早一步,他們本週就推出了強力背景降噪Cloud De-Noiser。目前已經在G Suite的網頁端推出,隨後會在iOS和Android升級。AI模式可以識別所有語言的聲音。谷歌表示,Meet今年4月底的日會議參與用戶已經達到了1億人。
打開這一功能之後,除了你的說話聲,其他背景聲音通通消失。視頻會議就只有會議應該有的聲音,再也不用擔心令人尷尬的聲音干擾你的視頻會議了。用戶在視頻會議時再也不用擔心自家狗狗的叫聲打擾會議,也不用對持續不斷的鍵盤打字聲感到煩躁,不用擔心吃飯的吧唧聲。當然,也不會再聽見馬桶沖水的聲音。但De-Noiser功能也會智能保留一些可能有益於會議的自然背景聲音,例如說話者的深呼吸聲和笑聲。這項功能已經在內部測試和優化了一年多時間,今年1月開始在谷歌全公司內側。
Cloud De-Noiser的功能背後是谷歌基於雲端的機器學習算法。算法會智能過濾掉各種背景干擾聲。谷歌G Suite產品管理總監拉查佩爾(Serve Lachapelle)在演示視頻中,先後讓薯片塑料袋、圓珠筆等各種雜亂的背景聲音消失。雖然在強力降噪模式下,他原本的說話聲音變得有些沉悶,但依然清晰可辨,完全不影響視頻會議的工作效率。
拉查佩爾表示,自己在谷歌瑞典辦公室工作,和谷歌矽谷總部存在著時差,經常在吃飯時間和總部同事開視頻會議。去除各種吃飯時候的尷尬聲音,是他們一年半之前開始研發De-Noiser功能的主要動力。G Suite團隊就各種背景聲音打造了AI模型,解決了遲滯問題。他們用自己上千次的視頻會議數據,對模型進行不斷訓練,更好地辨別人聲和背景聲。
拉查佩爾從事視頻會議相關產品功能已經有25年時間,效力谷歌也已經有13年時間。2017年谷歌收購一家創業公司Limes Audio,招納了一批音頻工程師。此外,谷歌人工智能部門Google Brain和Google Reserch也提供了技術幫助。谷歌在聲音識別和增強領域已經進行了數年研發,有了大量的技術積累。