打造“操作系統” 搜狗開放AI技術賦能錄音筆行業
整理錄音文件,長期以來始終是一件讓相關從業者頭疼無比卻又不得不做的事情,不過,這種情況即將隨著搜狗面向行業開放聽寫能力而發生根本性的變化。
8月28日,以“全新聲態,AI未來”為主題的“搜狗聽寫服務開放暨AI創新聯盟成立發布會”在京舉行,除了發布全新炫彩版AI錄音筆C1之外,搜狗宣布將面向錄音筆行業全面開放聽寫服務,並聯合Newmine紐曼、愛國者、萬成集團、索尼錄音筆四家錄音筆頭部企業成立AI創新聯盟。此次發布會由搜狗CEO王小川親自開啟,不僅有搜狗CTO楊洪濤、搜狗公司AI交互技術中心總經理王硯峰等核心層共同出席,更有紐曼、愛國者、萬成集團、索尼錄音筆一眾高管現身捧場,消息一出,業界側目。
那麼,原本是競爭對手的紐曼、愛國者、萬成索尼為何會心甘情願走到一起?這次發布會又為何會備受業內外關注呢?
服務加持,AI重新定義產品形態
關於錄音筆,相信大部分人都不陌生。功能單一、產品數年如一日沒有本質創新跟不上互聯網和移動互聯網發展步伐,這幾乎就是現階段錄音筆給大眾留下的基本印象,也是近幾年來智能手機全民普及和其他附帶錄音功能電子產品興起之後,錄音筆受到擠壓、市場銷量整體止步不前甚至出現下滑跡象的重要原因。不過,在得到搜狗聽寫服務加持之後,錄音筆的產品形態將被重新定義。
基於搜狗聽寫服務,不論是市場上現有的任意品牌的錄音筆,或是未來研發上市的新品,都可以集“快速轉寫、多端同步編輯、智能糾錯、雲端存儲、便捷分享”等功能於一體,滿足用戶錄音文件整理的全部需求,讓用戶實現“錄音1小時轉寫5分鐘”的暢快體驗,同時轉寫準確率高達95%。
可以說,接入AI聽寫服務的錄音筆,將突破了傳統錄音筆的局限,嚴格來說不能再單純稱之為錄音筆,而是一個全方位的語音記錄、轉寫、編輯、存儲和分享工具。
變革行業產品創新,源於雄厚技術積累
當前商業環境下,用戶體驗是決定產品生命力和市場競爭的“勝負手”。接入搜狗聽寫服務後,將有效改善此前錄音筆存儲傳輸不便、轉寫文本需反复聽取等諸多不足體驗,幫助合作夥伴實現“錄音、轉寫、編輯、存儲、分享”全鏈路打通,根本原因在於其雄厚的技術積累和獨特的AI優勢。
首先,搜狗AI一直堅持以自然語言處理為核心,其在語音識別、語音合成、語義理解、機器翻譯等方面的獨特優勢,為搜狗聽寫服務打造了良好技術基礎;其次,搜狗擁有互聯網規模最大的語音數據,依託於語音請求峰值達到7億人次的搜狗輸入法,機器在不斷學習之後,識別準確率會越來越高,可應用的場景也會越來越廣泛。
目前,搜狗聽寫服務背後的轉寫技術已處於行業領先地位,其實時語音轉寫運用了搜狗自研的延遲可控的Adaptive Attention-based端到端建模技術,非實時語音轉寫功能使用業界領先的深層Transformer-based端到端語音識別技術,語音轉寫準確率可達95%以上。同時,基於搜狗輸入法的海量用戶數據,搜狗聽寫服務能夠自動構建個性化識別網絡,使用戶常用語錯誤率下降40%;在語音增強方面,搜狗自研的Smart Voice麥克風陣列算法能夠對噪聲和混響進行多重深度優化,確保人聲的高保真還原;在智能輔助編輯方面,搜狗語音轉寫可以通過雲端智能糾錯編輯技術,基於詞圖搜索和輸入糾錯模型,針對置信度低的轉寫結果提供多個候選詞,幫助用戶對轉寫結果進行糾正,同時還具備了良好的自動區分說話人、智能文本順滑和標點預測等能力,可以為用戶提供更多便捷功能。
AI 賦能,推動行業生變革新
人工智能是新賽道,近兩年來,AI技術與各行業的改造融合已經成為一種趨勢,錄音筆行業同樣如此。儘管此前市面上已經出現了基於AI的錄音筆,但僅限於單個產品或某個企業的創新,像搜狗這樣面向錄音筆全行業提供AI技術支持的先例絕無僅有。
正如微軟在PC領域推出Windows、Google在手機領域推出安卓系統那樣,搜狗此次開放聽寫服務,某種意義上來說是在錄音筆領域打造了一套“操作系統”,在為合作夥伴賦能的同時,將給行業帶來顛覆性的變化。未來,在搜狗聽寫服務開放並得到充分使用、在AI賦能效應充分發揮之後,錄音筆行業會迎來跨越式發展。早上車早出發,這也正是紐曼、愛國者、萬成集團、索尼錄音筆願意在變革初期就加入搜狗發起組建的AI創新聯盟的重要原因。