谷歌發布免費實時轉錄軟件:面向聽障人士支持70種語言
近日,谷歌邀請媒體在京舉行視頻電話會議,谷歌產品經理Sagar Savla介紹了LiveTranscribe軟件,這是一項免費的Android服務,通過將自動字幕技術融入日常會話,減少現實世界中的對話障礙。據了解,通過自動語音識別技術(ASR),計算機能夠檢測有聲語言並將其現場轉錄為供閱讀的文本,由Google雲提供技術支持,Live Transcribe可以進行實時的對話字幕轉錄,支持超過70種語言,覆蓋全球80%以上的人口。
Sagar Savla表示,雖然依靠雲ASR能為我們提供更高的準確性,但Google希望可以減少Live Transcribe所需的網絡流量消耗。為此,Google在先前AudioSet的工作基礎上,實現了基於神經網絡的設備語音檢測器。該網絡是一種圖像式模型,類似於我們之前發布的VGGish模型,它可以檢測語音並自動管理與雲ASR引擎的網絡連接,將長時間使用過程中的數據流量消耗降至最低。
在技術呈現方面,Google曾考慮了幾種不同的模式:計算機、平板電腦、智能手機、小型投影儀,以迭代方式顯示聽覺信息和字幕。最後,Sagar Savla的團隊決定專注於智能手機模式,因為這類設備無處不在且功能日益強大。
(軟件使用量熱度圖)
資料顯示,世界衛生組織預計,到2055年全球將有九億人聽力受損。谷歌的這項軟件可以為他們帶去便利。目前該軟件在亞洲已經非常流行。