印度打造語言互聯網優勢明顯多語種是天然試驗田
語言和語音是人類獲得的第一種通訊手段,也是人類進化的主要動力之一。因此,語音識別一直是計算機領域的聖杯,人們希望語音激活電腦,以獲得信息、建議、交易等等,但是過去語音識別一直更多是幻想而非現實。現在,語音的時代終於到來了,因為深度神經網絡等人工智能技術的進步,以及圖形處理單元(GPU)硬件的成熟,使得通過大量語音數據來訓練語音引擎達到更高精度成為可能。
語音識別在印度可能尤為重要,早在《摩柯婆羅多》時代印度就一直是一個口頭社會,信息一直是靠口耳相傳,沒有使用電腦打字搜索的歷史,個人電腦推動了在線革命:文盲、多語言都意味著除了文字還需要有其他與數字世界互動的方式。廉價的智能手機和數據流量讓印度在移動時代發展迅速,手機正是作為語音交互的完美載體。
2017年,印度30%的搜索是用語音發起的。印地語搜索一年內增長了400%,這證明了人們對於當地語言的在線工具和內容有著巨大的需求。
認識到語音技術在印度的巨大潛力,全球最重要的語音研究會議——Interspeech於今年9月首次在印度召開,主題就是新興市場多語言社會的語言研究,數百名研究人員展示了他們對深度神經網絡、激活喚醒功能和超參數模型研究獲得的進展。印度眾多的語言、方言、口音是研究人員挑戰語音識別的理想試驗場。無論是百度還是谷歌,或者臉書和微軟都認為本地語言的語音識別對於觸達另外的3億使用其他語言印度人的重要性,亞馬遜和沃爾瑪等商業巨頭已經認識到要發掘出印度市場的潛力,僅僅針對英語水平最高的那10%的印度人是遠遠不夠的。
使用當地語言的印度讀者才是真正的市場,而通向多語種印度的競賽已經開始,上個月Flipkart收購了Liv.ai,一個語音技術領域的初創企業要叫板亞馬遜的Alexa,亞馬遜上週發布了一個印地語,谷歌和微軟也正式推出了自己的印度語項目。不管怎樣,印度消費者都將是這場競爭的贏家,印度有著豐富的多樣性用戶,將成為研究人員、企業家的溫室,資本也將協助共同打造一個全球語音技術的巨頭和語音互聯網。