Facebook Messenger總語音流量50%來自柬埔寨的原因曝光
2018年,Facebook的團隊遇到了一個難題。 根據舉報人Frances Haugen公佈的文件瞭解到,柬埔寨使用者占Messenger語音功能全球總流量的近50%,但這家公司卻沒有人知道原因。
根據Rest of World查看的內部檔,一名員工建議進行一次調查。 他們想知道,這是否跟識字率低有關? 同一份文件顯示,在2020年,Facebook的一項研究試圖詢問音訊使用量大的國家的使用者,但只能找到一個柬埔寨的受訪者。 這個謎團,似乎一直沒有解開。
現在,令人驚訝的是,答案跟Facebook的關係不大,而是跟高棉語的複雜性以及用戶適應一項從未考慮過的技術的方式有關。
在柬埔寨,從嘟嘟車司機到首相洪森,每個人都喜歡發送語音筆記而不是資訊。 Facebook的研究顯示,不僅僅是柬埔寨人喜歡語音資訊–儘管沒有其他地方比它更受歡迎,在這項研究中,包括來自多明尼加共和國、塞內加爾、貝南、象牙海岸的30名使用者以及那位單一的柬埔寨人,87%的受訪者表示,他們使用語音工具來發送跟他們應用上設置的語言不同的筆記。 WhatsApp–調查物件中最受歡迎的平臺–以及Messenger和Telegram上面的情況都是如此。
最常見的原因之一是什麼呢? –打字太難了。
在柬埔寨的情況下,從來沒有一個簡單的方法來輸入高棉語。 雖然高棉語Unicode很早就被標準化了,但在2006年至2008年間,鍵盤本身卻落後了。 第一個高棉語電腦鍵盤的開發者必須適應該語言的74個字元,這是世界上所有文字中最多的。
這顯然是一項艱巨的任務。 Javier Sola是一位出生在西班牙、居住在金邊的計算機科學家,他是2005年最初高棉操作系統項目的團隊成員。
現任柬埔寨非政府組織Open Institue執行主任Sola告訴Rest of World:「高棉語的符號比拉丁文多得多。 “在拉丁文鍵盤上,用戶可以一次看到所有的字母,這使打字變得直觀。 但在高棉語中,每個鍵都有兩個不同的字元,這需要在兩個鍵盤層之間反覆翻轉。 不僅如此,有限的字體意味著,如果收件者的電腦沒有跟寄件者相同的字體,一些資訊就無法出現。 不過,用戶們還是成功了。
2009年左右,Facebook在柬埔寨開始流行,與此同時,廉價的智能手機和互聯網接入也開始出現,這意味著它的使用量爆炸性增長。 今天,它仍是該國最受歡迎的整體平臺。 但在一個小的智慧手機螢幕上,同樣的打字系統變得幾乎不可能。
2016年美國國際開發署的一份報告顯示,智慧手機使用者更喜歡電話和語音資訊,因為他們發現打字很困難、很費時間或因為他們對如何使用設備上的高棉文字感到困惑。 一些受訪者甚至沒有意識到他們的設備支援這種語言。 西方用戶認為理所當然的其他功能–如準確的拼寫檢查或光學字元識別–在高棉語中仍只具備基本的功能,這讓使用者對文字使用感到沮喪。
Sola表示:「現在有了稍微先進的鍵盤,但它們沒有預裝在手機上– 跟Google、三星和微軟的鍵盤不同。 “多年來,人們的習慣已經硬化為接受。 他稱,在柬埔寨,語音資訊只是人們的選擇。
這不僅僅在Messenger。 在柬埔寨其他流行的平臺上,諸如Telegram、WhatsApp和LINE,使用者也都喜歡用語音。 雖然沒有來自Facebook的最新語音流量數據,但在首都金邊的柬埔寨人告訴Rest of World,他們認識的絕大多數人都依靠語音工具來獲得便利和表達能力。 使用者說,他們並不覺得在功能上受到欺騙,而是更喜歡發送和接收語音資訊的輕鬆感覺。 總的來說,他們對在公共場合說話並不感到害羞,在街上錄製資訊也很自在。
創意行業的自由職業者Leng Len表示,這很難再回去了。 “它可以進行最有機的表達,並且比打字更快。”
但對語音工具的依賴也產生了它自己的一系列特殊問題。 對話變得短暫了。 這些使用者還抱怨稱,他們無法回滾以回憶他們交流的細節,只能通過記住他們留下的語音信息的具體模式來重放這些資訊–比如一個長的和兩個短的。 聊天記錄中的內容不可能使用搜索功能。 然而,與此同時,這種不便似乎並沒有超過其弊端。 現在的書面資訊往往以商業或英語交流為主。
雖然Facebook的員工想像這種行為跟低文化水平有關,但根據世界銀行的最新數據,柬埔寨的識字率約為80%。
“許多年輕人,如果他們想打字,就會用拉丁文寫出高棉語單詞,”金邊的軟體工程師兼POSCAR數位公司CEO Sok Pongsametrey指出。 POSCAR是一家為教育建立數位工具的公司。 其他時候,如果一個字母太難拼寫,他們可能會採用更容易獲得的字元來錯誤地拼寫這個詞或用省略號來縮寫一個詞–因為他們知道讀者會理解這個隱含的詞。
這有連鎖反應。 Sok稱,這些類型的變通方法使從事機器學習的工程師更難用這種語言來訓練人工智慧。 另外他還擔心,這些捷徑將意味著年輕人將失去對高棉文字的熟悉。
“當我用高棉語寫作時,我非常小心,因為這是一門藝術,但是年輕人,他們認為(使用拉丁文本)非常容易,”Sok說道。
語音資訊在柬埔寨的主流化引發了關於內容控制和錯誤資訊傳播的問題。 音訊是出了名的難以掃描、缺乏上下文線索,且跟視頻相比,很難分辨它是否被篡改過。
音訊信息證據已在一些引人注目的案件中出現,例如逃離柬埔寨的佛教活動家Luon Sovath,他稱柬埔寨當局捏造了有罪的信使錄音。
當被問及在柬埔寨進行這種調節的資源時,Facebook(現在稱為Meta)的一位代表只提到了一般的措施。 “使用者可以報告Messenger上的任何內容,包括語音資訊,我們以高棉語為母語的團隊將對任何違反我們政策的內容進行審查和強制執行。”
發言人還提到了檢測有害視覺內容的工具以及仇恨分類器,但沒有具體回答Rest of World關於音訊控制的問題。
Javier Sola指出,有一些較新的鍵盤如微軟的SwiftKey,讓高棉語輸入變得更容易一些,但許多柬埔寨人甚至不知道它們的存在。
柬埔寨只是一個市場,許多科技公司對開發更好的產品不感興趣。 “他們在這裡賺不到錢,所以他們不投資,”Sola說道。
為此,柬埔寨的用戶繼續適應著這種模式。 當被問及她是否認為語音資訊會被更好的技術所取代時,Len表示懷疑–“我不這麼認為。 它有助於促進更有效的對話。 ”