谷歌翻譯大型翻車現場:請服用“反坦克導彈”來緩解疼痛
別拿谷歌翻譯藥品英文說明書了。面對藥品說明書裡的專業英文術語,恐怕絕大多數人都會想到用機器翻譯工具,比如穀歌翻譯。不過,下次這樣做的時候,可要提高警惕了。“您可以根據疼痛程度使用盡可能多的反坦克導彈。”
這就是谷歌翻譯對一份英文的患者指導進行翻譯後的結果,著實讓人摸不著頭腦。
最近,有人發布了谷歌翻譯在急診指導中應用效果的評估報告。
結果顯示,對於不同語言,谷歌翻譯的準確率存在差距,最高可以達到94%,而最低只有55%,並且還存在一些潛在的風險。
研究背景和方法
由於很多患者看不懂英文的指導說明,而許多醫院無法提供口譯或筆譯服務,醫護人員通常會使用機器翻譯為患者進行翻譯。
然而,在醫療服務中,不准確的翻譯可能會造成嚴重後果。
因此,來自UCLA Health(加州大學洛杉磯分校醫學中心)的研究人員,對谷歌翻譯的書面翻譯效果進行了評估。
報告中評估了400份由谷歌翻譯譯成七種不同語言的急診科出院須知。包括:西班牙語、中文、越南語、他加祿語、韓語、亞美尼亞語和波斯語。
選擇非語言專家、非醫療工作者,並且能夠流利閱讀母語和英語的志願者,閱讀譯文並評估其準確性。
中文翻譯準確率81.7%
總體來說,翻譯的準確率超過80%,與2014年60%的準確率相比,有所提高。
具體而言,不同語言的翻譯準確率有所不同:
中文翻譯的準確率為81.7%;西班牙語的準確率最高,達到94%;而亞美尼亞語僅僅只有55%的準確率。
在文章一開始提到的示例中,使用谷歌翻譯將“You can take over the counter ibuprofen as needed for pain”(您可以根據疼痛程度服用處方藥布洛芬)譯為亞美尼亞語。
結果語義變得風馬牛不相及:
“您可以根據疼痛程度使用盡可能多的反坦克導彈。”
就連準確率較高的西班牙語和中文,也可能出現錯誤。比如,對服用降血脂香豆素的患者的指導說明:
“Your Coumadin level was too high today. Do not take any more Coumadin until your doctor reviews the results.”(您今天的香豆素水平太高了。在醫生查看結果之前,不要再服用香豆素。)
在谷歌翻譯把它譯成中文之後,變成了:
“您今天的大豆水平太高了。在醫生查看結果之前,不要再攝取大豆。”(PS香豆素和大豆並沒有什麼直接聯繫)
研究人員表示,機器翻譯的主要問題之一是不能考慮上下文。例如,可能無法識別藥物的名稱。因此也就“失去了你想表達的意思”。
此外,報告中還指出了谷歌翻譯使用中存在的其他問題:
對於從右往左書寫和閱讀的波斯語, 谷歌翻譯從左向右進行翻譯,以至於難以辨認。
而在傳統和現代的中文書寫系統,以及波斯語與其分支的阿富汗語、塔吉克語中的應用,也存在著潛在的問題。
逐漸完善的谷歌翻譯
經過嘗試後,我們發現報告中那句“大豆”中文翻譯,在谷歌上已經得到了修正:
2006年,谷歌推出基於短語的機器翻譯。
之後,谷歌開始使用遞歸神經網絡(RNN)直接學習兩種語言的句子之間的映射。基於短語的機器翻譯(PBMT)將輸入句子分解為單詞和短語,可以在很大程度上獨立進行翻譯。
2016年,谷歌啟用了Google神經機器翻譯系統(GNMT),採用最新的訓練技術改進翻譯質量。
通過將人工神經網絡(模擬神經元在大腦中連接的方式的計算單元層)與龐大的數據集相結合,提高了準確率。
NMT將整個輸入句子視為翻譯單元,首次發佈時,NMT在中等規模的公共基準數據集上顯示出與現有系統相同的準確性。
不過,谷歌也表示,GNMT仍然無法與人工翻譯相比,例如:丟棄單詞、誤譯專有名稱或稀有術語,以及孤立地翻譯句子、無法考慮上下文的情況。
研究報告指出,醫護工作者出於善意而使用機器翻譯,卻沒有意識到這些潛在問題可能造成危害。
儘管準確性在不斷提高,但是在應用於醫療環境時,機器翻譯並不可靠,仍然無法代替口譯和筆譯。