Facebook新AI模型實現直接從非英語語言翻譯到另一種非英語語言
據外媒報導,機器翻譯技術自誕生以來走過了漫長的道路。雖然像谷歌這樣的翻譯曾經粗糙、不可靠,而且只對最基本的翻譯有用,但如今,由於AI的力量,它們可以實現驚人的準確。然而一些古老的翻譯方法仍然存在。比如在Facebook上,句子首先從一種基礎語言翻譯成英語,然後再從英語翻譯成目標語言。
這由幾個原因造成,其中一個是缺乏有用的AI訓練數據用於非英語語言到語言的翻譯。
許多人將單詞和短語從英語翻譯成法語或從法語翻譯成英語,但將內容從法語翻譯成西班牙語或西班牙語翻譯成德語的人卻要少得多。
這使得訓練AI理解複雜的語言到語言的翻譯是一個相當困難的過程。然而根據Facebook最近發布的一篇博文,這家社交媒體巨頭終於解決了這個問題並想出了一個解決方案。
該解決方案以M2M-100的形式出現,這是第一個“多語言機器翻譯模型”。該模型可以在100種語言的任意一對之間進行翻譯,而無需依賴任何英語數據集。如果懷疑它的有效性則可以自己檢查,因為該模型是完全開源。
Facebook表示,跟它所謂的“以英語為中心”的翻譯系統相比,它的多語種翻譯模式更有意義。該公司聲稱,M2M -100在機器翻譯評估的BLEU scale上比這類方法高出“10分”。
據Facebook介紹稱,這個項目已經醞釀多年,儘管還有很大的改進空間,但該公司對目前所取得的進展感到滿意。
目前還不清楚M2M -100何時或是否會直接在Facebook上推出。