谷歌ReCaptcha系統被破解機器語音驗證準確率高達85%
美國馬里蘭大學的四位研究員開源了一個名為UnCaptcha的工具,能夠破解谷歌的驗證碼系統ReCaptcha,其進行語音驗證的準確率高達85%。與眾多驗證機制一樣,早期的ReCaptcha系統通過數字驗證碼進行識別,以此確保操作方是人類而非機器人。但是,2012年一個谷歌研究團隊幾乎百分之百破解了其文本驗證碼系統。於是谷歌在這之後的升級版當中加入了語音和圖像驗證的方式。
如今,上述驗證方式再次遭遇巨大挑戰。“谷歌的ReCaptcha系統使用了一些高級的分析工具來判斷一個用戶到底是人還是機器人。他們使用了多種元素,包括cookie、解題的速度、鼠標的移動以及解題的成功率。”
▲UnCaptcha工具測試界面
據該項目負責人稱:“ReCaptcha系統的語音識別體制由一長串數字讀音組成,每個字的語速、音調都不相同,甚至還會改變口音。為了解析這些數字,首先需要從網頁上將音頻文件下載下來,再導入到在線的語音識別工具中(比如IBM、谷歌云、谷歌語音識別、Sphinx、Wit-AI、微軟 Bing語音識別)進行識別,再將解析後的結果嵌入驗證框即可通過驗證。”
目前,UnCaptcha工具已經在著名的Reddit 進行實驗。據悉,實驗者在進行用戶註冊那一步的時候終止了實驗,這也是為了不給該網站增添不必要的運營風險。
“實驗結果非常明顯,UnCaptcha在識別數字方面的準確率高達92%,整體語音識別準確率達到了85%。”該工具的發明者在一份聲明中稱:“這種工具能夠破解最新版的ReCaptcha,但這僅限於在自己網站上使用且僅用於教育目的。”
得到破解技術後,該負責人第一時間通知了谷歌並督促對現有驗證方式進行升級。目前,UnCaptcha工具已經開源,並被託管在GitHub上提供了安裝使用示例。
在GitHub上,吃瓜群眾們也針對此事展開討論。有網友稱:“此項目中的核心破解技巧使用到了各家的語音識別技術,這其中也包括谷歌,這讓人看起來多少有點’搬起石頭砸自己腳’的意味。”