研究顯示CAPTCHA驗證毫無意義浪費用戶數十億小時
加州大學歐文分校2023年的一項研究《茫然與困惑:關於reCAPTCHAv2的大規模真實用戶研究》得出結論,驗證碼不僅在實際阻止機器人流量方面效果不佳,還通過追踪cookie引發隱私問題,浪費了我們大家總計數十億小時的時間,並且為谷歌生成了價值近萬億美元的數據。谷歌早在2009年就收購了廣泛使用的reCAPTCHA工具。
研究聚焦於透過GooglereCAPTCHAv2在現實中最常見的兩種驗證碼形式:「隱形」或基於行為的驗證碼,當你勾選「我不是機器人」方塊時,甚至在你瀏覽網站時,它會暗中分析你的輸入;還有基於影像的驗證碼,你需要從Google街景獲取的圖片中選擇所有摩托車、交通號誌燈之類的內容。這兩種驗證碼對Google都很有價值,前者產生的追蹤cookie可能有助於廣告定向投放,而後者的資料則可用於Google內部的人工智慧模型訓練,或出售給其他公司。

這項實驗並未告知實驗對象,而是將Google的reCAPTCHAv2添加到該大學內部學生帳戶系統的帳戶創建和密碼找回功能中,研究人員既測量完成驗證碼所需的時間,又對這項為期13個月的研究中的3600名用戶進行抽樣調查,了解他們的體驗。不出所料,當涉及更複雜的圖像識別驗證碼時,用戶花費的時間更多,反饋也多為負面。研究還指出,完成時間會因學科、經驗水平以及是建立帳戶還是找回帳戶而有所不同。
研究人員計算出影像和行為驗證碼的平均完成時間為3.53秒,並將其與2010年至2023年間互聯網上完成的5120億個reCAPTCHAv1和v2驗證碼的低端估計數相乘,得出了以下關於驗證碼對我們生活影響的估算結果:
– 花費8.19億小時來完成驗證碼。
– 以美國聯邦最低工資標準計算,這些時間價值61億美元。
– 消耗134PB的網路頻寬。
– 耗費750萬千瓦時的能源。
– 產生750萬磅的二氧化碳污染。
這是我補充的:將8.19億小時與人類平均壽命79年相比,相當於耗費了1182.7個人的一生來完成驗證碼。
將這項新研究中人類完成驗證碼的時間和準確率與機器人進行對比,同時參考以往關於自動化程序破解驗證碼能力不斷提高的研究,研究人員得出結論,如今機器人完成reCAPTCHAv2複選框的速度比人類快,而在圖像識別方面,雖然機器人花費的時間更多,但準確率更高。研究人員也認為,追蹤cookie實際上帶來了新的安全和隱私風險。研究人員根據Google公佈的已標註影像識別資料集合的價值,以及單一追蹤cookie的終身價值乘以估算的2010年至2023年間完成的reCAPTCHAv2總量,得出了以下對Google來說的價值估算:
– 其完整的reCAPTCHAv2資料集價值87.5億- 323億美元,理論上該資料集可多次出售給不同的供應商。
– 2010年至2023年間reCAPTCHAv2產生的所有追蹤cookie的終身價值為8880億美元。
研究人員在研究的最後部分指出:「可以得出結論,reCAPTCHAv2的真正目的是作為一個偽裝成安全服務的追蹤cookie生成場來獲利。」他們認為,由於reCAPTCHA對網路安全或功能並無實際貢獻,應該逐步淘汰。然而,這項研究過去兩年了,短期內仍沒有淘汰的跡象。