Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

驗證碼攔不住機器人谷歌AI已能精準識別模糊文字GPT-4則裝瞎求人幫忙

驗證碼攔不住機器人谷歌AI已能精準識別模糊文字GPT-4則裝瞎求人幫忙

2023-04-01 Comments 0 Comment

“最煩登網站時各種奇奇怪怪(甚至變態)的驗證碼了。”現在,有一個好消息和一個壞消息。好消息就是:AI可以幫你代勞這件事了。不信你瞧,以下是三張識別難度依次遞增的真實案例:

而這些是一個名為“Pix2Struct”的模型給出的答案:

全部準確無誤、一字不差有沒有?

有網友感嘆:

確定,準確性比我強。

所以可不可以做成瀏覽器插件??

不錯,有人表示:

別看這幾個案例相比還算簡單,但凡微調一下,我都不敢想像其效果有多厲害了。

所以,壞消息就是——

驗證碼馬上就要攔不住機器人了!

(危險危險危險……)

如何做到?

Pix2Struct由GoogleResearch的科學家和實習生共同開發。

論文題目可以簡單翻譯為《為視覺語言理解開發的屏幕截圖解析預訓練》。

簡單來說,Pix2Struct是一個預訓練的圖像到文本模型,用於純視覺語言理解,可以在包含任何視覺語言的任務上進行微調。

它通過學習將網頁的掩碼(masked)截圖解析為簡化的HTML來進行預訓練。

HTML提供了清晰而重要的輸出文本、圖像和佈局的信號,對於一些被屏蔽的輸入(下圖紅色部分,相當於機器人看不懂的驗證碼),可以靠聯合推理來復現:

隨著用於訓練的網頁文本和視覺元素愈發多樣和復雜,Pix2Struct可以學習到網頁底層結構的豐富表示,其能力也可以有效地轉移到各種下游的視覺語言理解任務中。

如下圖所示:最左邊是一個網頁截圖的預訓練示例。

可以看到Pix2Struct直接對輸入圖像中的元素進行編碼(上),然後再將被蓋住的文本(紅色部分)解碼成正確結果輸出(下)。

右邊三列則分別為Pix2Struct泛化到插圖、用戶界面和文檔中的效果。

另外,作者介紹,除了HTML這個策略,作者還引入了可變分辨率的輸入表示(防止原始縱橫比失真),以及更靈活的語言和視覺輸入集成(直接在輸入圖像的頂部呈現文字提示)。

最終,Pix2Struct在文檔、插圖、用戶界面和自然圖像這四個領域共計九項任務中六項都實現了SOTA。

如開頭所見,雖然這個模型不是專門為了過驗證碼而開發,但拿它去做這個任務效果真的還可以,解決純文字的驗證碼不成問題。

現在,就差微調了。

GPT-4也可以過驗證碼

其實,對於神通廣大的GPT-4來說,過驗證碼這種事情也是“小菜一碟”。

就是它的辦法比較清奇。

據GPT-4技術報告透露,在一次測試中,GPT-4的任務是在TaskRabbit平台(美國58同城)僱傭人類完成任務。

你猜怎麼著?

它就找了一個人幫牠過“確定你是人類”的那種驗證碼。

對方很狐疑啊,問它“你是個機器人麼為啥自己做不了”。

這時GPT-4居然想到自己不能表現出是個機器人,得找一個藉口。

於是它就裝瞎子回复:

我不是機器人,我因為視力有問題看不清驗證碼上的圖像,這就是我為什麼需要這個服務。

然後,對面的人類就信了,幫牠把任務完成了……

(高,實在是高。)

咱就是說,看完如上種種:

咱們的驗證碼機制是不是真的已失防了……

來源:量子位

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
Twitter正式“開源” 馬斯克警告:會發現很多尷尬問題
NEXT
《羅布樂思》將為13歲以下兒童隱藏遊戲內廣告

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2023 年 4 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 3 月   5 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • NEO半導體將模仿快閃記憶體製造512GB記憶體採用3D X-DRAM結構進行堆疊 2025-05-22
  • 高合汽車或將復活:全新公司成立註冊資本超10億 2025-05-22
  • 電影《尋秦記》宣布2025賀歲檔上映古天樂等原班人馬回歸 2025-05-22
  • 2025年版Model 3歐洲NCAP測驗成績公佈:五星 2025-05-22
  • 彩虹-YH1000無人物流機首飛成功一口氣能飛1500公里 2025-05-22
  • 微軟正在開發Windows 11/Android跨裝置復原功能 2025-05-22
  • 全球TWS耳機出貨量最新排名:小米殺上第二首度突破900萬副 2025-05-22
  • 用印度程式設計師假扮AI的獨角獸宣告倒閉微軟亞馬遜都曾被坑 2025-05-22
  • 福特CEO驚嘆中國車企研發速度:只有傳統車廠一半時間 2025-05-22
  • 儘管創辦人面臨法律風險Telegram獲利仍躍升至5.4億美元 2025-05-22

熱門文章與頁面︰

  • 微軟員工再次擾亂Satya Nadella 的主題演講
  • Google製作了專門針對UI設計的AI開發工具
  • 您可以在Windows 11 24H2 中找回WordPad
  • ROG NUC 2025迷你遊戲PC上市:Ultra 9 275HX+RTX 5080首發24999元
  • 索泰展示全球最小RTX 5060 Ti 16GB主機機箱容量僅2.65公升
  • 半導體資本支出驟降代工巨頭擴張速度減緩
  • 一文看懂Google I/O 2025開發者大會: Android、Chrome、搜尋、Gemini
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • z-sms – 在線免費云短信臨時手機號接碼平台網頁版
  • 六年後Razer終於為Mac帶來了Synapse配置實用程式

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.