不要發布自己周圍的照片:史丹佛的新AI可以透過一張照片找出所在位置
透過照片來進行定位在以前是個很好玩的事情,例如B 站UP 主@地球百科君就經常收到網友發來的照片,根據照片中的光線、地理結構、店鋪招牌等信息來定位圖片中的位置在哪。對大多數用戶來說從照片裡進行定位是個略微有些難度的事情,但以後,透過AI 來識別那就是個非常簡簡單單的活兒了。
GeoGuessr 是一個地理位置發現網頁遊戲,遊戲會將玩家放置到一個半隨機的谷歌街景地點,要求玩家只透過可見的線索來猜測他們在世界上的位置。
這個遊戲裡有個著名的玩家叫Trevor Rainbolt,史丹佛大學新的AI 模型就拿這名玩家進行練手,進行六次對戰後AI 完勝。
史丹佛大學一群研究生推出的這個應用程式名為預測圖像地理位置(PIGEON),該應用背後使用他們自己訓練的AI 模型進行驅動,而AI 模型又透過OPENAI CLIP 神經網路進行處理,可以將文字連結到圖像。
PIGEON 的原理是利用Google街景功能以及其他公開的圖片來對比用戶拍攝的照片,在以前靠人工比對是個辛苦活,但現在AI 可以快速搞定定位。
基準測試顯示PIGEON 的準確率為92%,還可以在40% 的猜測中獎位置範圍縮小到25 公里的範圍。所以一經上線測試PIGEON 就打敗了GeoGuessr 上的大部分玩家,成為排名前0.01% 的「玩家」。
訓練:
根據專案團隊的說明,在PIGEON 開始時,他們使用了GeoGuessr 的10 萬個隨機採樣的原始位置進行訓練,之後還嚇了四張圖像來涵蓋給定位置的整個全景,相當於40 萬張圖片。
同時專案團隊也創建了大約包含50 萬張街景圖像的資料集,實際上整個資料集的規模並不算大,但訓練出來的AI 模型表現已經很不錯。
隱私:
如果是其他AI 模型,或許這時候就可以直接發布模型供愛好者玩耍了,但這個AI 模型存在潛在的隱私問題,因為它可以被犯罪分子用來定位某些用戶。
例如某用戶在社群網路上發布了一張隨手拍的照片,那麼犯罪者就可以透過AI 模型來找到這種照片的大概位置,進而知道這名用戶的位置。
專案團隊強調,該應用程式在自動駕駛、視覺調查、安全等方面可以成為一種有效的工具,然而如果落入壞人之手,並被用於非預期目的的不良用途,則潛在的危害令人高度擔憂。
因此專案團隊決定不公開此AI 模型、僅出於學術目的共享程式碼。
論文地址:https://arxiv.org/pdf/2307.05845.pdf
PS:擔心這種技術落入壞人之手被利用,這種擔心其實是「多餘」的,因為這類技術肯定會落入壞人之手,畢竟即便PIGEON 背後的模型不洩露,隨著時間的推移,只要有需求,就一定會有其他人也創建類似的AI 模型。