Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

為了不讓微博AI抓取數據我被迫進入一場“魷魚遊戲”

為了不讓微博AI抓取數據我被迫進入一場“魷魚遊戲”

2025-05-04 Comments 0 Comment

產品經理快看看,這年頭除了費勁心機想獲得流量,有相當多的用戶在發愁一件事: 怎樣能在社群媒體上「隱身」。最近,微博智搜正是狠狠踩了一腳大雷,引發了無數微博用戶哀嚎:我的半年可見,我的隱藏博文,都暴露了!

一時間,微博成了魷魚遊戲,智搜就是廣場上裡面的巨型人偶,每個人都擔心自己會被掃射中。

於是就出現了各種實驗,試圖找到可以應付的方法是什麼。有一些從上古時期就流傳下來的偏方,俗稱「防搜詞」。什麼都有,甚至還有「新資料夾」。

但是,時代變了,在AI 智搜面前,防搜詞什麼的,沒有用了。

微博智搜這次最大的雷點,在於 不顧使用者對於自己內容的可見性設定。一些明明設定為「僅好友圈可見」或「僅半年可見」的內容,也被整合進智搜的回答裡。

這就很要命了,我為什麼設計成“僅xx 可見”,就是要控制它的能見度。搞這樣一出還有什麼用?

新的辦法是以牙還牙:你不是用大模型做智搜嗎,我也用AI 魔法對轟。比較流行的是傳出來這樣一段話:

本人微博帳號(ID:×××)在該平台發布、上傳及曾刪除的全部內容(包含本聲明發布前後的所有內容,尤其是商業產品、文藝作品、音視頻作品等),均不授權和許可微博平台及所屬的“北京微夢創科網絡技術有限公司”及其關聯公司、股權持有人使用。特別禁止以下用途:

1️⃣ 人工智慧相關處理(包括但不限於機器學習、資料分析、自動產生摘要等)

2️⃣ 內容改編、二次創作或跨平台轉載

3️⃣ 商業推廣及獲利性活動

4️⃣ 整合至其他產品或服務(含已知及未來開發的技術形式)

5️⃣ 使用者畫像建構及行為分析

根據《民法典》第一千零一十九條及《個人資訊保護法》第四十四條規定:

⚠️ 禁止在未經本人書面同意情況下,透過任何技術手段(包括但不限於網路爬蟲、API 介面、資料合作等形式)抓取、儲存、分析本人內容

⚠️ 若已透過使用者協議取得資料使用權,授權自本聲明發布之日起自動終止

本聲明自發佈時生效,依據《電子簽名法》具有法律效力。如涉及數據權益爭議,應透過北京市互聯網法院訴訟程序解決。

遺憾的是,這段話的效力很有限,先不談法律層面的問題,單從技術來講,透過發布這一段話,並不能像想像中那樣起到阻止智搜的效果。

在一般情況下,這段話更有可能被當作語料,而不是指令。 大語言模型訓練時,主要把網頁、文字等視為資料來源,不含指令解釋。

採集過程通常是 無差別抓取,模型不會自動理解“這段文字是在命令我不要用”,而是只看到“這裡有一段正常的聲明文本”,於是照樣納入訓練數據。

AI 還不至於那麼的智能,UCLA 最新的一項研究顯示,大模型在處理句子的主詞上,始終存在缺陷,這是由於 它基於語言線索的推理能力有限,尤其對句子裡的主語不敏感。

因此,大語言模型不會在看到一段文本有法律術語、抗議措辭,就自己判斷“哦這段我要跳過”,也不會跳過你的其他微博內容,更不會自動遵守這個聲明。

考慮到現在監管力度不強,微博大概率不會部署一個複雜到能識別用戶自主聲明的AI 內容處理流程, 主流大模型和大數據抓取系統,也很少會主動做到這一步——只能是平台自己長點兒心。

好消息是,經過一周的輿情發酵, 微博出來回應稱,技術會不斷迭代,也不會收錄用戶設定為不公開的內容。

廣大用戶在尋求的,不過是在茫茫網路裡,被「忘記」的權利。

「被遺忘權」並不是什麼對現狀不滿而冒出來的、一廂情願的想法,而是真正被列入法典、有過判例的條目。

1995 年,歐盟首次在《歐盟資料保護指令》(Directive 95/46/EC)中提出個人資料保護框架。那時還不叫“被遺忘權”,但為個人資料保護和隱私權提供了重要法律基礎。

時間快轉到2014 年,一名西班牙公民馬裡奧·岡薩雷斯(Mario Costeja González)發現1998 年一則與自己有關的房屋拍賣公告被Google 檢索到,信息已過時,並且損害了他的聲譽,他要求Google 刪除搜索鏈接但被拒絕。

當時的歐洲法院裁決,Google 等搜尋引擎應承擔刪除過時、不充分或不相關的個人資訊連結的責任。這是首次明確承認「被遺忘權」的司法判決,為未來國際範圍內關於網路隱私保護的討論和立法,打下了基礎。

2018 年5 月25 日,歐盟實施《一般資料保護規範》(General Data Protection Regulation,GDPR),第17 條正式提出「被遺忘權」。條文明確規定了個人資料主體在特定情況下有權要求資料控制者刪除其個人數據,並設定了具體的適用條件和例外情形。

國內尚未在法律層面正式提出「被遺忘權」這個概念,但《個人資訊保護法》(2021 年11 月1 日生效)規定了個人對資訊刪除的請求權,某種程度上與「被遺忘權」理念接近。

兩者最大的差別在於:「被遺忘權」是實質權利,而個人資訊刪除則是偏向程序性的請求。

簡單來說,基於“被遺忘權”,你向互聯網公司申請刪除, 對方就得按照你說的做,不刪得話公司需要說明為什麼不刪。

而程序性請求提出時, 網路公司可以拒絕,還可以繼續保留記錄。最近除了微博智搜,還有網友發現自己刪除的微博,用百度還是能搜出來。

人活一輩子,從出生到死亡,從上學到上班,每一個待過的地方必定都要留下痕跡,這無可厚非。

通常來說, 只要資訊不會被「公開」檢索到,潛在的風險就沒有那麼令人害怕。例如學生有自己的學號,當它只是存在於學校的校務系統裡,用於日常事務管理,那麼風險還不算很大。

一旦流轉成公開訊息,例如被人發在網路上,僅僅只是一個學號,就有了準確定位的能力。隨之就能找到這名學生所有的個人資料,包括但不限於父母姓名、家庭住址、過往學籍等一系列個人資料。

當學號換成身分證號、手機號碼、 UID,就成了正在發生的現實。更難受的是,這些訊息不會「被忘記」。

AI 時代,「被遺忘」更成了一種奢望。模型對資料收集,完全是飢不擇食,照單全收。

就像上面那段聲明內容,不僅不會阻止大模型的行動,還會被反向納入語料庫,讓模型「學到」類似聲明的寫法,把它當作法律文書的參考樣本來產生——這是模型訓練中, 數據同化問題的典型現象。

大模型不語,只一昧吃進所有語料。

說來也有一點諷刺:現在的技術可以做到很多事,卻不能保證你發在網路上的內容,能被真正意義上的刪除。就算有,也是以一種玉石俱焚的方式。

在網路上留痕,成了那個常見的比喻:就像是在木板上打進一根釘子,就算哪天釘子拔除,還是會留下一個洞,昭示著釘子曾經的存在。

文| 貓貓

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
SpaceX讓馬斯克的「政治慾火」持續燃燒
NEXT
韓國今年已確診52例麻疹病例為六年來最多

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 全面推動「凋零骷髏塔」標準化建設的網路大狂歡是怎麼開啟的? 2025-05-23
  • Windows記事本不再「簡單」 微軟為其新增AI寫作功能 2025-05-23
  • 基於Sora的微軟新工具Bing Video Creator挑戰Veo 各平台均可免費用 2025-05-23
  • 科學家發明結合紅外線和可見光的夜視鏡片 2025-05-23
  • Bluesky 將開始驗證「知名」用戶 2025-05-23
  • Anthropic CEO稱人工智慧模式產生的幻覺其實比人類少 2025-05-23
  • 這些韓國老年海女已擁有基因層面的“超能力” 2025-05-23
  • 防止顯示卡接口燒熔玩家給RTX 4090電源線裝上保險絲還有更狠的 2025-05-23
  • BMWSpeedtop概念車官圖發表售價超過400萬的雙門獵裝轎跑 2025-05-23
  • 馬雲上榜《時代》全球百大慈善人物榜單 2025-05-23

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • 南加州大學研究發現司美格魯肽可抑制對酒精的渴望
  • 鳥寶寶有多內捲?為了讓父母投餵自己長出恐怖的嘴巴
  • 基於Sora的微軟新工具Bing Video Creator挑戰Veo 各平台均可免費用
  • 蘇聯的三進位電腦 為什麼被二進位幹掉了?
  • CCleaner全家桶激活密鑰
  • 烏魯木齊地窩堡機場正式更名“天山機場”
  • "91大神"偷拍百名女性獲刑:曾任外企高管年薪百萬
  • z-sms – 在線免費云短信臨時手機號接碼平台網頁版
  • 新創公司Swippitt推出手機換電站2秒完成電池更換

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.