Google開放SynthID浮水印技術可標記Deepfake內容
現今,大型語言模型(LLM)產生的內容已經充斥了整個互聯網,而這些模型還能模仿各種類似真人的語氣和行文風格,讓人難以分辨眼前的文本究竟來自人類還是AI。這樣的問題或許可證透過所謂的水印(watermarking)技術來解決。
這其實是一張使用GoogleImageFX 人工智慧產生的圖片,附有SynthID 浮水印
Google開發的SynthID 文字浮水印技術登上了最新一期Nature 雜誌封面。
在圖像和文字上添加浮水印具有各不一樣的困難。
在為影像添加浮水印時,由於人眼的辨別相近色彩和能力遠不及機器—— 畢竟在機器「看」來,這些不同顏色本質上只是不同的數值。以下動圖展示了多張加了浮水印和未加浮水印的對比影像。是不是完全看不來水印在哪裡?
如圖所示,SynthID 水印是肉眼無法察覺的
但對於以序列形式展示的文本,人類和機器一樣可以分明地看見其中全部資訊。那麼該如何為文字添加浮水印呢?
為了使人工智慧生成的文本更易於識別,Google DeepMind 創建了SynthID-Text,現已透過Google Responsible Generative AI Toolkit 開源。
論文網址:https://www.nature.com/articles/s41586-024-08025-4
開源位址:https://github.com/TransluceAI
SynthID-Text 是一種可立即投入生產的文字浮水印方案,可維持文字品質並實現高偵測精確度,同時將延遲開銷降至最低。並且,SynthID-Text 不影響LLM 訓練,僅修改採樣程序;水印檢測計算效率高,無需使用底層LLM。
SynthID-Text 建立在先前生成浮水印組件的基礎上,並引入了一種新型採樣演算法,即Tournament 採樣。 SynthID-Text 可以配置為非失真(保留文字品質)或失真(以犧牲文字品質為代價提高水印可偵測性)。在這兩種設定中,SynthID-Text 都提供了更高的偵測率。
簡單舉個例子,對於短語“我最喜歡的熱帶水果是__”,LLM 可能會使用token“芒果”、“荔枝”、“木瓜”或“榴蓮”來完成句子,並且每個token 都會給出一個機率分數。當有一系列不同的token 可供選擇時,SynthID 可以調整每個預測token 的機率分數,以免影響輸出的品質、準確性和創造力。
Google透過對Gemini 即時互動的近2,000 萬個回應進行了大規模使用者回饋評估,結果顯示:非失真SynthID-Text 可以維持文字品質。因此,SynthID-Text 已被用於為Gemini 和Gemini Advanced 添加浮水印。這證明產生文字浮水印可以成功實施並擴展到現實世界的生產系統,為數百萬用戶提供服務。
此外,Google還提供了一種將生成浮水印與投機採樣(speculative sampling)相結合的演算法,允許將SynthID-Text 整合到大規模生產系統中,而額外的計算開銷可以忽略不計。
不過,SynthID-Text 目前僅可以處理短至三句話的文本,以及經過裁剪、解釋或修改的文本,但卻很難處理短文本、被重寫或翻譯的內容,甚至是對事實問題的回答。
Google表示:“SynthID 並不是識別人工智慧生成內容的靈丹妙藥,但SynthID 將是開發更可靠人工智慧識別工具的重要組成部分。”
SynthID 的音訊檔案浮水印規格圖