新的隱寫術技術突破使”完美安全”的數字通信成為可能
一組研究人員通過開發一種算法在安全通信方面取得了突破,該算法能夠有效地隱藏敏感信息,以至於不可能發現任何東西被隱藏。由牛津大學領導的團隊與卡內基梅隆大學密切合作,設想這種方法可能很快被廣泛用於人類數字通信,包括社交媒體和私人信息。特別是,發送完全安全的信息的能力可能會增強弱勢群體的能力,如持不同政見者、調查性記者和人道主義援助工作者。
該算法適用於一種稱為隱寫術的環境:將敏感信息隱藏在常規內容中的做法。隱寫術與密碼學不同,因為敏感信息是以這樣一種方式隱藏起來的,這掩蓋了一些被隱藏的事實。一個例子是在人工智能生成的貓的圖像中隱藏一首莎士比亞的詩。
儘管已經研究了超過25年,但現有的隱寫術方法通常具有不完善的安全性,這意味著使用這些方法的人有可能被發現。這是因為以前的隱寫術算法會巧妙地改變無害內容的分佈。
為了克服這個問題,研究小組使用了信息理論的最新突破,特別是最小熵耦合,它允許人們將兩個數據分佈連接在一起,使它們的相互信息最大化,但各自的分佈被保留下來。因此,在新的算法中,無害內容的分佈和編碼敏感信息的內容分佈之間沒有統計上的差異。
該算法使用幾種產生自動生成內容的模型進行了測試,如GPT-2,一個開源的語言模型,以及WAVE-RNN,一個文本到語音轉換器。除了完全安全之外,新算法在各種應用中顯示出比以前的隱寫術方法高40%的編碼效率,使更多的信息能夠被隱藏在一定數量的數據中。這可能使隱寫術成為一種有吸引力的方法,即使不需要完美的安全,因為它對數據壓縮和存儲有好處。
研究小組已經為該算法申請了專利,但打算以免費許可的方式將其發放給第三方用於非商業的負責任的使用。這包括學術和人道主義用途,以及可信的第三方安全審計。研究人員已經在arXiv上發表了這項工作的預印本論文,並在Github上開放了他們方法的低效實現。他們還將在5月舉行的首要人工智能會議–2023年國際學習表徵會議上展示新算法。
在ChatGPT、Snapchat人工智能貼紙和TikTok視頻過濾器等產品的推動下,人工智能生成的內容越來越多地被用於普通的人類交流。因此,隱寫術可能會變得更加普遍,因為僅僅是人工智能生成的內容的存在將不再引起懷疑。
共同第一作者Christian Schroeder de Witt博士(牛津大學工程科學系)說。”我們的方法可以應用於任何自動生成內容的軟件,例如概率視頻過濾器,或備忘錄生成器。這可能是非常有價值的,例如,對於那些加密行為是非法的國家的記者和援助工作者。然而,用戶仍然需要採取預防措施,因為任何加密技術都可能會受到側面渠道的攻擊,如檢測到用戶手機上的隱寫應用。”
共同第一作者Samuel Sokota(卡耐基梅隆大學機器學習系)說。”這項工作的主要貢獻是展示了一個叫做最小熵耦合的問題和完全安全的隱寫術之間的深刻聯繫。通過利用這種聯繫,我們引入了一個新的隱寫算法系列,它具有完美的安全保證。”
特約作者Jakob Foerster教授(牛津大學工程科學系)說。”這篇論文是研究機器學習基礎的一個很好的例子,它為關鍵應用領域帶來了突破性的發現。看到牛津大學,特別是我們年輕的實驗室,處於這一切的最前沿,真是太好了。”