美情報界希望開發出可揭示匿名作者身份的AI
外媒報導稱,美國情報界已經啟動了一項AI 開發計劃,希望能夠有效地推斷出匿名寫手的身份、或通過巧妙改變文字來偽裝其身份。美國國家情報局局長辦公室ODNI 表示,在情報高級研究項目活動(IARPA)基礎結構上使用的“人類可解文本歸因”(HIATUS)計劃,旨在構建可執行“語言指紋識別”的軟件。
IARPA 在一份PDF 文檔中指出:“每一天,人類和機器都會生成大量的文本內容,而其中就包含了可揭示作者身份的語言特徵”。
ONDI 表示,有了正確的模型,IARPA 相信它能夠識別不同樣本中的作者風格一致性。
當然這項技術也能夠通過修飾語言模式,使之以新手能夠解釋的方式來完成相關工作,但HIATUS AI 必須是與語言無關的。
HIATUS 項目經理Timothy Mckinnon 博士稱:
我們很有希望達成這一目標,為情報界提供急需的能力,並藉助計算語言學和深度學習的最新進步,大幅擴展我們對人類語言演變的理解。
為開發強大的模型,HIATUS 將著重於對抗性AI 研究—— 作者與匿名文本,與問題是一體兩面。
IARPA 認為,歸因係統的評估,主要根據統一作者在大型收藏中匹配項目的能力。
而隱私系統的評估,則是根據阻止歸因係統的能力。
此外該機構表示,其計劃為HIATUS AI 制定可解釋性的標準。
Timothy Mckinnon 補充道,HIATUS 正在從事的部分工作,是試圖揭開圍繞神經語言模型的某些未知因素。
他表示這些模型的運作良好,但其本質上仍是一個黑匣子,開發人員並不知曉它們是如何做出具體判斷的的。
理想情況下,系統會在我們執行時切實理解為何要這麼做,並且能夠驗證其沒有接收到虛假的東西、及其正在做哪些正確的事情。
若順利走到這一步,從打擊境外影響活動、到識別反情報風險,HIATUS 都有可能產生深遠的影響。
此外HIATUS AI 能夠識別文本是否由機器生成、而不是真人創作出來的。
最後,在IARPA 完成的研究中,約有70% 會交給其它政府合作夥伴去實施—— 前者只負責技術的開發,而不會參與到具體的實施。
目前HIATUS 研究項目已經開拔,但鑑於距離實驗結束還有42 個月(三年半)的時間,所以不要指望這項技術會很快以完整形態出現。