人工智慧正在整理維基百科的參考資料以提高可靠性
維基百科的參考資料非常關鍵,即支援線上百科全書中資訊的來源連結。但有時,這些參考資料是有缺陷的,例如指向損壞的網站、錯誤的資訊或非可信的來源。10月19日發表在《自然-機器智能》(Nature Machine Intelligence) 上的一項研究表明,人工智慧(AI)可以幫助清理維基百科條目中不准確或不完整的參考文獻列表,提高其品質和可靠性。
總部位於倫敦的Samaya AI公司的法比奧-佩特羅尼和他的同事們開發了一個由神經網路驅動的系統,名為”SIDE”,它可以分析維基百科的參考文獻是否支持與之相關的說法,並為那些不支持的參考文獻提出更好的替代方案。
“鑑於ChatGPT 對引文的錯誤和幻覺是出了名的,用人工智能來幫助處理引文似乎有點諷刺。”馬薩諸塞州沃爾瑟姆本特利大學研究人工智能的諾亞-吉安西拉庫薩( Noah Giansiracusa)說:”但重要的是要記住,人工智慧語言模型的作用遠不止於聊天機器人。”
SIDE 經過訓練,可以利用維基百科現有的特色文章識別出好的參考文獻,這些文章在網站上得到推廣,並受到編輯和版主的廣泛關注。然後,它就能透過驗證系統識別出頁面中存在劣質參考文獻的聲明。它還可以掃描互聯網,查找有信譽的來源,並排列出替換不良引用的選項。
為了對該系統進行測試,Petroni 和他的同事使用SIDE 為維基百科的特色文章推薦它以前從未見過的參考文獻。在近50%的情況下,SIDE的首選參考文獻已在文章中被引用。在其他情況下,它找到了其他參考文獻。
當向一組維基百科測試用戶展示SIDE 的結果時,21% 的用戶更喜歡人工智慧找到的參考文獻,10% 的用戶更喜歡現有的參考文獻,39% 的用戶沒有偏好。
瑞士蘇黎世大學計算通訊科學家亞歷山大-烏爾曼(Aleksandra Urman)說,該工具可以為編輯和版主檢查維基百科條目的準確性節省時間,但前提是必須正確使用。她說:”該系統在標記那些可能不合適的引文方面可能很有用。但問題是,維基百科社區會認為什麼最有用。”
烏爾曼指出,測試SIDE 系統的維基百科用戶對兩種引文都不喜歡的可能性是對人工智慧推薦引文喜歡的兩倍。她說:”這意味著,在這種情況下,他們仍然會上網搜尋相關的引文。”