百人聯名AI大模型綜述論文被指抄襲智源研究院致歉:後續追責到人
一篇19 家機構、100 位學者聯名發表的AI 大模型綜述論文,被指涉嫌大量段落抄襲。此事已在國內外學術圈引起廣泛關注。事件爆出當日晚,論文第一單位智源研究院發表中英文致歉信。承認文章中存在問題,已啟動第三方獨立審查,後續將進行追責。
根據智源研究院聲明,這篇綜述報告由智源牽頭,邀請國內外100 位科研人員分別撰寫了16 篇獨立的專題文章,並單獨署名。
按初步調查結果,智源決定立即從文章中刪除已確認的抄襲內容,並通知所有作者對所有內容進行全面審查。目前論文修訂版已提交arXiv 進行更新。
事件經過
問題最早由谷歌大腦研究員Nicholas Carlini 指出。他在一篇博客文章中列舉了10 個涉嫌抄襲的段落,文字一致的部分用綠色標出。
同時通過收集數據初步核查,Carlini 發現這篇論文還涉嫌抄襲十餘篇來自其他作者的論文。此事在社交媒體上不斷發酵,引發大量關注。
隨後Carlini 更新了一段話,呼籲大家理性看待,不要演變成獵巫行動。在不清楚100 個作者中的具體責任人之前不要一棍子打死。
不過,ViT 作者之一Lucas Beyer 認為,在論文中署名就意味著要參與從創意腦暴、試驗、撰寫、校對的過程,承擔相應責任。
被抄襲的作者之一、谷歌大腦研究員Katherine Lee 給出建議:如果需要復用文本,請使用引號明確你的意圖,並註明來源。
對於復用文本,Carlini 認為這是一篇綜述文章,並不算把別人成果說成自己的那種最惡劣的抄襲。但綜述文章的意義在於對一個研究領域的重新構建,直接複製之前的論文並不能帶來新的價值。
最後,附上智源研究院致歉信中文版全文。
智源研究院致歉信:
https://www.baai.ac.cn/portal/article/index/cid/4/id/404.html
Nicholas Carlini 博客文章:
https://nicholas.carlini.com/writing/2022/a-case-of-plagarism-in-machine-learning.html