兩位作家起訴OpenAI 稱ChatGPT侵犯版權

近日，兩位美國作家對ChatGPT母公司OpenAI提起訴訟，聲稱OpenAI在沒有獲得版權授權的情況下，就利用他們的作品來訓練其人工智能。起訴書中提到，美國馬薩諸塞州作家保羅·特倫布萊和莫娜·阿瓦德表示，ChatGPT未經他們同意，直接複製了書籍的數據來進行訓練，這侵犯了作者的版權。

特倫布萊的作品有《世界盡頭的小屋》，阿瓦德的代表作為《看待胖女孩的13種方式》和《兔子》。

這兩位作家稱，ChatGPT寫出的書籍簡要，和他們發表的文章一模一樣，這說明訓練ChatGPT的數據庫，是包含了他們的作品的。

聊天機器人是在大量的文本數據上進行訓練的，OpenAI沒有透露訓練ChatGPT具體使用了哪些數據，但該公司表示，它通常會抓取網絡數據，包括使用檔案圖書和維基百科等。

書籍是訓練人工智能的理想選擇，因為它們往往包含“高質量、精心編輯的長篇文章”，儲存了人類思想的精華。

根據起訴書顯示，OpenAI的訓練數據超過30萬本書，其中包括本就備受爭議、版權歸屬不明晰的“影子圖書館”。

但要證明ChatGPT是如何以及在哪裡收集到這些信息的，以及這些作者是否遭受了經濟損失，可能是一個挑戰。因為ChatGPT也利用了大量的互聯網信息進行訓練，包括互聯網用戶對這些書的討論。

薩塞克斯大學知識產權法專業的ndres Guadamuz表示，這是針對ChatGPT的第一起涉及版權的訴訟。他補充說，這起訴訟將探討生成式人工智能領域“合法性邊界”的問題。

而就在幾天之前，OpenAI在加利福尼亞州同樣被多方提起集體訴訟，起訴書稱OpenAI在未經允許的前提下，在互聯網上竊取和挪用了大量私人數據來訓練ChatGPT。

WONGCW 網誌