Meta承認使用盜版書籍訓練AI 拒絕賠償作家
Meta最近因使用數千本盜版書籍訓練人工智慧模型存在法律風險而引發版權侵權訴訟。據悉,Meta使用大量盜版書籍的「Books3」資料集訓練其LLAM 1和LLAM 2模型,Meta雖承認使用了Books3 資料集,卻拒絕向作者支付適當的補償。
Books3是一個包含19.5萬本圖書、總容量近37GB的文本資料集,由AI研究者Shawn Presser於2020年創建,旨在為改進機器學習演算法提供更好的資料來源。
Meta也將其用於訓練自己的LLAM模型,然而Books3中包含大量從盜版網站Bibliotik爬取的受版權保護作品,使得Meta的行為面臨法律風險。
多位科技公司今年也面臨類似的投訴,指責他們在建構生成式AI模型時侵犯了藝術家、作者和其他內容創作者的版權。
此外,歐盟關於人工智慧的新臨時規則可能會迫使公司揭露用於訓練模型的資料集,這可能會使他們面臨更大的法律風險。