百度文心一言潛藏風險：AI視頻素材來源不明創作者或陷版權風暴

2023-03-27 Comments 0 Comment

李彥宏攜百度文心一言亮相，並宣布開放邀請測試。雖然文心一言的能力受到了質疑，但毋庸置疑的是，百度是全球第一個挑戰ChatGPT的大廠。李彥宏也已經預見，文心一言在與ChatGPT正面比較時會令大眾失望，但百度認為，文心一言有兩大優勢：一是，畫圖、寫長文、文字轉視頻等多模態生態能力是ChatGPT所不具備的；二是，文心一言具備中文理解能力優勢。

但是，百度自詡的優勢也許會成為文心一言所面臨的大問題。近日，有網友在對百度文心一言AI作畫功能進行大量測試後產生懷疑，認為其可能只是一個套殼的AI模型，先將用戶的中文指令翻譯成英文，然後用國外開源的AI模型生成作品。百度方面針對此回應表示，文心一言完全是百度自研的大語言模型，文生圖能力來自文心跨模態大模型ERNIE-ViLG。

不過《IT時報》記者發現，百度低調向百家號入駐作者開放的AI圖文轉視頻功能存在版權風險：百度視頻素材來源不明。但這一風險被轉嫁至媒體及其他百家號作者，若被告侵權，作者將承擔巨大的版權風險。截至發稿，百度沒有對文心一言版權問題進行回复。

百度即將在今天（3月27日）上線文心一言雲服務，屆時，AI寫作、AI作圖、AI文字生成視頻等功能都有可能對外開放，這些危險的AI生成作品，也許會把百度席捲至版權風暴之中。

AI視頻潛藏版權風險

《IT時報》記者實測比較百度文心一言和微軟必應ChatGPT後發現，文心一言在文學創作、商業文案創作、數理推算方面仍有較大的追趕空間。但正如李彥宏所言，百度文心一言的優勢在中文理解和多模態生成能力。

李彥宏表示，文心一言目前版本已經能生成文字、圖片和語音。生成視頻因為成本比較高，還沒有對所有用戶開放，未來百度會逐步接入。但熟悉百家號創作的用戶，不少都已經體驗過這個功能，每天有幾萬篇文章通過這個能力轉成視頻內容在百度平台分發。

但是，巨大的版權風險正潛藏在這每天幾萬條根據文字自動生成的視頻中。

百度AI文字轉視頻功能早在2022年3月就已在百家號低調上線，百家號作者鮮少第一時間發現，是因為這一功能是在發布文章時默認勾選。在默認勾選狀態下，百度AI會自動根據文字內容尋找合適的視頻素材，生成視頻後並自動發布，其中文章配圖只佔10%以內的佔比，其他視頻素材均來自百度視頻庫。

這是屬於文心一言AIGC（人工智能自主生成內容）的TTV（文本內容情感化分析）功能。危險的是，百度並未公開其AI視頻素材來源。多位百家號工作人員向《IT時報》記者表示，的確存在版權風險，至於其視頻素材來源，一部分由百度進行版權採買，一部分是公開CC0（放棄版權）素材，建議不發到百度站外，或關閉該功能。

目前，這些AI視頻主要自動發佈在百家號及百度好看視頻平台，但可以下載。“如果在百度平台內，可能由百度來處理版權糾紛，但目前還沒了解到有什麼版權侵權的案例。”百度百家號工作人員向《IT時報》記者透露。

但在社交平台上，多名百家號作者表示，AI根據其文章自動生成的視頻被投訴侵權，其賬號信用分被扣至0分而被封禁。還有百家號作者表示，AI自動生成視頻中疑似含有版權水印。

《IT時報》記者發現，百度AI視頻庫裡還有不少電視台等媒體拍攝視頻，但無處查詢視頻素材出處。

百家號只在圖文轉視頻的相關權益說明中提到，“如果您是原創視頻作者，那麼您發布的圖文為原創時，轉出的視頻會自動聲明該視頻為原創視頻，並且視頻的閱讀收益歸您所有。”

截至發稿，百度沒有對文心一言AI視頻來源等問題做出回复。

風險轉嫁至作者

更不合理的是，百度可以無償使用百家號作者上傳的內容，又將版權風險轉嫁給百家號作者。

百家號在平台服務協議9.7條中提到：“您使用百家號平台服務上傳、發布或傳輸內容即代表了您有權且同意在全世界範圍內，永久性地、不可撤銷地、免費地授予百度及其關聯方對該內容的存儲、使用、發布、複製、修改、改編、出版、翻譯、據以創作衍生作品、傳播、表演和展示等權利；將內容的全部或部分編入其他任何形式的作品、媒體、技術中的權利；對您的上傳、發布的內容進行商業開發的權利……以及再授權給其他第三方以上述方式使用的權利。”

據此協議理解，百度有權使用百家號A作者上傳的文字、圖片、視頻等內容，編入B作者的作品中，甚至用於商業用途，完全不需要得到A作者的授權，也不需要付費給A作者。

《IT時報》記者查詢抖音及其他新聞媒體平台與作者簽訂的協議發現，並沒有存在如百度百家號這般不合理的條款。

上海大邦律師事務所高級合夥人、知識產權律師遊雲庭解讀認為，如果上述條款有效，那百度就可以使用這些視頻素材，不構成侵權也無須支付對價，如果該條款被法院認定為無效，則百度對外使用就構成侵權。

而當該條款遇上AI生成內容，潛藏的版權風險將對百家號作者更加不利。遊雲庭認為，文字內容是媒體創作的，百度只是提供了技術服務，因為AI生成的視頻是無權享受著作權的，所以知識產權應該歸媒體所有。媒體發布的視頻，對外應該由媒體承擔責任，如果權利人起訴媒體就是媒體承擔責任，如果權利人起訴雙方共同侵權，則構成連帶侵權責任。

“由百度提供模型，素材庫按照百度的合同規則使用的情況下，發生侵權可能責任是百度的。這當中任何一個節點發生變化，可能就是使用者的責任或者共同責任。這裡面變量很多，要看具體細節。判斷依據是人工智能生成品是不是侵權，模型數據提供者和使用者有沒有過錯等。”上海段和段律師事務所合夥人劉春泉認為，人工智能生成品有沒有版權？與責任風險由誰承擔？應該按照權利義務相一致原則來處理。純粹人工智能生成品與動物按快門拍照片和大像畫畫一樣沒有版權。但是人利用AI作為工具製作的產品，符合法律規定的構成作品，可以受保護。

製作1條AI視頻最低9.99元

《IT時報》記者發現，百度已經在進行文心一言的商業化嘗試，而上述AI文字轉視頻的服務正是文心一言雲服務的主要盈利點。

目前，百度大腦智能創作平台推出了兩種會員套餐，視頻創作會員1698元/月，智能寫作會員198元/月。其中，視頻創作會員的權益就包括每月50次圖文轉視頻等。此外，圖文轉視頻200條的報價是1998元，50條的報價是698元，20條的報價是298元，也就是說，1條圖文轉視頻的價格最低是9.99元。

“目前不管是API還是線上售賣的套餐，我們都沒接入素材庫。”百度雲客戶經理沒有正面回答文字轉視頻素材來源的問題，但就AI生成圖片的版權問題回复表示：“AI生成內容的可版權性在法律上仍處於不確定狀態，百度不限制您將生成圖片用於商業用途，但您應確保自身使用行為的合法合規性，在享有生成圖片使用權益的同時，自行承擔使用生成圖片的一切後果。”

截至3月27日，百度大腦智能創作平台顯示，其自動創作文章已超200萬篇，自動創作短視頻已超15萬條。

風口上的百度急了

“現在百度最卷的部門已經不是自動駕駛了，而是文心一言。”一位百度自動駕駛部門的員工說道。

基於20多年搜索業務的積累，百度建立起世界上最大的知識圖譜，包含50億實體、5500億級事實，每天調用量超過400億次。受益於百度知識圖譜，文心大模型也成為全球首個知識增強千億級大模型。研究表明，數據達到千億級，大模型就可能發生“智能湧現”，但最快跑出ChatGPT的為什麼不是百度？

過去10年，百度在AI領域投入超1100億元的研發費用，2019年就推出了文心大模型ERNIE 1.0。論起步時間，文心一言並不比ChatGPT晚，但論專注度，百度沒有OpenAI聚焦。此前百度之前一直將最大的精力投向了自動駕駛，以及一系列的AI風口追逐，當初希壤也讓百度爭得了國內元宇宙“頭號玩家”等名號。

“百度的主要收入還是搜索廣告，這也是百度為什麼著急做文心一言的原因之一。”一位百度崑崙芯的員工認為。

ChatGPT焦慮已經是業內的常態。

國內ChatGPT模型跟OpenAI的差距到底在哪裡？“算法上還有細節要打磨，其次，高質量的文本數據還需要多積累。”一家研發GPT模型公司CEO對《IT時報》記者道出了多數國內ChatGPT從業者的現實和心態，“類ChatGPT的產品可能有版權上的顧慮，但先把技術用起來，以後再想辦法更好地規範。”

不過，也有一家國內AI大廠的相關人士對《IT時報》記者表示，目前已跑出AI作圖等ChatGPT大模型，但是主要考慮到版權等風險，沒有快速上線。

AI版權風暴即將來襲

最近，網易旗下輕博客社區LOFTER上的大量創作者刪檔銷號，退出平台，用行動抵制AI作畫。起因是網易LOFTER上線AI作畫功能“老福鴿畫畫機”，部分創作者認為該功能可能用到原創作者的畫作，有侵犯版權之嫌。

對此，網易LOFTER強調“該功能訓練集來自於開源，沒有使用LOFTER用戶的作品數據，並明確註明不得用於商業用途”。3月16日，網易LOFTER官微向創作者發出一份公開致歉信，為傷害了很多創作者而表達歉意。該AI作畫功能已於3月8日下線，網易LOFTER單獨設立的“AI內容冒充原創”反侵權投訴渠道，截至3月25日收到1148條舉報投訴。

在國外，AI侵權問題已經引起社會關注。近日，《華爾街日報》等多家國外主流新聞媒體指控OpenAI及其聊天機器人模型ChatGPT未經許可使用新聞來源進行訓練，並拒絕向媒體支付相關費用。

早在2022年，一名程序員起訴GitHub、微軟和OpenAI，指控GitHub Copilot的AI編程工具抄襲代碼。今年1月，一群藝術家起訴AI繪畫Stability AI Ltd．、Midjourney Inc．和DeviantArt Inc．，聲稱這些公司下載並使用了數十億張受版權保護的圖像，但沒有獲得藝術家的授權並對其進行補償。

一場AIGC的版權風暴正在來襲。

2月15日，愛奇藝宣布將全面接入百度文心一言，雙方將共同探索AIGC在內容搜索、內容宣發、內容創作工具、小說創作等業務上的應用。近期，文心一言開發的AI文檔寫作助手也將上線百度文庫，作者只要輸入主題及內容要求，AI寫作助手就能幫助蒐集資料、搭建框架、填充內容、理順文檔、製造亮點，最終生成範文。

李彥宏認為，多模態生成能力是ChatGPT不具備的能力，這是文心一言的優勢。但是，百度一旦開放AI寫作、AI作圖、AI文字生成視頻等，受到的版權類指控並不會比ChatGPT少。訓練數據是否得到授權，AI生成作品是否涉嫌侵權等問題會接踵而至。

關於AI生成內容的版權問題正在業內掀起大討論。

知識產權界絕大多數專家都認為，AI生成內容是不受版權保護的。中國社會科學院知識產權中心主任李明德認為，《著作權法》只保護人的作品，AI生成的內容不是作品，沒有版權。只有個人使用存在免責情況，公司拿媒體的作品去訓練AI，但沒有拿到媒體的授權，就構成侵權，文字三四行就能構成作品，視頻每一幀都是作品。

WONGCW 網誌

記錄生活經驗與點滴

百度文心一言潛藏風險：AI視頻素材來源不明創作者或陷版權風暴

2023-03-27 Comments 0 Comment

相關

發表迴響取消回覆

2023 年 3 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

分享此文：

相關

發表迴響取消回覆