YouTube為影片創作者/發布者提供選項可設定允許AI公司抓取進行訓練
目前人工智慧的熱潮導致大量公司需要透過網路抓取大量資料進行訓練,儘管最終需要使用資料都是文本,但YouTube 這個影片內容寶庫也在抓取範圍內。
AI 公司可以抓取YouTube 影片後將其音訊抽出並轉錄為文字內容,這些文字內容也就是成了訓練資料集,當然這種操作也是違反YouTube 使用協議的。
對於未經谷歌授權的情況下擅自抓取YouTube 影片並進行各種用戶都是違反使用協議的,不知道谷歌出於哪方面的考慮,現在為視頻創作者/ 內容發布者提供新選項可設置允許AI 公司抓取資料進行訓練。
理論上說這個選項沒有太大的實際意義,因為預設不是允許抓取的,而大多數影片創作者/ 內容發布者不太可能會主動去設定允許AI 公司抓取資料。
不過AI 抓取控制選項也有限制:
- 影片的版權所有者主動允許第三方進行抓取訓練
- 影片的隱私設定為公開,即可以公開訪問
- 影片符合YouTube 的服務條款和社群準則
滿足以上條件後創作者可以授權包含xAI、Apple、Amazon、Anthropic、Meta、Microsoft、Nvidia、OpenAI 等公司使用這些影片訓練AI 模型。
未來這類影片或其他資料也可能發展成專門的交易,例如OpenAI 向創作者支付相關費用後,創作者再授權OpenAI 抓取資料進行訓練,或許Google現在提供這個功能也是在為未來做準備吧。