Meta利用Facebook和Instagram上發布的公開資訊訓練人工智慧助手
Meta宣布,它收集了Facebook 和Instagram 上的公開貼文來訓練其新型人工智慧虛擬助理的部分功能。這家社群媒體巨頭強調,它沒有把用戶的私人貼文或與親朋好友分享的資訊作為訓練資料的一部分。
該公司全球事務總裁尼克-克萊格(Nick Clegg)上週在Meta的Connect大會上接受路透社採訪時說:”我們試圖排除那些個人資訊佔很大比重的資料集。」這位英國前副首相補充說,Meta 用於培訓的絕大多數數據原本都是設定為公開的。”
Meta 公司上週三宣布推出Meta AI 測試版,這是一款高級對話助手,可在WhatsApp、Messenger 和Instagram 上使用,並將在雷朋Meta 智慧眼鏡和Quest 3 上推出。
Meta AI 由今年7 月發布的LLaMA 2 語言模型和Emu 文本到圖像模型提供支持,這兩個模型都是在Facebook 和Instagram 的公開帖子上訓練出來的。
克雷格說,LinkedIn 就是一個例子,出於隱私方面的考慮,Meta 故意不將其內容用於資料訓練。
生成式人工智慧的許多爭議因素之一仍然是其LLM 所訓練內容的版權問題。今年,藝術家們對Stable Diffusion 和Midjourney 發起了版權訴訟,而包括約翰-格里沙姆(John Grisham)和喬治-RR-馬丁(George RR Martin)在內的作家則起訴了OpenAI。克雷格說,他預計在”創意內容是否在現有合理使用原則的覆蓋範圍內”這一問題上會有”相當數量的訴訟”。
克雷格說:”我們認為是的,但我強烈懷疑這會在訴訟案中上演。”
Meta 並不是唯一一家利用使用者內容訓練人工智慧的公司。伊隆馬斯克(Elon Musk)的xAI 也在利用用戶的推文做同樣的事情,而Google在7 月的政策更新中確認,所有發布的用戶內容都將用於人工智慧訓練。
上週三,Meta 公司的老闆馬克-祖克柏(Mark Zuckerberg)也宣布將推出多款基於人工智慧的聊天機器人,這些機器人將以名人和有影響力的人物為原型,包括湯姆-布雷迪( Tom Brady)、野獸先生(Mr. Beast)、帕麗斯-希爾頓(Paris Hilton)、肯達爾-詹娜(Kendall Jenner)和史努比-道格(Snoop Dogg)。Meta 表示將推出28 個同樣由LLaMA 2 支援的機器人。這次活動並沒有圓滿成功。