人工智能正製造網絡垃圾低質量AI生成網站獲廣告支撐迅猛發展
新聞網站評級工具NewsGuard發布2023年6月的錯誤信息監控結果,稱141個品牌正在向低質量的人工智能(AI)生成的網站提供廣告收入,來支持這些不可靠網站的發展。這些網站在幾乎沒有人監督的情況下運行,每天平均生成上千條文章,其中包括錯誤信息,特別是誤導用戶的醫療健康信息。
科技媒體The Verge稱,人工智能正在扼殺舊網絡,而新網絡正在掙扎著誕生,“生成式人工智能模型正在改變網絡經濟,使生成低質量內容變得更便宜。我們才剛剛開始看到這些變化的影響。”
發現217個不可靠的AI生成新聞和信息網站
NewsGuard分析發現,發佈在AI生成內容網站上的廣告似乎是以編程方式生成的,這意味著公司不是選擇將其廣告投放在這些網站上,而是通過投放廣告的系統自動定位。大多數廣告是由Google的工具投放的。
NewsGuard將不可靠的AI生成新聞和信息網站(UAIN)定義為,在很少或沒有人類監督的情況下運行的網站,並發布主要或完全由機器人撰寫的文章。就在上個月,NewsGuard分析師將新推出的UAIN網站跟踪器上的網站數量從49個更新為217個。
儘管許多廣告商及其廣告代理商維護著“品牌不安全”網站的“排除列表”,但這些列表往往沒有保持最新狀態,顯然沒有跟上UAIN網站激增的步伐。
2023年5月和6月,NewsGuard分析師確定了來自141個主要品牌的393個程序化廣告(programmatic ad,利用技術手段實現數字廣告購買和銷售的過程),這些廣告出現在NewsGuard確定的217個UAIN網站中的55個上。NewsGuard發現的廣告,提供給了美國、德國、法國和意大利四個國家的互聯網分析師。
一家運動服裝公司的廣告出現在NoticiasDeEmprego.com.br網站上,這是一家UAIN網站,發布由人工智能生成的關於巴西工作機會的新聞。NewsGuard用一個黑塊屏蔽了這個程序化廣告。
NewsGuard沒有點名提供這些廣告的公司,它們包括各種各樣的藍籌廣告商:6家大型銀行和金融服務公司、4家豪華百貨公司、3家運動服裝領先品牌、3家電器製造商、兩家世界上最大的消費技術公司、兩家全球電子商務公司、兩家美國頂級寬帶提供商、美國廣播網絡提供的3家流媒體服務、一個矽谷數字平台和一家歐洲大型連鎖超市。
程序化廣告使用算法和高級拍賣流程,直接向個人用戶而不是特定網站提供具有高度針對性的數字廣告。這意味著廣告在用戶瀏覽互聯網時有效地“關注”他們。由於這個過程非常不透明,品牌可能不知道他們正在資助UAIN網站的傳播,因為廣告是通過第三方購買的,並且涉及多個中介機構。
假作者傳播可疑健康信息
NewsGuard發現的所有393個廣告都直接出現在包含由AI生成的錯誤信息的文章旁邊。
一些出現主要品牌廣告的UAIN網站似乎使用人工智能工具重寫主流新聞媒體的文章。例如,AlaskaCommons.com發表的一篇文章似乎是英國小報《太陽報》美國版文章的AI重寫版本,連圖片和措辭都類似。AlaskaCommons.com的文章經常將作者名寫為Ingrid Taylor,自今年年初以來,這位“作者”已經發表了4364篇文章,其中僅在2023年6月15日一天就發表了108篇文章。
一些網站平均每天生成超過1200篇文章,幾乎沒有明顯的人工編輯監督。相比之下,根據2022年4月的數據,《紐約時報》通常每天發表約150篇文章。
大多數AI生成的網站質量低,但不會傳播錯誤信息。然而,NewsGuard發現,MedicalOutline.com推廣未經證實和潛在有害的自然健康療法,標題如“檸檬能治愈皮膚過敏嗎?”“ADHD的5種自然療法是什麼?”和“你如何自然地預防癌症。”
對於UAIN網站來說,快速將其內容貨幣化非常簡單。在GoogleAdSense的登錄頁面上,Google稱網站可以輕鬆地賺取程序化廣告收入:“您所要做的就是將AdSense代碼放入您的網站,它就會立即開始工作。”
自2023年5月首次開始跟踪UAIN網站以來,NewsGuard每週已確定約25個新網站,5月初,其報告還只確定了49個“似乎幾乎完全由人工智能軟件編寫”的網站。而UAIN網站的總數可能比NewsGuard目前識別的217個網站多得多。
一家全球租車公司的廣告出現在FoodingWorld.com上,這是一個UAIN網站,發布AI生成的關於食物的文章。NewsGuard用黑塊擋住了這些程序化廣告。
如果一個網站符合以下所有4個標準,則NewsGuard將其視為不可靠的人工智能生成新聞和信息網站:第一,有明確的證據表明,該網站的很大一部分內容是由人工智能製作的;第二,有強有力的證據表明,內容是在沒有人類監督的情況下發布的;第三,該網站的呈現方式讓普通讀者認為其內容是由人類作家或記者製作的;第四,該網站沒有明確披露其內容是由人工智能製作的。
也不一定是壞事
近幾個月來,已有多家媒體報導AI生成內容正在污染互聯網。當地時間6月26日,The Verge高級記者詹姆斯·文森特(James Vincent)發表了一篇措辭激烈的評論文章。他寫道:“ChatGPT正被用來生成全是垃圾的網站。Etsy(手工藝品電子商務網站)充斥著“AI生成的垃圾”。聊天機器人在錯誤信息的烏龍中相互引用。LinkedIn正在使用人工智能來刺激疲勞的用戶。Snapchat和Instagram希望機器人能在你朋友不在時與你交談……互聯網檔案館正在對抗數據刮刀,而人工智能正在把維基百科撕碎。舊的網絡正在消亡,而新的網絡正在掙扎著誕生。”
文森特認為,當然,網絡多年來一直在死亡,被那些從網站上轉移流量的應用程序或獎勵“縮短注意力”的算法所扼殺。但在2023年,它又在消亡,一個新的催化劑在發揮作用:人工智能。
他打了一個比方:“網站創造了順暢的、功能豐富的平台,並向任何人敞開大門,讓他們加入。他們把盒子放在我們面前,我們用文字和圖片填滿這些盒子,人們就來看看這些盒子的內容。這些公司追逐規模,因為一旦有足夠的人聚集在任何地方,通常就有辦法從他們身上賺錢。但人工智能改變了這些假設。”
因為,只要有資金和計算能力,人工智能係統,尤其是目前流行的生成模型,可以毫不費力地進行擴展。它們會產生大量文本和圖像,很快也會產生音樂和視頻。其產出有可能超過或勝過人們現在所依賴的新聞、信息和娛樂平台。但這些系統的質量往往很差。“這些模型是在上個網絡時代奠定的數據層上訓練出來的,它們對這些數據的再現並不完美。公司從開放的網絡上搜刮信息,並將其提煉成機器生成的內容,這些內容生成成本低,但可靠性差。然後這種產品與之前的平台和人爭奪注意力。”文森特指出。
最成功的網站往往是利用規模發揮其優勢的網站,要么通過增加社會聯繫或產品選擇,要么通過對構成互聯網本身的巨大信息群進行分類,但這種規模依賴於大量人類來創造潛在價值,在大規模生產方面,人類顯然無法擊敗人工智能。
但文森特最後也談到,這不一定是件壞事。“有人會說,這只是世界運行的方式,指出網絡本身就扼殺了之前的東西,而且往往是為了更好的發展。例如,印刷版百科全書幾乎已經絕跡,但我更喜歡維基百科的廣度和可及度,而不是《大英百科全書》的厚重感和安全感。對於所有與人工智能生成的寫作有關的問題,也有很多方法可以改進它——從改進引用功能到更多的人工監督。此外,即使網絡上充斥著人工智能的垃圾,它也可能被證明是有益的,能刺激資金更充足的平台發展。例如,如果Google在搜索中不斷給你提供垃圾結果,你可能會更傾向於為你信任的來源付費並訪問它們。”
歸根結底,人工智能目前引起的變化只是網絡歷史上長期鬥爭的最新成果。從本質上講,這是一場關於信息的戰鬥——關於誰製造信息,如何獲取信息,以及誰獲得報酬。