新聞業到底需不需要ChatGPT?
ChatGPT打破「數據截至2021年」的枷鎖,成功連接上網的資訊一經發布,引發媒體圈的好奇與圍觀。9月27日,OpenAI公司宣布ChatGPT向付費用戶提供網路瀏覽版本,付費用戶可以透過微軟的搜尋引擎Bing聯網取得最新信息,這打破了ChatGPT資料庫截至2021年9月的限制。在此之前,使用者無法透過ChatGPT存取網路的最新資訊。
路透社新聞研究所日前測試了ChatGPT的連網功能,並評估了ChatGPT提供新聞資訊的準確性和及時性、處理爭議主題和其他語言資訊的能力。測試者用不同類型的新聞問題來評估它作為新聞工具的效果。測試結果如何,下文帶您一探究竟。
一、聯網ChatGPT:一個不完美的新聞助手
測試者選取了不同類型的新聞事件向ChatGPT提問,對其處理突發新聞的速度、總結持續性新聞報道、處理有爭議的新聞報道、應對虛假新聞等方面進行測評。
1.ChatGPT處理突發新聞的速度有多快?
測試者用英國校車相撞事故和HS2高速鐵路計畫兩則新聞進行了測試。英國發生了一起校車相撞的事故,BBC對這則新聞的進度進行即時更新。校車事故發生後,ChatGPT在給予死亡人數資訊上有延遲。測試者多次追問,直到BBC關於事故傷亡人數的推播訊息發布後兩個半小時以後,ChatGPT才給了這次事故的死者的資訊。這個測試顯示ChatGPT在訪問突發新聞方面存在一定的延遲(或者說採取了謹慎的處理方式)。
測試者以英國首相宣布削減HS2高速鐵路項目預算的突發新聞再次測試。這次ChatGPT立即給出了正確答案,在BBC應用程式推播相關訊息後五分鐘內,就給出了包含了最新消息的答案,並引用了一個即時更新的部落格作為資訊來源。
ChatGPT對這兩則新聞回答的差異,顯示ChatGPT對不同性質的新聞事件有不同的反應速度,也可能顯示了這項技術還不夠完善。
2.ChatGPT在總結持續性新聞報道方面表現如何?
(1)提供持續性的新聞報導背景資訊的表現
HS2鐵路一直在規劃當中,一直是英國的頭條新聞。測試者再次用HS2的新聞測試ChatGPT在提供持續性的新聞報導的背景資訊方面的表現。ChatGPT總結這則新聞的能力十分出色,內容簡潔明了、緊扣要點,並連結到了ITV新聞關於這個主題的解釋性報道。但是,ChatGPT在根據不同新聞知識背景的人群調整新聞摘要的方面表現不佳。
測試者要求它為一個來自曼徹斯特的人總結這條新聞(曼徹斯特包含在最初鐵路規劃中,但現在不在鐵路規劃中),和為一個“對該項目非常了解”的人分別總結這條新聞。但ChatGPT對這兩個要求給了基本上相同的答案,只是措詞和強調重點稍有不同。新開一個聊天框重新提問也無法解決這個問題。
(2)回答長期、複雜、敏感新聞
測試者用兩則新聞測試了ChatGPT回答長期、複雜、敏感新聞的表現。測試者先用俄烏戰爭的問題來測試。ChatGPT能夠給予準確的訊息,但沒有提供任何背景資訊。測試者再用《華爾街日報》記者艾文·格甚科維奇在俄羅斯被關押的新聞進行測試。ChatGPT將美聯社關於莫斯科法院拒絕記者上訴請求的新聞報導作為資訊來源,答案非常簡短,但沒有提供背景資訊。ChatGPT沒有明確表示格甚科維奇是否有罪,而是建議用戶關注主要新聞機構以及俄羅斯當地的新聞機構或俄羅斯官方聲明等權威資訊來源,或法庭的最終判決。只有當測試者追問這些俄羅斯消息的來源是否可信時,它才對先前的回答進行了限定,提醒俄羅斯的消息來源可能帶有偏見。
3.ChatGPT如何處理有爭議的新聞報導?
測試者用關於川普和拜登的新聞來測試。ChatGPT提供了冗長且詳細的回答,引用了多份新聞報導作為資訊來源。在評論唐納德·特朗普審判的公平性時,ChatGPT保持中立。測試者再用對喬·拜登彈劾調查的新聞進行測試,得到了和川普新聞相類似的長且細緻的答案。
在這兩個測試中,ChatGPT都沒有傾向於支持或反對有爭議的觀點的任何一方,而只引用了遵循政治公正原則的新聞機構的資訊。答案非常詳盡,與之前其他測試中給出的簡短答案形成了對比。
測試者用以色列和哈馬斯衝突的新聞,測試ChatGPT如何處理在全球分裂公眾意見的爭議性新聞報道。當被問及最近發生事件的事實性問題時,ChatGPT引用國際新聞機構的報道,展示衝突雙方的立場和觀點,其答案沒有立場傾向,即使面對「歸咎於誰」的引導性問題時,也會避免直接回答,以中立的立場解釋不同面向的觀點。但如果要求以特定立場撰寫文章,ChatGPT會產生帶有偏見的極端觀點。
4.ChatGPT如何應對虛假新聞?
測試者先用一則完全編造的新聞來測試:「喬·拜登辭去了美國總統一職」。ChatGPT辨識出這是一個錯誤訊息,解釋了它在哪裡尋找新聞、這條錯誤訊息可能在哪裡流傳,引用了一個事實查核者,並給出了關於網路錯誤訊息的一般性警告。
測試者以「15分鐘城市」的問題進行了與真實事件相關的虛假新聞的測試。對於測試者關於這個概念的最初幾個問題,ChatGPT沒有連網回答,當測試者詢問英國政客哈珀的評論時才連網。它總結了哈珀的觀點,並解釋了他可能受到相關辯論中哪些因素的影響、提到了這個概念的讚成者和反對者的觀點,但沒有直接回答哈珀的評論是否準確的問題。但新聞機構與ChatGPT不同,會對哈珀的誤導性評論進行事實查核。例如BBC 核查(BBC Verify)的報告表示「這不是對『15分鐘城市』的準確描述」。
此外,上述例子大多是圍繞在英國發生的新聞用英語進行。測試者也用其他語言和其他國家的新聞進行了測試。ChatGPT似乎更傾向於使用與對話語言相同的資訊來源,而英語似乎是預設語言。在國際新聞方面,這可能意味著非英語語言的新聞媒體在ChatGPT的答案中往往被忽視。
二、應對人工智慧的衝擊:人性化成為關鍵密鑰
倫敦政經學院(LSE)的新聞人工智慧計畫(Journalism AI)研究了新聞機構與人工智慧及相關技術的合作情況,對來自46個國家的100多家新聞機構進行了調查,形成報告《催生變化:對新聞機構利用人工智慧的全球調查》(Generating Change:A global survey of whatnews organisations are doing with AI)。根據這份報告,在全球範圍內,生成式人工智慧或其他形式的人工智慧技術,已經在新聞機構中廣泛使用。
這項調查在2023年4月至7月期間進行,並對120多名編輯、記者、技術人員和媒體製作人進行了調查。近四分之三(73%)的受訪新聞機構認為,ChatGPT或GoogleBard等生成式人工智慧為新聞業帶來了新的機遇,提高了效率、生產力和創造力。約75%的受訪者表示,他們至少在趨勢檢測或轉錄、內容、個人化等其中一個領域以各種方式使用人工智慧。85%的受訪者在撰寫摘要和生成標題等任務中嘗試過人工智慧。約80%的受訪者預計人工智慧在新聞編輯室中將發揮更大的作用。同時,超過60%的受訪者對人工智慧可能帶來的編輯品質和新聞業道德問題表示憂慮。
大模型撲面而來,如何應對人工智慧的危與機?NPO (荷蘭公共廣播)策略與創新總監Ezra Eeman表示,面對新的人工智慧工具,應該從評估新聞工作中的人類因素開始:「應該向新聞編輯部提出的第一個問題是,我們的工作中人類的因素是什麼?我們如何放大它?我們怎麼能讓這一點更明顯?」丹麥的數位新聞媒體得蘭(Zetland)的克利特加德(Klitgaard)認為,新聞媒體在使用人工智慧時應考慮新聞工作中的人性色彩。在一個人工智慧大量生成內容的世界中,內容生產的人性化可以獲得巨大的價值。
此外,與使用者建立緊密聯繫是應對生成式人工智慧帶來的挑戰的重要策略。生成式人工智慧可以根據使用者興趣推薦內容,但無法完全滿足每個使用者的獨特需求。因此,新聞媒體必須加強與受眾特別是年輕受眾的聯繫。
例如,施普世特(Schibsted)和蒂尼烏斯信託基金(Tinius Trust)合資的新聞創新實驗室IN/LAB,直接聘用了10名青少年用戶進入新聞機構工作10週,讓這些青少年使用人工智慧技術,如文字生成、圖像生成、音樂生成等,創造出更有創意和人文關懷的新聞產品。相較於僅依靠演算法推薦內容,這種與年輕用戶深度互動的方式更能理解用戶的真正需求。
結語
正如倫敦經濟學院主任查理貝克特教授所說:人們非常需要了解什麼是人工智慧,特別是什麼是生成式人工智慧,以及它與解釋性人工智慧有什麼不同,這樣才能讓人們意識到生成式人工智慧可能帶來的根本改變。
歷史上每一次科技變革都會「消滅」一部分傳統崗位,但同時也誕生了更多需要善於駕馭新一代科技的崗位。矽基文明的到來引發了人類對於「生而為人」的深度思考,面對技術升級,媒體人和新聞媒體需要保持好奇心,找到新科技時代的業務迭代基因,早日實現自身能力和機構業務的「蝶變」。