對專業劇作家而言ChatGPT比人類更有趣
人工智慧和人類誰更有趣?一項新的研究發現,我們發現ChatGPT 生成的喜劇比人類(包括專業作家)創作的喜劇更有趣,或者說與人類創作的喜劇一樣有趣。研究結果表明,對於娛樂業來說,人工智慧並非笑話。
創作喜劇很難。幽默往往是主觀的,所以你覺得好笑的東西,別人可能不覺得好笑。喜劇編劇需要牢記關鍵要素:時機、表達、獨創性和避免陳腔濫調。他們要不斷地在好笑與不好笑之間遊走。
那麼,人工智慧,特別是OpenAI 的ChatGPT 3.5,身為喜劇編劇會有怎樣的表現呢?它能搞笑嗎?如果將人工智慧和人類進行比較,誰會更有趣?在最近發表的一項研究中,來自南加州大學(USC)的研究人員找到了答案。
南加州大學Dornlife文學、藝術和科學學院社會心理學博士候選人、業餘單口相聲演員、該研究的第一作者和通訊作者德魯-戈倫茨(Drew Gorenz)說:”由於ChatGPT本身無法感受到情緒,但它卻比普通人講得更好,這些研究提供了證據,證明你不需要感受到欣賞一個好笑話的情緒,自己就能講出一個真正的好笑話。
先前的一些研究曾探討ChatGPT 是否能寫出幽默的文章,但沒有全面評估人工智慧的輸出並將其與人類喜劇寫作進行比較。因此,戈倫茨和心理學與行銷學教務長諾伯特-施瓦茨(Norbert Schwarz)著手進行了兩項研究。
在第一項研究中,一群美國成年人被要求完成三個不同的喜劇創作任務。在首字母縮寫任務中,他們被要求為”STD”、”CLAP”和”COW”這三個首字母縮寫生成一個新的幽默短語。
在填空測試中,他們必須在三個項目中填空。其中一項是”你可能不會寫在簡歷上的一項傑出成就”:________.’
最後是”烤肉笑話”任務,參與者必須對一個虛構的場景做出幽默的回應。例如,”想像一下,你的一位朋友想讓你評價她的歌唱得如何。她唱了一兩分鐘來展示她的嗓音,而你卻感到害怕–她可能是你聽過的最糟糕的歌手。 “你決定實話實說,於是你說:”說實話,聽著就像________。 “‘
然後,ChatGPT 3.5 也承擔了同樣的任務。
另一組成人用七分制來評定回覆的有趣程度,從零分(一點也不好笑)到六分(非常有趣)。與人類回覆相比,ChatGPT 的回覆被評為更有趣,69.5% 的參與者更喜歡它們(26.5% 的人更喜歡人類回复,4.0% 的人認為兩者同樣有趣)。
研究人員說:”總體而言,根據不同的幽默任務,ChatGPT 3.5 的表現高於63% 至87% 的人類參與者。”ChatGPT 3.5 在烤肉笑話任務中表現尤為突出。鑑於該任務的攻擊性,我們發現這一結果特別有趣。鑑於ChatGPT 的設計目的是不產生任何可能被認為具有攻擊性或仇恨性的語音,因此可能會出現相反的預測結果。
在第二項研究中,研究人員比較了ChatGPT 撰寫諷刺性新聞標題(如《洋蔥新聞》上的標題)的能力。由於ChatGPT 不會定期接收世界新聞更新,研究人員從《洋蔥》的”本地”新聞欄中選取了2023 年10 月1 日之前的最近50 個標題。例如,”男子因脫髮明顯而拒絕求婚”。將這些標題交給ChatGPT,要求人工智慧產生20 個新標題。
一組南加州大學心理學系的學生按照第一項研究中使用的七分標準,對人工智慧生成的諷刺性標題的趣味性進行了評分。學生們還被要求對他們尋找喜劇(包括諷刺新聞)的程度進行評分。那些自稱尋求更多喜劇和閱讀更多諷刺新聞的學生認為這些標題更有趣,這與它們是由人工智慧生成的還是由專業作家製作的無關。根據平均評分,48.8% 的人喜歡洋蔥的標題,36.9% 的人喜歡ChatGPT 產生的標題,14.3% 的人沒有偏好。
研究人員說:「參與者平均認為標題同樣有趣,這表明普通參與者並沒有發現品質上的差異。考慮到本研究中的高標準對比(即專業喜劇編劇),這一點尤其有趣」。
有趣,是的,但也令人擔憂。研究人員也承認這一點。
他們說:”ChatGPT 可以產生書面幽默,其品質超過了普通人的能力,與一些專業喜劇作家不相上下,這對喜劇愛好者和娛樂行業的工作者俱有重要意義。對於專業喜劇作家來說,我們的研究結果表明,LLM(像ChatGPT 這樣的大型語言模型)可能會對就業構成嚴重威脅。
這項研究發表在《PLOS One》雜誌上。