實驗發現人工智慧可提高個人創造力但會降低集體創造力
一項新的研究探討了人工智慧能否成為創造性任務的自動幫手,結果喜憂參半:它似乎能幫助天生創造力較弱的人寫出更多原創短篇小說,但卻削弱了整個群體的創造力。隨著人工智慧工具對創意工作的衝擊,這種權衡可能會越來越普遍。
這項研究分別由倫敦大學學院的研究人員阿尼爾-多希(Anil Doshi)和埃克塞特大學的研究人員奧利弗-豪瑟(Oliver Hauser)完成,發表在《科學進展》(Science Advances)上。雖然這項研究由於側重於短篇小說而存在一定的局限性,但它似乎證實了許多人所表達的觀點:人工智慧可以有所幫助,但最終在創造性工作方面並沒有提供什麼真正的新東西。
豪瑟在一封電子郵件中表示:「我們的研究代表了對大型語言模型和生成式人工智慧將如何影響人類活動(包括創造力)這一重大問題的早期看法。雖然這項技術有巨大的潛力(毫無疑問,也有巨大的炒作)對媒體和更廣泛的創造力產生巨大影響,但重要的是,要對人工智慧進行實際的嚴格評估–而不僅僅是在假設它會產生積極結果的前提下廣泛實施。
實驗讓數百人寫出非常短的故事(八句話左右),題材不限,但適合廣大讀者。其中一組人只是寫作;第二組人有機會查閱GPT-4,以獲得幾個句子的單一故事構思(他們可以根據自己的喜好使用或多或少的構思);第三組人最多可以獲得五個這樣的故事開頭。
故事寫好後,由故事作者和對人工智慧生成轉折一無所知的第二組人對故事進行評估。這些人根據故事的新穎性、實用性(即發表的可能性)和情感愉悅度對故事進行評分。
在寫故事之前,參與者也完成了文字創作任務,作為創造力的替代指標。這是一個無法直接測量的概念,但在這種情況下,一個人的寫作創造力至少可以被近似地估算出來(在此不做評判!不是每個人都是天生的作家,也不是每個人都是訓練有素的作家)。
豪瑟寫道:『用任何測量方法來捕捉像創造力這樣豐富而複雜的東西似乎都充滿了複雜性。然而,圍繞人類創造力有一系列豐富的研究,人們也在熱烈討論如何最好地用一種測量方法來捕捉創造力的概念。
他們的方法在學術界得到了廣泛應用,並在其他研究中得到了充分證明。研究人員發現,創造力指標較低的人在故事評估中得分最低,可以說驗證了這種方法。當有機會使用產生的故事創意時,他們的收益也最大(值得注意的是,整個實驗中絕大多數人都使用了生成的創意)。
創造力得分較低的人寫出的故事在寫作品質、可欣賞性和新穎性方面的評分均低於其他人。如果給他們一個人工智慧生成的創意,他們在每個指標上的得分都會更高。如果讓他們選擇五個,他們的得分會更高。
對於那些在寫作的創意方面苦苦掙扎的人(至少在這種語境和定義下)來說,人工智慧助理似乎真的在提高他們的工作品質。這可能會引起許多人的共鳴,對他們來說,寫作並不是一件自然而然的事,而一個語言模型說”嘿,試試這個”,正是他們完成一個段落或開始一個新章節所需要的提示。
但是那些在創造力指標上得分很高的人呢?他們的寫作攀上了新的高峰嗎?很遺憾,並沒有。事實上,這些參與者幾乎沒有得到任何好處,甚至(雖然非常接近,但可以說並不明顯)得到了更差的評分。看來,那些有創意的人在沒有人工智慧幫助的情況下也能寫出最好的作品。
我們可以想像出造成這種情況的各種原因,但數字確實表明,在這種情況下,人工智慧對具有先天創造力的作家的影響是零,甚至是負面的。
但這並不是研究人員擔心的部分。
除了參與者對故事的主觀評估外,研究人員也進行了一些自己的分析。他們使用OpenAI 的嵌入式應用程式介面(embeddings API)來評估每個故事與其他同類故事(即純人工智慧、一個人工智慧選項或五個人工智慧選項)的相似程度。
他們發現,使用生成式人工智慧會使生成的故事更接近其類別的平均水平。換句話說,作為一個群體,它們的相似性更高,差異性更小。總的差異在9%到10%之間,所以並不是說這些故事都是彼此的複製。誰知道呢,但這種相似性可能是實踐經驗較少的作家完成了一個建議的故事,而創造力較強的作家則從頭開始構思一個故事。
儘管如此,這項結論仍值得在結論中加以警示,全文引用如下:
雖然這些結果顯示個人創造力有所提高,但也存在集體新穎性喪失的風險。在一般平衡狀態下,一個有趣的問題是,人工智慧所增強和啟發的故事是否能夠在其產出中產生足夠的變化。具體來說,如果出版業(和自助出版業)接受了更多由人工智慧啟發的生成故事,我們的研究結果表明,所產生的故事總體上將變得不再那麼獨特,而是更加相似。這種螺旋式下降的現象與一種新出現的社會困境相似:如果單一作家發現自己受人工智慧啟發創作的作品被評價為更具創造性,他們就有動力在未來更多地使用人工智慧,但這樣做可能會進一步降低故事的整體新穎性。總之,我們的研究結果表明,儘管生成式人工智慧對個人創造力有提升作用,但如果生成式人工智慧被更廣泛地應用於創造性任務,則可能需要警惕。
這與視覺藝術和網路內容中的擔憂不謀而合,即如果人工智慧導致更多的人工智慧,而它所訓練的只是更多的自身,那麼它最終可能會陷入自我循環的平淡無奇之中。隨著人工智慧生成技術開始悄悄進入各種媒體,正是這些研究對那些宣稱創造力無限或人工智慧生成電影和歌曲的新時代的說法起到了製衡作用。
豪瑟和多希承認,他們的工作才剛開始–這個領域是全新的,每項研究,包括他們自己的研究,都是有限的。
“我們期待未來的研究能夠走上一些道路。例如,’野生’生成式人工智慧的實施將與我們的受控環境截然不同,”豪瑟寫道。 “理想情況下,我們的研究既有助於指導技術,也有助於指導我們如何與技術互動,以確保創造性想法的持續多樣性,無論是在寫作、藝術還是音樂方面。”