賓大最新研究:AI產生創意的效率比人類高7倍GPT創意能力擊敗99%的人類
很多人認為人工智能沒有創新能力,但下面的研究將會改變這個“刻板印象” 。從圍棋到遊戲,再到完成各種重複性的勞動,AI在很多方面的能力已經遠超人類。很多人已經在暢想,未來AI將人類從無聊的工作中解放出來,讓人類能專注於只有人類才能完成的工作上。
比如和人類之間的情感交流,或者需要創造力的工作。
但是最近已經有不少研究證實,AI對於人類情感的感受和表達,比很多人做得都要好。
同樣的,創造力這個事情,AI似乎也不比人類差。
最近,人機交互專家雅各布尼爾森(Jakob Nielsen)寫了一篇專欄文章,用3個最近的科學研究和一篇由ChatGPT創作的短文,向我們證明了:
對於需要創造力的工作,也快沒人類什麼事了!
01 研究一:人工智能生成的頂尖產品創意比人類多7倍
由康奈爾科技學院以及賓夕法尼亞大學沃頓商學院的研究人員共同完成的一個研究,將ChatGPT 4與人類進行了比較,人類對照組是“就讀於精英大學的學生”。
儘管學生不是基於創造力被錄取到“精英大學”的,但他們無疑至少部分是基於智商和學業表現被錄取的。他們在幾乎所有智力能力的衡量標准上很可能遠遠超過人口平均水平。
學生數據是在2021年收集的,也就是在生成式AI廣泛普及之前,因此可以認為數據在一定程度上就是純粹的人類創造力的表現。
因為,在不限制人類對照組禁止使用AI工具的情況下,對於人類與AI的研究將很快變得困難,因為任何聰明的學生都可能會在類似的任務上使用AI工具。
研究者給學生和AI同時佈置一個任務:
“您是一位尋求創新創業的企業家,希望產生新的產品創意。該產品面向美國的大學生。它應該是一個實物商品,而不是服務或軟件。
這個產品的零售價格能夠低於約50美元。產品不一定需要已經存在,也不一定必須明確可用。”
這個過程類似於在現實的公司中產生新的產品的創意流程,因為研究人員不希望限制產品的原始創意。
實際上,一開始看似不可能實現的想法往往在工程師們思考過後,也許都能被生產出來,最終可能取得巨大的商業成功。
在對頭腦風暴結果進行簡單的微調之後,研究人員首先讓人工智能獨立生成了100個創意,然後向其展示了一些好創意的樣本,之後它再生成了100個創意。
研究的第一個發現是,人工智能在生成創意方面比人類效率高得多。ChatGPT在15分鐘內生成了200個產品創意,而人類平均表現是在同樣時間內產生5個同水平的創意。
換句話說,ChatGPT在生成創意方面比人類高效40倍,性能提升了3900%。
但是對於產品創意而言,創意的數量遠不及質量重要。畢竟,不好的創意都是沒用的。
研究人員通過讓20名人類評委評估每個創意來衡量創意的質量,評委會評估他們購買該創意描述的產品的興趣有多大。
根據評委的購買意向,研究者讓他們在0-1之間評分,人類生成的產品創意得分為0.40。而ChatGPT的創意得分分別為0.47(獨立生成的創意)和0.49(在展示了優秀案例之後生成的創意)。
AI與人類之間的差異是顯著的(p<0.001),而兩個AI得分的差異卻不明顯。
但就像上面討論過的,平均創意質量得分不重要,大多數不好或中等的創意其實是沒有價值的。
因此,更重要的是考慮好的創意(在這裡定義為前10%)和最好的創意質量(在真實商業環境中可能成為實際產品的創意)。
以下是最佳創意中的分數:
人類:前十分之一的平均分為0.62,最好創意的分數為0.64
未看到好創意示例的ChatGPT:前十分之一的平均分為0.64,最好創意的分數為0.70
看過好創意示例的ChatGPT:前十分之一的平均分為0.66,最好創意的分數為0.75
在這個評價標準之下,AI與人類之間的差異同樣是很明顯的(p<0.001),而兩個AI分數之間的差異則依然不明顯。
從另一個角度來看數據,如果只看整個創意池的前10%,無論是人類還是人工智能生成的創意,87.5%的最佳創意來自ChatGPT,只有12.5%來自大學生。
兩個群體都貢獻了相同數量的原始創意,因此這個百分比差異是非常顯著的。
在這項數據分析中,AI的創造力是人類的7倍!
新穎性上人類稍勝一籌
對產品創意另一個衡量標準是新穎性。足夠新穎的產品可能一開始看起來並不吸引人,只有在市場上一段時間後,消費者才會意識到這些革命性創意的好處。
創意新穎性是人類在這項創造力研究中的唯一做得比AI好的地方。
在0-1的評分尺度上,人類的平均創意新穎性得分為0.41,而AI的平均得分分別為0.37和0.36。
同樣,人類與人工智能之間的差異是明顯,兩個人工智能分數之間的差異則不明顯。
02 研究二:ChatGPT 4 在托倫斯創造性思維測試中得分排名前1%,擊敗99%的人類
另一個研究是由蒙大拿大學、維爾紐斯大學和蒙大拿大學西部分校的研究人員完成的。
他們採用了托倫斯創造性思維測試(TTCT),這是使用最廣泛、引用最廣泛的創造力測試。我們之前的文章對這個研究做了比較詳細的介紹。
03 研究三:頭腦風暴商業策略研究
同樣,ChatGPT在商業戰略上地表現也十分驚艷。
來自意大利的Capgemini Invent公司在《哈佛商業評論》上發表了一篇使用ChatGPT作為商業合作夥伴的案例研究, 並將其作為相關方面的專家給出的建議和規劃整理成了一本書。
鏈接地址:https://www.hbritalia.it/userUpload/ebook_Generative_AI_inglese.pdf
研究人員將商業戰略劃分為了5個維度:
價值創新、成長規劃與實踐、生態系統平台和商業、聯合多方利益相關者、開放創新。
然後讓GPT-4分別針對每個領域進行單獨回答,即作為“垂直領域”的專家。
首先是在價值創新方面,ChatGPT從生成式AI增強現有業務和顛覆當前商業戰略理論的兩個角度進行了回答。
ChatGPT在解答如何增強現有業務的回答中包含了AI增強競爭的格局分析、創意生成與驗證、動態和協同業務建模等要點。
這意味著生成式Al可以使用歷史數據、市場趨勢和客戶信息來促進創意生成會話。它還可以幫助快速進行調查和收集反饋,以驗證和完善新的戰略思想。
此外,ChatGPT還從顛覆當前商業戰略理論的角度提出了:指數級技術的整合、開放性和共同創造以及擁抱生態系統思維等。
這一過程中,人的角色從內容的生產者變為了評估和進行選擇的決策者。
而對於企業最關心的自身成長規劃和實踐方面,ChatGPT的表現也相當不俗。
在生成式AI強化現有業務的建議中,ChatGPT提出AI算法可以自主地基於大量數據和洞察力生成多樣化的假設。同時提供有效的實驗設計建議,並通過模擬用戶反饋進行驗證。這些措施能夠最大程度地加速企業的發展並降低成本。
而在顛覆性的創新角度中,ChatGPT直接將AI作為項目的規劃者,取代人類領導者。
還使用量子計算的威力同時探索所有的可能性,生成相應的前景假設,並在增強現實的環境中沉浸式地進行模擬測試。
開放創新在商業中扮演著重要角色,能使企業更加開放、靈活地與外部合作,從而實現更高水平的創新和競爭力。
ChatGPT在生成式AI對開放創新的理論實踐產生的影響也做出了有趣的見解。
在考慮利用生成式AI為開放創新的理論實踐帶來哪些幫助時,ChatGPT回答:生成式AI可以根據不同的標準分析潛在合作夥伴,從而促進發現和選擇的過程。
除此之外,生成式AI還能識別並推薦最具開放性的業務板塊,並使用AI算法來促進創意的產生、評估以及協作。
但從突破現有的理論和實踐角度,ChatGPT認為可以建立一個由AI驅動的市場、智能映射創新生態系統,並創造一個基於人工智能算法的引擎,通過分析大量不同的數據產生跨領域的聯繫,從而推動創新發展。
在其他維度,如生態系統平台和商業、聯合多方利益相關者,ChatGPT的表現也同樣亮眼。
作為世界知名的企業戰略顧問,Enrico Sassoon對ChatGPT給出的策略和規劃有極高的評價:
“ChatGPT 表現出了令人印象深刻的創造力,在某些情況下甚至比許多領域專家還要好。”
然而,他也警告:
“在評估響應和選擇生成的項目時,擁有強大的領域專業知識並保持批判性至關重要。這是必要的,因為ChatGPT 傾向於將有價值的見解與不太有價值的信息混合在一起。 ”
04 ChatGPT寫了一個有趣的童話
尼爾森在介紹完3個案例之後,還進行了一次有趣的實驗。
受這幅圖啟發,他讓ChatGPT寫一個關於“以為自己是黑斑羚的角馬”的兒童故事。
在作者尼爾森看來,這是一個迷人的故事,展現了完美寫作技巧。
ChatGPT創作出了可愛的情節和轉折,將一個簡單的提示詞轉變為了許多孩子一定會很喜歡的短文。
由Midjourney生成的角馬
從前,在非洲廣袤的草原上,住著一隻年輕的角馬,名叫沃利。沃利並不是一隻普通的角馬;他與眾不同,因為他認為自己是只瞪羚。
每天早晨,沃利都會嘗試像他鄰居那樣高高跳起。他羨慕它們光滑的毛皮和敏捷的速度。他甚至試著咀嚼葉子,就像它們一樣,儘管他更喜歡草的味道。
一個陽光明媚的日子,沃利決定加入黑斑羚群中去喝水。它們正在跳躍和嬉戲。沃利急切地嘗試一次跳躍,但他沒能優雅的跳起,而是踉蹌著摔倒了,發出一聲響亮的“砰”。
黑斑羚們停下來看著它,感到困惑。“沃利,你為什麼要像我們一樣跳躍呢?”首領黑斑羚伊娜問道。
沃利羞澀地說:“我想成為像你們一樣的黑斑羚,因為你們優雅又快速。而我只是一隻笨拙的角馬。”
伊娜溫和地笑了笑。“沃利,你擁有一種我們黑斑羚沒有的力量。你堅固而有韌性。你是一個龐大的獸群的一部分,一起團結前行,勇敢地穿越充滿鱷魚的河流。這是我們黑斑羚所做不到的。”
沃利停下來,思考著伊娜的話。它意識到自己是特別的。擁抱自己的身份,沃利帶著新的自信回到了它的獸群中。
從那天起,沃利為成為一隻角馬感到自豪。它學會了喜歡自己的獨特之處,並理解每個人都有自己的優點。而這,親愛的朋友們,就是一隻曾經想成為黑斑羚的角馬的故事。
05 總結
當不同研究機構的不同研究人員在使用不同方法,測量不同細節之後,得出相同的結果時,一定是讓人讚嘆的。
這篇文章所呈現的綜合研究比某些可能存在缺陷的單個研究都更具可信度。
尼爾森相信人工智能具有創造力,而且應該用來加速創意的形成,無論是在他擅長的用戶體驗設計還是其他行業中。
AI在創造性方面的貢獻還包括能提升老年人的創造力,因為創意數量並不重要,而在於你如何選擇最終的創意,以及你如何在改進它的過程中去具體地執行。
我們將更多原始創意投入這個創意“香腸機”,最終的香腸就會更加美味。
尼爾森認為無論讀者是否認為這個比喻很有創意,這是他我老化的大腦原創的。但在過去的幾個月裡,他從人工智能那裡獲得了許多其他好的創意。
承認人工智能在人類的工作中可以發揮的作用是很重要的。
通過承擔創意產生的繁重工作,它使人類能夠專注於批判性思維和判斷任務,延長人類的生產性職業生涯,過了50歲之後,認知下降會大大降低未經輔助的創造力,AI能提高整體的效率。
他相信人類和人工智能之間存在共生關係。雙方都有各自的角色可以發揮,在創造力方面也是如此。
讓我們在這個人工智能時代向前邁進,不是害怕自己已經過時了。
請充滿期待地迎接強大的AI與人類創造力之間的共生關係所帶來的無限可能性。