蒙大拿大學(xué)的一項新研究表明,人工智能聊天機器人 ChatGPT 可以與人類中排名前 1% 的最頂尖的思考者相媲美。
研究人員將經(jīng)常使用的創(chuàng)造性思維測試 Torrance(TTCT,一種常用的創(chuàng)造力測試)應(yīng)用于 ChatGPT,并記錄了八個回答。他們還收集了蒙大拿大學(xué) 24 名學(xué)生的回答。這些分數(shù)與全美 2700 名參加 TTCT 測試的學(xué)生進行了比較。
所有回答都由學(xué)術(shù)測試服務(wù)機構(gòu)評分,該機構(gòu)并不知道有人工智能的答案提交。
根據(jù)研究人員的說法,AI 的回答和參加測試的最具創(chuàng)造力的真人回答一樣有創(chuàng)造力。實際上,ChatGPT 的表現(xiàn)超過了全國大多數(shù)學(xué)生。
研究的作者、蒙大拿大學(xué)商學(xué)院助理臨床教授 Erik Guzik 告訴 ScienceDaily.com,這一發(fā)現(xiàn)令人驚訝。Guzik 的研究領(lǐng)域包括創(chuàng)業(yè)和創(chuàng)造力的經(jīng)濟方面。
Guzik 說:「對我來說,創(chuàng)造力意味著以不同的方式做事。我喜歡創(chuàng)業(yè)的一種定義,即創(chuàng)業(yè)者是以不同的方式思考。因此,人工智能可能幫助我們將創(chuàng)造性思維應(yīng)用于商業(yè)和創(chuàng)新過程,這讓我著迷?!?/p>
TTCT 包含兩種不同的評估:口頭和圖形。兩種評估都衡量發(fā)散性思維,即用于產(chǎn)生創(chuàng)造性想法的思維過程。
在口頭評估中,測試者將獲得圖片/口頭提示,并被要求用書面形式回答。例如,他們可能會看到一個事件的圖片,并被要求假設(shè)結(jié)果。或者他們可能會看到一個產(chǎn)品,并被要求提出改進意見。他們的答案用于評估三種心理特征:
圖形評估要求測試者用繪圖回答。例如,他們可能會被要求完成一幅圖片。除了流暢性和獨創(chuàng)性,圖形測試還評估以下技能:
在這項研究中,ChatGPT 的回答在流暢性和獨創(chuàng)性方面處于頂級百分位數(shù)。當(dāng)涉及到靈活性時,回答得分進入了 97% 的百分位數(shù)。
「我們一直在探索 ChatGPT,我們注意到它正在做一些我們意想不到的有趣的事情。」Guzik 說?!敢恍┗卮鹗切路f和令人驚訝的。就在那時,我們決定對它進行測試,看看它的創(chuàng)造力到底有多強?!?/p>
Guzik 并不想過分夸大 ChatGPT 對經(jīng)濟的影響,但他確信它將成為創(chuàng)新的推動力。