GPT-4 创造力全面碾压人类,最新创造力测试 GPT4 排名前 1%
最新研究发现,GPT-4 的创造力全方位持平或碾压人类。
最近,一项有关 GPT-4 的创造力思维测试火了。
来自蒙大拿大学和 UM Western 大学的研究团队发现,GPT-4 在 Torrance 创造性思维测试(TTCT)中的得分直接排在了前 1%。
不管是流畅性、灵活性,还是原创性,要不和人类势均力敌,要不直接碾压人类。
这项研究在南俄勒冈大学的创意会议上发表(Conference on Creativity)。
包括蒙大拿大学和西澳大学教授在内的一个研究小组发现:
OpenAI 的 GPT-4 在托伦斯创造性思维测试(TTCT)中的得分在前 1%,在流畅性、灵活性和原创性等创造性能力方面与人类相匹配或超过了人类。
这些发现在南俄勒冈大学的创意会议上发表。
GPT-4「头脑风暴」
主导这项研究的 Guzik 博士表示,这项研究对初创企业的建立和小企业的发展会有巨大影响,它将成为推动整体经济活动增长的重要力量。
Guzik 进一步阐释,GPT-4 所表现出的非凡创造力标志着 AI 驱动的头脑风暴和解决方案开发的全新阶段。
换句话说,以往初创企业和小企业基本都面临资源限制的典型问题,这限制了他们雇佣大型团队,对市场进行全面研究的能力。
而这一切,将会被 AI 的创造力扭转。
该研究团队的第一次会面,是在 2013 年 Boise 州立大学举办的创新和创造力研讨会上。
当时,Gilde 博士和 Guzik 博士参加了由 Byrge 举办的主题研讨会。三人发现,他们都对和创造力有关的东西感兴趣。
他们共同认为,AI 技术会对商业教育和商业发展有重大辅助作用。随着他们对 AI 的探索不断加深,更印证了他们的想法。
「尤其是 ChatGPT。」
对于他们与 GPT-4 的最新研究项目,研究人员对评估其与人类创造力相比的创造能力感兴趣。
GPT-4 通过 ChatGPT 使用 TTCT 的两个变体进行了八次测试,TTCT 是研究人员评估创造力的黄金标准。
使用 TTCT,研究人员要求 GPT-4 通过提问、猜测原因、考虑潜在的后果、产生产品改进的想法、设想现有产品的新的替代用途以及想象未来的情景来展示其创造能力。
TTCT 的第三方评估机构 Scholastic Testing Services 将人工智能的反应与人类的反应进行了比较。
在所有八项测试中,GPT-4 在流畅性方面的得分都在所有人类反应的前 1%,即对每项活动展现出了大量反应的能力。
在灵活性方面,即产生各种想法的能力,以及从一种方法转向另一种方法的能力,有三项测试的得分在前 1%,两项在前 2%,其余三项在前 7%。
而在 Guzik 博士眼中,评分里最重要的就是原创性了。
在所有八项测试中,GPT-4 在原创性方面的得分都在前 1%,即:产生不寻常或独特的反应的能力,也就是超出常规的能力。
Guzik 博士表示,「这是第一项能够展现 AI 可以产生与人类创造能力的现有门槛相匹配或超过的原创反应的研究。」
研究小组预测,在未来五年内,创业过程的每一个组成部分,以及一般的商业,都将受到人工智能的影响。
这包括识别独特的机会和重要的问题,产生新颖的解决方案想法,改进产品,产生新的营销策略,以及想象未来的场景和结果等等。
该团队的研究结果,包括进一步研究训练 GPT-4 以提高其在商业创新和创业等特定领域的创造能力,计划在今年夏天晚些时候发表。
创造力稀释
其实,这并不是第一个研究 GPT-4 创造力的研究项目。
国外小哥 Phil Bennett 曾表示,他担心 AI 的创造力会让人类陷入困境。
创造力是独属于人类的工具,是区分人类和其它生物的关键点。
而 AI 生成的东西严格来讲并不是「创造」,而是类似一种「反刍」,将喂进去的东西通过不同的方式结合在一起,然后进行输出。
而这也是 Bennett 所担心的。他担心类似 GPT-4、DALL-E 等工具会稀释人类的创造力。
换句话说,不会再有真正新的东西被创造出来,产生的东西都是把既有的东西拆分重组。
参考资料:
https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests
本文来自微信公众号:新智元 (ID:AI_era)
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售