![]()
生成式人工智能系统能够实现真正的创造力吗?由蒙特利尔大学心理学系的卡里姆·杰尔比教授领导的一项大型新研究,旨在解答这个问题。研究团队还包括蒙特利尔大学的人工智能先驱、教授约书亚·本吉奥。他们共同进行了迄今为止最广泛的人类创造力与大型语言模型创造能力的比较。
这些发表在《科学报告》上的发现,显示出一个重大转变。生成式人工智能系统现在已经达到了某些创造力指标上能够超越普通人类的水平。与此同时,研究明确指出,最具创造力的人仍能超越最强AI模型的性能。
人工智能达到了人类平均创造力水平
研究人员评估了多个主要大型语言模型,包括ChatGPT、Claude、Gemini等,并将结果与10万名人类参与者的数据进行了比较。这一结果标志着一个明确的转折点。包括GPT-4在内的一些人工智能系统在测量发散性语言创造力的任务中得分高于普通人类。
团队的研究表明,基于大型语言模型的一些人工智能系统现在可以在明确定义的任务中表现优于普通人类的创造力。这一结果可能令人惊讶——甚至令人不安。但他们的研究也凸显了一个同样重要的观点:即使是最好的人工智能系统,也未能达到最有创造力的人类水平。虽然一些AI模型现在表现优于普通人,但最高层次的创造力人类依然是独一无二。
研究人员更仔细地观察时发现,最具创造力的一半人类参与者的平均得分高于所有测试过的人工智能系统。在最有创造力的前10%人群中,这种差异更为明显。
人类与人工智能如何衡量创造力
为了公平地比较人与机器,研究团队采用了多种方法。主要工具是发散联想任务(DAT),这是一项心理测试,旨在测量发散性创造力,即从单一提示中产生多原创且多样想法的能力。
该DAT由研究合著者Jay Olson创建,要求参与者(无论是人类还是人工智能)生成十个词,这些词语的含义尽可能不同。一个高度创意的回应可能会包括诸如“银河系、叉形、自由、藻类、口琴、量子、怀旧、天鹅绒、飓风、光合作用”这样的词汇。
人类在该任务中的表现与其他用于创意生成、写作和创造性问题解决的成熟创造力测试结果非常相似。虽然该任务基于语言,但不仅仅是测试词汇量。相反,它触及了创造性思维中涉及的更广泛认知过程,跨越多个领域。DAT的另一个优势是速度快且易于获取,完成只需两到四分钟,且面向公众在线访问。
从简单的文字测试到创意写作
基于这些结果,研究人员考察了人工智能在这一基本词联想任务上的表现是否能转化为更复杂的创造性活动。为了测试这一点,他们直接比较了人工智能系统与人类参与者在创意写作任务中的表现。
这些包括写俳句(一种三行短诗体)、制作电影剧情摘要以及创作短篇故事。同样,这种模式显而易见。虽然人工智能有时表现优于普通人类参与者,但最有技能的人类创作者依然展现出明显优势。
人工智能的创造力可以被调整吗?
这些发现引发了一个重要的后续问题。人工智能的创造力可以被塑造或控制吗?根据研究,确实可以。一个关键因素是模型的温度,这是一种技术设置,影响了AI反应的可预测性和冒险性。
在较低温度设置下,AI系统往往能产生更安全、更可预测的输出。在较高温度下,反应变得更加多样且不受限制,鼓励冒险和更具原创性的联想。
研究人员还发现,提示的写作方式起着重要作用。例如,鼓励AI模型利用词源学考虑词源和结构的指令,会带来更多意想不到的想法和更高的创造力分数。这些结果共同表明,人工智能创造力高度依赖人类输入和指导,使人与机器的互动成为创造过程的核心部分。
人工智能会取代人类创造者吗?
该研究为人们对人工智能可能取代创意专业人士的担忧提供了平衡的视角。虽然一些人工智能系统现在可以在特定任务上与人类的创造力媲美,但研究也凸显了其明显局限性以及人类创造力持续的重要性。
尽管人工智能现在可以在某些测试中达到人类水平的创造力,但我们需要超越这种误导性的竞争感。生成式人工智能首先已成为服务于人类创造力的极其强大的工具:它不会取代创作者,而是深刻改变他们想象、探索和创作的方式——为那些选择使用它的人服务。
这些发现并没有预测创意职业的终结,而是鼓励人们以新的方式思考人工智能。这项技术可以作为创意助手,拓展探索和灵感的可能性。创造力的未来可能不再依赖于人类对抗机器,而更多依赖于新型协作形式,其中人工智能支持并增强人类的想象力。
客服热线:










