AI 能比我们更能理解情绪吗?
人工智能 (AI) 是否能够在情绪激动的情况下建议适当的行为? 来自日内瓦大学 (UNIGE) 和伯尔尼大学 (UniBE) 的一个团队使用通常为人类设计的情商 (EI) 评估对包括 ChatGPT 在内的六种生成式 AI 进行了测试。 结果:这些 AI 的性能优于人类的平均性能,甚至能够在创纪录的时间内生成新的测试。 这些发现为 AI 开辟了新的可能性教育、辅导和冲突管理。 该研究发表在《通信心理学》上。 大型语言模型 (LLM) 是能够处理、解释和生成人类语言的人工智能 (AI) 系统。 例如,ChatGPT 生成式 AI 就是基于这种类型的模型。 LLM 可以回答问题并解决复杂的问题。 但它们也可以暗示情商行为吗? 这些结果为 AI 在情境思考中的应用铺平了道路保留给人类。 情绪激动的场景 为了找出答案,来自 UniBE、心理学研究所和 UNIGE 瑞士情感科学中心 (CISA) 的一个团队对六个 LLM(ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku 和 DeepSeek V3)进行了情商测试。 “我们选择了研究和企业环境中常用的五种测试。 它们涉及充满情感的场景,旨在评估理解、调节、并管理情绪,“UniBE 心理学研究所人格心理学、差异心理学和评估部讲师兼首席研究员、该研究的主要作者 Katja Schlegel 说。 例如:Michael 的一位同事窃取了他的想法,并受到了不公平的祝贺。 迈克尔最有效的反应是什么? a) 与涉事同事争论 b) 与他的上级讨论情况 c) 默默怨恨他的同事 d) 偷回一个想法 在这里,选项 b) 被认为是最合适的。 同时,对人类参与者进行了相同的五项测试。 “最终,LLM 的分数明显更高——正确答案为 82%,而人类为 56%。 这表明这些 AI 不仅理解情绪,而且掌握了情商行为的意义,“UNIGE 瑞士中心 (UNIGE) 的高级科学家 Marcello Mortillaro 解释说参与这项研究的情感科学 (CISA)。 创纪录的新测试 在第二阶段,科学家们要求 ChatGPT-4 创建新的情商测试,具有新的场景。 然后,这些自动生成的测试由 400 多名参与者进行。 “事实证明,它们与最初的测试一样可靠、清晰和真实,这些测试花了数年时间才开发出来,”Katja Schlegel 解释说。 “因此,LLM 不仅能够在各种可用选项,以及生成适应所需环境的新场景。 这强化了这样一种观点,即 ChatGPT 等 LLM 具有情感知识并且可以对情绪进行推理,“Marcello Mortillaro 补充道。 这些结果为人工智能在被认为为人类保留的环境中使用铺平了道路,例如教育、辅导或冲突管理,前提是它由专家使用和监督。