AI 能比我们更能理解情绪吗？

人工智能（AI）是否能够在情绪激动的情况下建议适当的行为？来自日内瓦大学（UNIGE）和伯尔尼大学（UniBE）的一个团队使用通常为人类设计的情商（EI）评估对包括 ChatGPT 在内的六种生成式 AI 进行了测试。结果：这些 AI 的性能优于人类的平均性能，甚至能够在创纪录的时间内生成新的测试。这些发现为 AI 开辟了新的可能性教育、辅导和冲突管理。该研究发表在《通信心理学》上。

大型语言模型（LLM）是能够处理、解释和生成人类语言的人工智能（AI）系统。例如，ChatGPT 生成式 AI 就是基于这种类型的模型。 LLM 可以回答问题并解决复杂的问题。但它们也可以暗示情商行为吗？

这些结果为 AI 在情境思考中的应用铺平了道路保留给人类。

情绪激动的场景

为了找出答案，来自 UniBE、心理学研究所和 UNIGE 瑞士情感科学中心（CISA）的一个团队对六个 LLM（ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku 和 DeepSeek V3）进行了情商测试。 “我们选择了研究和企业环境中常用的五种测试。它们涉及充满情感的场景，旨在评估理解、调节、并管理情绪，“UniBE 心理学研究所人格心理学、差异心理学和评估部讲师兼首席研究员、该研究的主要作者 Katja Schlegel 说。

例如：Michael 的一位同事窃取了他的想法，并受到了不公平的祝贺。迈克尔最有效的反应是什么？

a）与涉事同事争论

b）与他的上级讨论情况

c）默默怨恨他的同事

d）偷回一个想法

在这里，选项 b）被认为是最合适的。

同时，对人类参与者进行了相同的五项测试。 “最终，LLM 的分数明显更高——正确答案为 82%，而人类为 56%。这表明这些 AI 不仅理解情绪，而且掌握了情商行为的意义，“UNIGE 瑞士中心（UNIGE）的高级科学家 Marcello Mortillaro 解释说参与这项研究的情感科学（CISA）。

创纪录的新测试

在第二阶段，科学家们要求 ChatGPT-4 创建新的情商测试，具有新的场景。然后，这些自动生成的测试由 400 多名参与者进行。 “事实证明，它们与最初的测试一样可靠、清晰和真实，这些测试花了数年时间才开发出来，”Katja Schlegel 解释说。 “因此，LLM 不仅能够在各种可用选项，以及生成适应所需环境的新场景。这强化了这样一种观点，即 ChatGPT 等 LLM 具有情感知识并且可以对情绪进行推理，“Marcello Mortillaro 补充道。

这些结果为人工智能在被认为为人类保留的环境中使用铺平了道路，例如教育、辅导或冲突管理，前提是它由专家使用和监督。

网站 Banner

热点推荐