新研究声称AI比我们更好地'理解”情绪。特别是在情感上充满电的情况下
在我们认为人类总是会超越机器的领域的另一个挫折中,研究人员现在建议AI比我们更好地理解情绪。
研究人员发现,人工智能表现出了对情绪的较高掌握 - 在选择对降低情感激烈的情况下的适当反应时,比普通人的得分明显高。
In a recent study published on 21 May in the journal Communications Psychology , scientists from the University of Geneva (UNIGE) and the University of Bern (UniBE) administered widely-used emotional intelligence (EI) assessments ( STEM , STEU , GEMOK-Blends , GECo Regulation and GECo Management ) to well-known large language models (LLMs), such as ChatGPT-4, ChatGPT-o1, Gemini 1.5 Flash, Claude 3.5 Haiku,Copilot 365和DeepSeek V3。
该研究的重点是两个方面:将AI的性能与人类参与者的表现进行比较,并评估AI生成与EI评估目标一致的新测试项目的能力。
通过分析较早研究的验证人类反应,LLM在情绪智力测试中选择了81%的时间(基于人类专家判断)的“正确”响应,由人类占56%。
当负责生成新的测试问题时,人类评估人员发现这些努力与难度水平的原始测试相媲美,并确认它们不仅仅是现有版本的版本。 AI生成和原始测试之间的相关性被认为是“强”的,相关系数为0.46(其中1.0表示完美的相关性,0表示没有相关性)。
得出的总体结论是,与人类比人类更擅长“理解”情绪。
注册现场科学每日新闻通讯,现在是更深层的故事
在咨询了几位专家后,一个反复出现的主题是考虑使用的方法的重要性。该研究中采用的每个EI测试都由多项选择格式组成 - 典型的人际紧张局势较高的现实情况,正如专家所指出的那样。
财务和信息安全专家Taimur Ijlal说:“重要的是要记住,人们并不总是同意别人的感受,甚至专业人士也可以以不同的方式解释情感线索。” “因此,'优于'这样的测试中的一个人并不一定意味着AI具有更大的见解,而是更频繁地选择了统计上预期的答案。”
他们补充说,被评估的技能不是真正的情绪智力,而是其他事情。 “人工智能系统在识别模式方面表现出色,尤其是当情绪指标遵循可识别的结构(例如面部表情或口头信号)时,” Cliniscripts的创始人兼首席执行官Nauman Jaffar解释说,基于AI的文档平台为心理健康从业者设计。 “但是,将此等同于对人情绪的深刻'理解',高估了AI的实际取得的成就。”
一些专家强调,AI在结构化的定量测验设置中表现出色,而不是掌握真正情感理解所需的复杂微妙之处。一个关键的观察是,AI在涉及实时体验中消除的情感环境的测试中表现更好,就像人类如何遇到它们一样。
Hennessy Digital的创始人兼首席执行官Jason Hennessey(Hennessy Digital)花了多年的时间研究搜索和生成AI系统过程语言,他将研究列为眼睛测试中的阅读思维,这是一种评估情绪状态的常用方法,并且AI显示了潜力。但是,正如轩尼诗(Hennessey)指出的那样,当像照明或文化背景等变量发生变化时,“ AI准确性急剧下降”。
大多数专家通常认为AI比人类更好地“理解”情绪的断言有些夸张。
“这是否表明LLM有效地分类了典型的情感反应?”西北IT咨询公司的创始人怀亚特·梅哈姆(Wyatt Mayham)问。 “当然。但是,这类似于称某人为出色的治疗师,只是因为他们获得了以情感为主题的Buzzfeed测验。”
尽管如此,仍然存在一个重要的例外:尽管依靠模式识别而不是真实的情感理解,但在某些情况下,AI在识别和对情绪状态的反应方面表现出了较高的表现。
Aílton是巴西6000多名长途卡车司机使用的对话AI,是使用语音,文本和图像的多模式WhatsApp助手。它的创作者,HAL-AI的首席执行官兼首席科学家Marcos Alves声称Aílton在80%的准确性中检测到压力,愤怒或悲伤(比其人类同行高的20个百分点高约20个百分点)都在实时的情感互动中。
在一个例子中,艾尔顿迅速而适当地回应了一名同事致命事故后发出令人痛苦的15秒语音信息的驾驶员,表示谨慎,慰问,提供心理健康资源,并自动通知车队经理。
以上是新研究声称AI比我们更好地'理解”情绪。特别是在情感上充满电的情况下的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undress AI Tool
免费脱衣服图片

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Stock Market GPT
人工智能驱动投资研究,做出更明智的决策

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Openai推出了ChatGptparents的父母控制措施现在可以与青少年的帐户联系起来,限制功能并获得警报,如果将情绪困扰检测到危险的对话将通过经过专门调整的模型来处理,以支持使用的特殊调谐模型

Notebooklm由Google Now具有新的音频概述格式:简短,批评和辩解的添加物带来活泼的互动和结构化讨论来上传内容,增强功能使工具更接近互动,播客风格的AI

微软发出了警告,警告网络潜伏期,影响了红海中的海底电缆的中断,影响了Azure服务,迫使公司通过替代路线重定向流量。

如果您在五年前告诉一个充满风险的保险高管的房间,即将近一半的英国消费者欢迎AI的健康建议,那么您会受到严重的怀疑,即使不是完全笑声。我们的最新报告S

GPT-5的最新版本席卷了世界。 Openai的最新旗舰模式收到了不同的评论,而有些人赞扬其能力,而另一些则强调了其缺点。这让我感到奇怪:是GPT-

在2025年,多款可直接从终端访问的AI编程助手相继发布。Codex CLI、Gemini CLI 和 Claude Code 是其中一些热门工具,它们将大型语言模型嵌入到命令行工作流中。这些编程工具能够通过自然语言指令生成和修复代码,功能十分强大。我们对这三款工具在不同任务中的表现进行了详细评测,以确定哪一款更具实用性。每款助手都基于先进的AI模型,例如 o4-mini、Gemini 2.5 Pro 或 Claude Sonnet 4,旨在提升开发效率。我们将三者置于相同的环境中,使用具体指标

GCX托管服务是网络解决方案的领先提供商,已公布任命卢卡·西蒙内利(Luca Simonelli)为渠道和全球联盟的新高级副总裁。这项战略雇用是托管服务提供商 - 服务客户
