多模态心理数据集破解AI共情难题(AI赋能)

近日,人工智能领域顶级会刊AAAI-2025正式收录由广东数业智能联合高校科研团队研发的MMPsy多模态心理数…

近日,人工智能领域顶级会刊AAAI-2025正式收录由广东数业智能联合高校科研团队研发的MMPsy多模态心理数据集,标志着我国在AI心理健康领域的基础科研突破获得国际学界权威认可。该数据集作为全球规模最大的心理领域专用多模态数据集,首次实现了文本与声音情绪特征的深度融合标注,有效破解了AI心理模型“难共情、缺精度”的核心技术瓶颈。

 让AI“读懂”情绪的非语言密码

AI心理模型的情绪识别精度长期受限于单一文本数据的局限——仅通过文字内容,模型难以捕捉“语调低沉”“语速急促”“停顿异常”等隐性情绪信号,这也是此前全球同类研究的共性技术难点。此次入选AAAI-2025的MMPsy数据集,正是通过多模态数据融合技术打破了这一僵局。

据研发团队核心成员、广东工业大学人工智能教授秦景辉介绍,该数据集的创新点体现在三个维度:其一,数据规模创纪录,涵盖数十万用户授权的真实心理咨询对话;其二,模态信息更完整,除传统文本数据外,首次系统性纳入语速变化、语调波动、停顿时长等12项声音情绪特征;其三,标注体系更专业,团队基于DSM-5(精神疾病诊断与统计手册)标准完成情绪标签、认知偏差类型等结构化标注,标注一致性系数达0.89,超行业平均系数0.72。

实验室数据显示,基于MMPsy数据集训练的AI模型,对抑郁、焦虑等情绪的识别准确率提升至89%,其中对“隐性抑郁”(无明确负面文字但伴随声音情绪异常)的识别准确率较传统文本模型提升42%,这一成果正是其获得AAAI-2025收录的核心原因。“非语言信息是情绪表达的重要载体,MMPsy数据集的价值在于为AI搭建了‘解读’这些密码的基础框架。”秦景辉说。

从单一数据集到“数据—评测”全链条支撑

值得关注的是,研发团队同步构建了“基础数据集—专项数据集—评测体系”的完整科研支撑生态,形成AI心理模型研发的全链条解决方案。

与MMPsy配套的CMDS认知行为疗法专用数据集,聚焦国际主流的CBT治疗技术,收录数千个完整临床咨询案例,标注了“识别自动思维—挑战认知偏差—重建行为模式”的完整干预逻辑链,解决了AI心理干预“不专业、不系统”的技术痛点。

目前,该科研生态已支撑清华大学、华南师范大学等高校团队完成3项核心技术攻关,其中基于MMPsy开发的社区抑郁筛查模型已在广东、云南等地的12个社区试点应用,累计筛查超5万人次,阳性检出率较传统量表筛查提升37%,为心理疾病早发现、早干预提供了高效技术手段。

为全球AI心理健康研究提供中国方案

AAAI(美国人工智能促进协会)年会是全球人工智能领域最具影响力的学术会议之一,AAAI-2025会刊收录标准聚焦成果的原创性与应用价值。此次MMPsy数据集的入选,成为我国在AI心理健康基础研究领域首次获得该级别国际认可的成果。

数业智能创始人、研发团队负责人刘胜坤表示:“数据集的核心创新在于将心理学临床经验与AI技术深度融合,解决了‘让AI真正理解人类情绪’的底层问题。未来我们将联合国内外高校进一步开放数据集样本,推动全球AI心理健康领域的科研协作。”  业内专家指出,随着该科研生态的持续完善,AI有望在心理疾病筛查、远程干预等场景实现更广泛的临床应用。

关于作者: 大数据时代

为您推荐