一种多模态情感识别系统及方法技术方案

技术编号：41873052 阅读：25 留言：0更新日期：2024-07-02 00:24

本发明专利技术涉及数据处理技术领域，具体涉及一种多模态情感识别系统及方法；包括数据收集模块、数据处理模块、语音情感分析模块、图像情感分析模块、情感融合模块和识别输出模块；数据处理模块用于对语音数据和图像数据进行处理；语音情感分析模块用于使用深度学习模型识别情感状态；图像情感分析模块用于使用深度学习模型识别面部表情和情感状态；情感融合模块用于对语音情感分析模块和图像情感分析模块识别出的情感状态进行融合；通过将语音和图像情感分析的结果进行融合，提供了更准确的情绪识别，综合考虑语音和图像两方面的信息，有助于消除单一模态的局限性，实现提高情感识别的可靠性和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据处理，尤其涉及一种多模态情感识别系统及方法。

技术介绍

1、在现代客户服务领域，为提供更加个性化和情感丰富的客户体验，情感识别系统已经成为一个备受关注的领域。这一技术的核心目标是通过分析用户的语音和面部表情，准确识别和理解他们的情绪状态。这对于提高客户服务质量、客户满意度以及业务绩效至关重要。

2、随着人工智能技术的快速发展和广泛应用，情感识别技术也取得了显著的进步。情感识别技术主要分为基于语音、图像等多种方法。这些技术在社交媒体分析、用户体验改进、情感智能交互等领域有着广泛的应用。在语音情感识别方面，传统的方法主要依赖于语音信号的频率、幅度和声调等特征，采用机器学习算法进行分类，上述方法在特征选择和模型训练方面存在一定的局限性，导致准确度和稳定性相对较低；在图像情感识别方面，主要应用面部表情分析进行情感识别。传统的方法主要采用图像处理技术和特征提取算法，如haar特征等，对面部表情进行识别。然而，上述方法在特征选择和人工设计方面存在一定的局限性，导致准确度和鲁棒性相对较低。

3、综上所述，传统的情感识别方法在语音和图像情感分析中存在一定的局限性，导致识别的准确度和鲁棒性较低。

技术实现思路

1、本专利技术的目的在于提供一种多模态情感识别系统及方法，旨在解决现有技术中的情感识别方法在语音和图像情感分析中存在一定的局限性，导致识别的准确度和鲁棒性较低的技术问题。

2、为实现上述目的，本专利技术采用的一种多模态情感识别系统，包括数据

3、所述数据收集模块用于采集语音数据和图像数据；

4、所述数据处理模块用于对语音数据和图像数据进行处理，处理过程包括去噪、特征提取和图像增强；

5、所述语音情感分析模块用于根据处理后的语音数据，使用深度学习模型识别情感状态；

6、所述图像情感分析模块用于根据处理后的图像数据，使用深度学习模型识别面部表情和情感状态；

7、所述情感融合模块用于对所述语音情感分析模块和所述图像情感分析模块识别出的情感状态进行融合；

8、所述识别输出模块用于输出融合结果。

9、其中，所述数据收集模块包括语音数据收集单元和图像数据收集单元，所述语音数据收集单元和所述图像数据收集单元分别与所述数据处理模块连接；

10、所述语音数据收集单元用于采集语音数据；

11、所述图像数据收集单元用于采集图像数据。

12、其中，所述数据处理模块包括语音预处理单元和图像预处理单元，所述语音预处理单元与所述语音数据收集单元连接，所述图像预处理单元与所述图像数据收集单元连接；

13、所述语音预处理单元用于对语音数据进行去噪处理，再将声音放大，以增强语音信号，并使用声学特征提取技术将音频数据转换为特征向量；

14、所述图像预处理单元用于进行面部检测，确定面部位置，并标记关键特征点，进行图像增强，包括对比度调整和降噪，以提高图像质量。

15、其中，所述语音情感分析模块包括情感标签库、第一多模态预训练模型、情感分析单元和模型训练单元，所述第一多模态预训练模型分别与所述数据处理模块、所述情感标签库和所述情感分析单元连接，所述模型训练单元与所述情感分析单元连接；

16、所述情感标签库用于对情感进行分类，标记不同情感状态的语音样本；

17、所述第一多模态预训练模型用于融合多个数据源，同时处理语音和图像数据；

18、所述模型训练单元用于使用标记的语音样本和多模态预训练模型进行微调，适应情感识别任务，训练过程包括特征提取、情感分类和模型优化；

19、所述情感分析单元用于从处理后的语音数据中提取情感相关信息，并将其映射到所述情感标签库中的情感状态。

20、其中，所述图像情感分析模块包括第二多模态预训练模型和面部检测与特征标记单元，所述第二多模态预训练模型与所述数据处理模块连接，所述面部检测与特征标记单元与所述第二多模态预训练模型连接；

21、所述第二多模态预训练模型用于整合多模态信息，同时处理语音和图像数据；

22、所述面部检测与特征标记单元用于检测面部位置，并标记关键特征点。

23、其中，所述情感融合模块包括加权平均融合单元和决策树融合单元，所述加权平均融合单元分别与所述语音情感分析模块、所述图像情感分析模块和所述识别输出模块连接，所述决策树融合单元分别与所述语音情感分析模块、所述图像情感分析模块和所述识别输出模块连接；

24、所述加权平均融合单元用于将所述语音情感分析模块和所述图像情感分析模块识别出的情感状态进行加权平均；

25、所述决策树融合单元用于将所述语音情感分析模块和所述图像情感分析模块的输出制定情感识别决策。

26、本专利技术还提供一种多模态情感识别方法，包括如下步骤：

27、分别采集语音数据和图像数据，并对语音数据和图像数据进行处理；

28、根据语音数据，识别情感状态；

29、根据图像数据，识别面部表情和情感状态；

30、将识别出的情感状态进行融合；

31、输出融合结果。

32、本专利技术的一种多模态情感识别系统及方法，通过所述数据收集模块用于采集语音数据和图像数据；所述数据处理模块用于对语音数据和图像数据进行处理，处理过程包括去噪、特征提取和图像增强；所述语音情感分析模块用于根据处理后的语音数据，使用深度学习模型识别情感状态；所述图像情感分析模块用于根据处理后的图像数据，使用深度学习模型识别面部表情和情感状态；所述情感融合模块用于对所述语音情感分析模块和所述图像情感分析模块识别出的情感状态进行融合；所述识别输出模块用于输出融合结果，通过将语音和图像情感分析的结果进行融合，提供了更准确的情绪识别，综合考虑语音和图像两方面的信息，有助于消除单一模态的局限性，实现提高情感识别的可靠性和鲁棒性。

本文档来自技高网...

【技术保护点】

1.一种多模态情感识别系统，其特征在于，

2.如权利要求1所述的多模态情感识别系统，其特征在于，

3.如权利要求2所述的多模态情感识别系统，其特征在于，

4.如权利要求1所述的多模态情感识别系统，其特征在于，

5.如权利要求1所述的多模态情感识别系统，其特征在于，

6.如权利要求1所述的多模态情感识别系统，其特征在于，

7.一种多模态情感识别方法，应用于如权利要求1所述的多模态情感识别系统，其特征在于，包括如下步骤：

【技术特征摘要】

1.一种多模态情感识别系统，其特征在于，

2.如权利要求1所述的多模态情感识别系统，其特征在于，

3.如权利要求2所述的多模态情感识别系统，其特征在于，

4.如权利要求1所述的多模态情感识别系统，其特征在于，<...

【专利技术属性】
技术研发人员：赵胜，丁卓，贺东海，
申请(专利权)人：南京龙垣信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人