情感识别方法、装置、设备和存储介质制造方法及图纸

技术编号：37381391 阅读：24 留言：0更新日期：2023-04-27 07:22

本申请公开了一种情感识别方法、装置、设备和存储介质，属于计算机技术领域。包括：获取目标对象的语音数据；对语音数据进行处理，得到语音数据对应的语谱图和文本；对语音数据进行特征提取，得到语音数据的语音特征；对语谱图进行特征提取，得到语谱图的图像特征；对文本进行特征提取得到文本的文本特征；基于语音特征、图像特征以及文本特征，确定目标对象的情感。本申请通过对目标对象的语音数据进行处理得到图像、语音、文本三种模态的特征，之后综合这三种模态的特征对目标对象的情感进行识别，可以提高对目标对象的情感识别的准确率。可以提高对目标对象的情感识别的准确率。可以提高对目标对象的情感识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
情感识别方法、装置、设备和存储介质

[0001]本申请涉及计算机
，特别涉及一种情感识别方法、装置、设备和存储介质。

技术介绍

[0002]如今，人工智能技术飞速发展，人工智能产品也层出不穷。在一些情况下，人工智能产品可以替代人工做一些操作，比如：与人类进行交互(例如：对话)等。为了提升用户对人工智能产品的体验，可以增加一些情感(喜、怒、哀、乐等)识别等功能，以使人工智能产品能够根据人类的情感做出相应的回应。
[0003]相关技术中，获取用户的语音数据，将用户的语音数据进行文字转换，得到对应的文本数据，之后可以对文本数据进行分析来实现对用户的情感的识别。
[0004]然而，由于一些复杂或特殊的场景下情感识别的难度较大，这种情况下上述情感识别方式难以准确识别用户的情感，所以抗干扰性和鲁棒性较差，如此会降低对用户情感识别的准确率。

技术实现思路

[0005]本申请提供了一种情感识别方法、装置、设备和存储介质，可以在仅获取用户的语音数据的情况下提高情感识别的准确率，从而提升用户体验。所述技术方案如下：
[0006]第一方面，提供了一种情感识别方法，所述方法包括：
[0007]获取目标对象的语音数据；
[0008]对所述语音数据进行处理，得到所述语音数据对应的语谱图和文本；
[0009]对所述语音数据进行特征提取，得到所述语音数据的语音特征；对所述语谱图进行特征提取，得到所述语谱图的图像特征；对所述文本进行特征提取得到所述文本的文本特征；
[001...

【技术保护点】

【技术特征摘要】
1.一种情感识别方法，其特征在于，所述方法包括：获取目标对象的语音数据；对所述语音数据进行处理，得到所述语音数据对应的语谱图和文本；对所述语音数据进行特征提取，得到所述语音数据的语音特征；对所述语谱图进行特征提取，得到所述语谱图的图像特征；对所述文本进行特征提取得到所述文本的文本特征；基于所述语音特征、所述图像特征以及所述文本特征，确定所述目标对象的情感。2.如权利要求1所述的方法，其特征在于，所述对所述语音数据进行处理，得到所述语音数据对应的语谱图和文本，包括：将所述语音数据分为多个语音片段；对所述多个语音片段进行时频变换，得到所述语音数据对应的语谱图；对所述多个语音片段进行文本识别，得到所述语音数据对应的文本。3.如权利要求2所述的方法，其特征在于，所述对所述多个语音片段进行时频变换，得到所述语音数据对应的语谱图，包括：对于所述多个语音片段中任意的一个语音片段，对所述语音片段进行傅里叶变换或小波变换，得到目标频谱；基于所述目标频谱，生成所述语音片段对应的语谱图；将所述多个语音片段的语谱图进行拼接，得到所述语音数据对应的语谱图。4.如权利要求1所述的方法，其特征在于，所述对所述语音数据进行特征提取，得到所述语音数据的语音特征，包括：将所述语音数据分为多个语音片段；对于所述多个语音片段中任意的一个语音片段，对所述语音片段的频谱进行滤波，得到滤波信息；基于所述滤波信息，确定所述语音片段的语音片段特征；将所述多个语音片段的语音片段特征进行拼接，得到所述语音数据的语音特征。5.如权利要求1至4任一所述的方法，其特征在于，所述基于所述语音特征、所述图像特征以及所述文本特征，确定所述目标对象的情感，包括：对所述语音特征、所述图像特征...

【专利技术属性】
技术研发人员：张云斌，
申请(专利权)人：长城汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人