一种用于情绪评估的语言情感识别方法技术

技术编号：32971678 阅读：13 留言：0更新日期：2022-04-09 11:39

本发明专利技术公开了一种用于情绪评估的语言情感识别方法，属于语音信号智能处理技术领域。预先录制对话内容生成源音频，对源音频进行预处理后保存得到情感数据库；将情感数据库划分为训练集和测试集；基于情感数据库搭建语音情感识别模型；语音情感识别模型通过愉悦度和激情度来预测情感数据库；获取演讲者的演讲内容并对其预处理生成相应的音频文件；以训练集语音时长为分割参数，将音频文件分割成若干个目标语音文件；以目标语音文件为输入语音情感识别模型，基于语音情感识别模型对演讲者情绪的评估分析，同时测试集作用于训练集使语音情感识别模型得到优化。本发明专利技术精准的掌握演讲者语言的情绪变化，避免只对音频的识别而忽略情绪变化的问题。变化的问题。变化的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于情绪评估的语言情感识别方法

[0001]本专利技术属于语音信号智能处理
，具体涉及一种用于情绪评估的语言情感识别方法。

技术介绍

[0002]随着人工智能的快速发展，人机交互越来越人性化、智能化。语音情感识别从语音信号中识别情感状态，这对于推进人机交互非常重要。根据一个人的在交谈时的情绪，去理解对话内容和给出恰当的回应具有重要意义。尤其在演讲等一些特殊的环境中，演讲者的表达语言的情绪与生理和行为变化联系紧密，影响着听众的情绪和整体的氛围，而现有的语言情感识别方法，通常采用情绪分类的方式对演讲者的演讲过程中情绪进行识别，实现对演讲者的表现进行评估，这种评估方式无法精准的掌握演讲者的情绪变化，尤其对于整条音频的识别，容易出现忽略情绪的问题。

技术实现思路

[0003]专利技术目的：提供一种用于情绪评估的语言情感识别方法，解决了现有技术存在的上述问题。
[0004]技术方案：一种用于情绪评估的语言情感识别方法，包括以下步骤：
[0005]预先录制对话内容生成源音频，对所述源音频进行预处理并保存得到情感数据库；将所述情感数据库按照预定需求划分为训练集和测试集；
[0006]基于情感数据库搭建语音情感识别模型；所述语音情感识别模型通过愉悦度和激情度来预测情感数据库；
[0007]获取演讲者的演讲内容，并对演讲内容进行预处理生成相应的音频文件；
[0008]以情感数据库的训练集语音时长为分割参数，将所述音频文件分割成若干个语音片段，得到目标语音文件；
...

【技术保护点】

【技术特征摘要】
1.一种用于情绪评估的语言情感识别方法，其特征在于，包括以下步骤：预先录制对话内容生成源音频，对所述源音频进行预处理并保存得到情感数据库；将所述情感数据库按照预定需求划分为训练集和测试集；基于情感数据库搭建语音情感识别模型；所述语音情感识别模型通过愉悦度和激情度来预测情感数据库；获取演讲者的演讲内容，并对演讲内容进行预处理生成相应的音频文件；以情感数据库的训练集语音时长为分割参数，将所述音频文件分割成若干个语音片段，得到目标语音文件；将所述目标语音文件为输入语音情感识别模型，基于语音情感识别模型对演讲者情绪的评估分析，同时测试集作用于训练集使语音情感识别模型得到优化。2.根据权利要求1所述的一种用于情绪评估的语言情感识别方法，其特征在于，所述音频文件的生成至少包括以下步骤：对演讲内容依次进行预加重、分帧和加窗处理。3.根据权利要求2所述的一种用于情绪评估的语言情感识别方法，其特征在于，所述语音片段的频率为16
‑
20kHz，每段语音片段时长为10
‑
15s，当语音片段时间短于10
‑
15s，则放弃该语音片段。4.根据权利要求1所述的一种用于情绪评估的语言情感识别方法，其特征在于，所述语音情感识别模型的优化包括以下流程：以训练集为输入，并以处理后源音频的愉悦度和激情度为目标值，对语音情感识别模型参数进行优化，并使用测试集检验训练优化后的语音情感识别模型；测试集的语音情感识别模型中愉悦度和激情度分别预设指标阈值，当检验结果大于阈值，则重新训练模型；当检验结果小于等于阈值，则使用此模型预测目标语音文件的愉悦度和激情度。5.根据权利要求4所述的一种用于情绪评估的语言情感识别方法，其特征在于，对语音情感识别模型进行训练优化，采用均方差作为损失函数，使用随机梯度下降法进行参数优化，卷积核大小设置为7、3和1，激活函数使用的是ReLU，学习率设置为0.0002，batch
‑
size设置为16，迭代次数设置为100，其中均方差损失函数：式中，N表示样本数...

【专利技术属性】
技术研发人员：季利鹏，郝健，韦忠豪，顾小清，
申请(专利权)人：上海理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人