基于循环神经网络的情绪识别方法、装置及存储介质制造方法及图纸

技术编号：26377612 阅读：34 留言：0更新日期：2020-11-19 23:46

本发明专利技术涉及人工智能识别领域，尤其涉及一种基于循环神经网络的情绪识别方法、装置及存储介质。本发明专利技术的方法包括：获取对话内容中每个句子的文本特征；将每个所述句子的文本特征进行编码；针对每个所述句子，基于句子的文本特征更新说话人状态特征；基于句子的说话人以及上一句子的说话人确定说话人切换状态；获取句子的情绪识别结果；通过上述方式，在计算情绪标签概率时，通过说话人切换状态形成的切换嵌入强化了句子的上下文特征和说话人状态特征，提高了情绪识别准确率，能够更加准确地建模说话人之间和说话人自身的依赖关系；基于说话人自身的句子建模说话人状态特征，简化了计算过程，在并未影响情绪识别准确率的前提下提高了计算效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于循环神经网络的情绪识别方法、装置及存储介质
本专利技术涉及人工智能识别领域，尤其涉及一种基于循环神经网络的情绪识别方法、装置及存储介质。
技术介绍
在自然语言处理领域，对话情绪识别技术受到越来越多的关注。随着社交媒体平台和会话代理的普及，对话语料愈发增长，从对话中挖掘说话人整体的动态情绪变化变得可行，且通过将对话情绪识别被广泛应用于意见挖掘、医疗健康、呼叫中心等场景，不仅可以挖掘获得说话人的情绪观点，还有助于构建具有情感的智能机器人对话系统。早期的对话情绪识别研究主要基于呼叫中心的对话语料，利用基于词典的方法和音频特征识别情绪。近年来，对话情绪识别的研究主要基于卷积神经网络、循环神经网络、图卷积网络、Transformer等深度学习算法，利用纯文本语料或包含文本、音频、视频数据在内的多模态数据训练情绪识别模型。在这些对话情绪识别方法中，基于词典的方法只根据对话中的单句识别情绪。一些基于深度学习的方法，利用卷及神经网络或其他模型作为句子编码器，为当前句子生成句向量并直接输入全连接网络，最后利用softmax函数输出情绪标签的概率分布。但是，这些方法忽略了对话上下文信息，无法从全局角度建模句子和说话人之间的依赖关系，从而限制了情绪分类准确率的提升。为了解决忽略上下文信息的问题，现有技术中的DialogueRNN，KET，DialogueGCN等模型把上下文的句向量输入循环神经网络或Transformer，以建模说话人之间的相互影响。不仅如此，DialogueRNN和DialogueGCN分别利...

【技术保护点】
1.一种基于循环神经网络的情绪识别方法，其特征在于，包括：/n获取对话内容中每个句子的文本特征；/n将每个所述句子的文本特征进行编码，以获取每个句子的上下文特征；/n针对每个所述句子，基于所述句子的文本特征更新所述句子的说话人的说话人状态特征，其中，更新前的所述说话人状态特征是基于所述说话人的之前所有句子的文本特征而获取的；/n针对每个所述句子，基于所述句子的说话人以及上一句子的说话人确定所述句子的说话人切换状态；/n针对每个所述句子，基于所述句子的上下文特征、所述句子的说话人的说话人状态特征以及所述句子的说话人切换状态，获取所述句子的情绪识别结果。/n

【技术特征摘要】
1.一种基于循环神经网络的情绪识别方法，其特征在于，包括：
获取对话内容中每个句子的文本特征；
将每个所述句子的文本特征进行编码，以获取每个句子的上下文特征；
针对每个所述句子，基于所述句子的文本特征更新所述句子的说话人的说话人状态特征，其中，更新前的所述说话人状态特征是基于所述说话人的之前所有句子的文本特征而获取的；
针对每个所述句子，基于所述句子的说话人以及上一句子的说话人确定所述句子的说话人切换状态；
针对每个所述句子，基于所述句子的上下文特征、所述句子的说话人的说话人状态特征以及所述句子的说话人切换状态，获取所述句子的情绪识别结果。

2.根据权利要求1所述的基于循环神经网络的情绪识别方法，其特征在于，所述获取对话内容中每个句子的文本特征，包括：
采用自然语言工具，将对话内容中的每个句子进行分词，得到每个句子的词序列；
利用GloVe模型，将所述句子的词序列中的每个词分别转换为对应的词向量；
将所述句子的词序列输入至卷积神经网络中，获取每个句子的句向量，将所述句向量作为所述文本特征。

3.根据权利要求1所述的基于循环神经网络的情绪识别方法，其特征在于，所述将每个所述句子的文本特征进行编码，以获取每个句子的上下文特征，包括：
基于每个所述句子的文本特征，通过第一长短期记忆模型进行处理，得到每个所述句子的上下文特征。

4.根据权利要求3所述的基于循环神经网络的情绪识别方法，其特征在于，所述基于每个所述句子的文本特征，通过第一长短期记忆模型进行处理，得到每个所述句子的上下文特征，包括：
获取所述对话内容中的第一个句子的文本特征，将所述第一个句子的文本特征输入至第一长短期记忆网络模型中，得到第一输出结果；
获取与所述第一个句子相邻的第二个句子的文本特征，将所述第一输出结果和所述第二个句子的文本特征输入至所述第一长短期记忆网络模型中，得到第二输出结果；
针对每个所述句子，将上一句子的输出结果以及所述句子的文本特征输入至所述第一长短期记忆网络模型中，得到所述句子的上下文特征；
重复上述步骤，直至得到每个所述句子的上下文特征。

5.根据权利要求1所述的基于循环神经网络的情绪识别方法，其特征在于，所述说话人状态特征是通过如下步骤获取的：
获取所述说话人在对话内容中的多个句子，将所述多个句子的文本特征输入至第二长短期记忆网络模型中，提取所述说话人的状态特征。

6.根据权利要求5所述的基于循环神经网络的情绪识别方法，其特征在于，所述获取所述说话人在对话内容中的多个句子，将所述多个句子的文本特征输入至第二长短期记忆网络模型中，提取所述说话...

【专利技术属性】
技术研发人员：王彦，张加语，马骏，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人