基于循环神经网络的情绪识别方法、装置及存储介质制造方法及图纸

技术编号:26377612 阅读:24 留言:0更新日期:2020-11-19 23:46
本发明专利技术涉及人工智能识别领域,尤其涉及一种基于循环神经网络的情绪识别方法、装置及存储介质。本发明专利技术的方法包括:获取对话内容中每个句子的文本特征;将每个所述句子的文本特征进行编码;针对每个所述句子,基于句子的文本特征更新说话人状态特征;基于句子的说话人以及上一句子的说话人确定说话人切换状态;获取句子的情绪识别结果;通过上述方式,在计算情绪标签概率时,通过说话人切换状态形成的切换嵌入强化了句子的上下文特征和说话人状态特征,提高了情绪识别准确率,能够更加准确地建模说话人之间和说话人自身的依赖关系;基于说话人自身的句子建模说话人状态特征,简化了计算过程,在并未影响情绪识别准确率的前提下提高了计算效率。

【技术实现步骤摘要】
基于循环神经网络的情绪识别方法、装置及存储介质
本专利技术涉及人工智能识别领域,尤其涉及一种基于循环神经网络的情绪识别方法、装置及存储介质。
技术介绍
在自然语言处理领域,对话情绪识别技术受到越来越多的关注。随着社交媒体平台和会话代理的普及,对话语料愈发增长,从对话中挖掘说话人整体的动态情绪变化变得可行,且通过将对话情绪识别被广泛应用于意见挖掘、医疗健康、呼叫中心等场景,不仅可以挖掘获得说话人的情绪观点,还有助于构建具有情感的智能机器人对话系统。早期的对话情绪识别研究主要基于呼叫中心的对话语料,利用基于词典的方法和音频特征识别情绪。近年来,对话情绪识别的研究主要基于卷积神经网络、循环神经网络、图卷积网络、Transformer等深度学习算法,利用纯文本语料或包含文本、音频、视频数据在内的多模态数据训练情绪识别模型。在这些对话情绪识别方法中,基于词典的方法只根据对话中的单句识别情绪。一些基于深度学习的方法,利用卷及神经网络或其他模型作为句子编码器,为当前句子生成句向量并直接输入全连接网络,最后利用softmax函数输出情绪标签的概率分布。但是,这些方法忽略了对话上下文信息,无法从全局角度建模句子和说话人之间的依赖关系,从而限制了情绪分类准确率的提升。为了解决忽略上下文信息的问题,现有技术中的DialogueRNN,KET,DialogueGCN等模型把上下文的句向量输入循环神经网络或Transformer,以建模说话人之间的相互影响。不仅如此,DialogueRNN和DialogueGCN分别利用循环神经网络和图卷积网络捕获说话人的自身依赖,以建模属于同一说话人的所有句子之间的相互影响。但是,现有技术中的方法还存在如下问题:一方面,忽略了对话中的说话人切换信息,不能察觉说话人是否发生变化,影响了模型对说话人之间的依赖关系和说话人自身依赖关系的理解,从而限制了情绪识别准确率的提升;另一方面,这些方法建模说话人自身依赖关系时所使用的模型比较复杂,不易实现且影响计算效率。因此,有必要提供一种新的基于循环神经网络的情绪识别方法、装置及存储介质。
技术实现思路
本专利技术的目的在于提供一种基于循环神经网络的情绪识别方法、装置及存储介质,以解决现有技术中情绪识别准确率低以及计算效率低的技术问题。本专利技术的技术方案如下:提供一种基于循环神经网络的情绪识别方法,包括:获取对话内容中每个句子的文本特征;将每个所述句子的文本特征进行编码,以获取每个句子的上下文特征;针对每个所述句子,基于所述句子的文本特征更新所述句子的说话人的说话人状态特征,其中,更新前的所述说话人状态特征是基于所述说话人的之前所有句子的文本特征而获取的;针对每个所述句子,基于所述句子的说话人以及上一句子的说话人确定所述句子的说话人切换状态;针对每个所述句子,基于所述句子的上下文特征、所述句子的说话人的说话人状态特征以及所述句子的说话人切换状态,获取所述句子的情绪识别结果。优选地,所述获取对话内容中每个句子的文本特征,包括:采用自然语言工具,将对话内容中的每个句子进行分词,得到每个句子的词序列;利用GloVe模型,将所述句子的词序列中的每个词分别转换为对应的词向量;将所述句子的词序列输入至卷积神经网络中,获取每个句子的句向量,将所述句向量作为所述文本特征。优选地,所述每个将所述句子的文本特征进行编码,以获取每个句子的上下文特征,包括:基于每个所述句子的文本特征,通过第一长短期记忆模型进行处理,得到每个所述句子的上下文特征。优选地,所述基于每个所述句子的文本特征,通过第一长短期记忆模型进行处理,得到每个所述句子的上下文特征,包括:获取所述对话内容中的第一个句子的文本特征,将所述第一个句子的文本特征输入至第一长短期记忆网络模型中,得到第一输出结果;获取与所述第一个句子相邻的第二个句子的文本特征,将所述第一输出结果和所述第二个句子的文本特征输入至所述第一长短期记忆网络模型中,得到第二输出结果;针对每个所述句子,将上一句子的输出结果以及所述句子的文本特征输入至所述第一长短期记忆网络模型中,得到所述句子的上下文特征;重复上述步骤,直至得到每个所述句子的上下文特征。优选地,所述说话人状态特征是通过如下步骤获取的:获取所述说话人在对话内容中的多个句子,将所述多个句子的文本特征输入至第二长短期记忆网络模型中,提取所述说话人的状态特征。优选地,所述获取所述说话人在对话内容中的多个句子,将所述多个句子的文本特征输入至第二长短期记忆网络模型中,提取所述说话人的状态特征,包括:获取所述说话人的第一句子的文本特征向量,将所述说话人的初始化特征以及所述第一句子的文本特征向量输入至第二长短期记忆网络模型中,得到第一输出特征;获取与所述第一句子相邻的第二句子的文本特征向量,将所述第一输出特征和所述第二句子的文本特征向量输入至所述第二长短期记忆网络模型中,得到第二输出特征;重复执行上述步骤,直至所述说话人的当前句子,将上一轮的输出特征以及所述当前句子的文本特征向量输入至所述第二长短期记忆网络模型中,得到所述说话人的状态特征。优选地,所述基于所述句子的说话人以及上一句子的说话人确定所述句子的说话人切换状态,包括:当所述句子的说话人与上一句子的说话人相同时,将第一数值作为当前句子的说话人切换状态;当所述句子的说话人与上一句子的说话人不同时,将第二数值作为所述句子的说话人切换状态;所述基于当前句子的说话人以及上一句子的说话人确定当前句子的说话人切换状态之后,还包括:将所述句子的文本特征、所述句子的上下文特征、所述句子的说话人状态特征以及所述句子的说话人切换特征上传至区块链中,以使得所述区块链对所述句子的文本特征、所述句子的上下文特征、所述句子的说话人状态特征以及所述句子的说话人切换特征进行加密存储。本专利技术的另一技术方案如下:提供一种基于循环神经网络的情绪识别装置,所述装置包括:句子编码器,用于获取对话内容中每个句子的文本特征;上下文编码器,用于将每个所述句子的文本特征进行编码,以获取每个句子的上下文特征;说话人编码器,用于针对每个所述句子,基于所述句子的文本特征更新所述句子的说话人的说话人状态特征,其中,更新前的所述说话人状态特征是基于所述说话人的之前所有句子的文本特征而获取的;说话人转换模块,用于针对每个所述句子,基于所述句子的说话人以及上一句子的说话人确定所述句子的说话人切换状态;以及情绪识别模块,用于针对每个所述句子,基于所述句子的上下文特征、所述句子的说话人的说话人状态特征以及所述句子的说话人切换状态,获取所述句子的情绪识别结果。本专利技术的另一技术方案如下:提供一种基于循环神经网络的情绪识别装置,所述装置包括处理器、以及与所述处理器耦接的存储器,所述存储器存储有用于实现上述的基于循环神经网络的情绪识别方法的程序指令;本文档来自技高网
...

【技术保护点】
1.一种基于循环神经网络的情绪识别方法,其特征在于,包括:/n获取对话内容中每个句子的文本特征;/n将每个所述句子的文本特征进行编码,以获取每个句子的上下文特征;/n针对每个所述句子,基于所述句子的文本特征更新所述句子的说话人的说话人状态特征,其中,更新前的所述说话人状态特征是基于所述说话人的之前所有句子的文本特征而获取的;/n针对每个所述句子,基于所述句子的说话人以及上一句子的说话人确定所述句子的说话人切换状态;/n针对每个所述句子,基于所述句子的上下文特征、所述句子的说话人的说话人状态特征以及所述句子的说话人切换状态,获取所述句子的情绪识别结果。/n

【技术特征摘要】
1.一种基于循环神经网络的情绪识别方法,其特征在于,包括:
获取对话内容中每个句子的文本特征;
将每个所述句子的文本特征进行编码,以获取每个句子的上下文特征;
针对每个所述句子,基于所述句子的文本特征更新所述句子的说话人的说话人状态特征,其中,更新前的所述说话人状态特征是基于所述说话人的之前所有句子的文本特征而获取的;
针对每个所述句子,基于所述句子的说话人以及上一句子的说话人确定所述句子的说话人切换状态;
针对每个所述句子,基于所述句子的上下文特征、所述句子的说话人的说话人状态特征以及所述句子的说话人切换状态,获取所述句子的情绪识别结果。


2.根据权利要求1所述的基于循环神经网络的情绪识别方法,其特征在于,所述获取对话内容中每个句子的文本特征,包括:
采用自然语言工具,将对话内容中的每个句子进行分词,得到每个句子的词序列;
利用GloVe模型,将所述句子的词序列中的每个词分别转换为对应的词向量;
将所述句子的词序列输入至卷积神经网络中,获取每个句子的句向量,将所述句向量作为所述文本特征。


3.根据权利要求1所述的基于循环神经网络的情绪识别方法,其特征在于,所述将每个所述句子的文本特征进行编码,以获取每个句子的上下文特征,包括:
基于每个所述句子的文本特征,通过第一长短期记忆模型进行处理,得到每个所述句子的上下文特征。


4.根据权利要求3所述的基于循环神经网络的情绪识别方法,其特征在于,所述基于每个所述句子的文本特征,通过第一长短期记忆模型进行处理,得到每个所述句子的上下文特征,包括:
获取所述对话内容中的第一个句子的文本特征,将所述第一个句子的文本特征输入至第一长短期记忆网络模型中,得到第一输出结果;
获取与所述第一个句子相邻的第二个句子的文本特征,将所述第一输出结果和所述第二个句子的文本特征输入至所述第一长短期记忆网络模型中,得到第二输出结果;
针对每个所述句子,将上一句子的输出结果以及所述句子的文本特征输入至所述第一长短期记忆网络模型中,得到所述句子的上下文特征;
重复上述步骤,直至得到每个所述句子的上下文特征。


5.根据权利要求1所述的基于循环神经网络的情绪识别方法,其特征在于,所述说话人状态特征是通过如下步骤获取的:
获取所述说话人在对话内容中的多个句子,将所述多个句子的文本特征输入至第二长短期记忆网络模型中,提取所述说话人的状态特征。


6.根据权利要求5所述的基于循环神经网络的情绪识别方法,其特征在于,所述获取所述说话人在对话内容中的多个句子,将所述多个句子的文本特征输入至第二长短期记忆网络模型中,提取所述说话...

【专利技术属性】
技术研发人员:王彦张加语马骏王少军
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1