一种基于交互式长短期记忆网络的对话情感分析方法技术

技术编号:28738370 阅读:17 留言:0更新日期:2021-06-06 13:19
本发明专利技术涉及一种基于交互式长短期记忆网络的对话情感分析方法,其特征在于,包含:构建对话情感语料集;对对话情感语料集中的对话进行预处理;定义对话情感分析场景中的交互,归纳出交互蕴含的三大特性:语义理解、可信度与影响力,并针对不同的特性采用相应的计算方法;将计算出的每个语句的语义向量u

【技术实现步骤摘要】
一种基于交互式长短期记忆网络的对话情感分析方法


[0001]本专利技术涉及对话情感分类
,特别是涉及一种文本对话情感分析方法。

技术介绍

[0002]随着互联网和社交网络的迅速发展,越来越多的用户依赖于微信、QQ、钉钉等即时通讯软件,成为人们日常交流沟通的主要渠道,互联网每天都会记录海量的聊天对话,这些对话通常携带着大量不断演化的谈话者的主观性态度和情感,对话情感分析正在成为一个崭新的研究课题,吸引了学术界与工业界的共同目光。它的重要性已经被社会各行各业认识到,例如可以帮助产品商改进产品,帮助政府了解民众的喜好等。因此,对话情感分析不仅具有重要的理论意义,而且蕴含巨大的社会价值。本专利技术主要研究社交平台中最普遍的聊天对话情感,即文本对话情感分析技术。
[0003]对话情感分析旨在检测对话过程中每位谈话者的情感态度,研究他们在整个交互过程中情感状态的演化趋势。目前的文本情感分析技术主要是围绕个人叙述式的评论或者博文,很少涉及多人交互的建模。相比于此,对话情感分析是一项更具挑战性的任务,原因在于:(1)在聊天活动中,每位谈话者都会受到其他谈话者的影响(反映到文本上,即是上下文影响),使得他或她的情感状态可能不会保持一致,而是出现前后变化;(2)谈话者之间的交互隐藏了许多信息,譬如他们的文化背景、职业环境与社会关系等;(3)在聊天活动中,谈话者的思维逻辑会产生跳跃,前后话语内容可能并不连贯。
[0004]目前,情感分析领域已经涌现出各种各样的数据语料集,用于支持情感分析模型的评价验证。这些语料集主要是个人电影评论、产品评论、个人微博推文等,尚未体现谈话者之间的情感交互。学术界与工业界相对缺乏高质量且开源的对话情感语料集,成为对话情感分析模型发展前进的首要瓶颈。
[0005]此外,传统的情感分析方法经常孤立的对待对话中每一位谈话者,单独分析每一句语句的情感极性,忽略了谈话者之间的交互与影响。研究界与工业界对谈话者之间的交互研究比较缺乏,对交互特性的理解尚未明确与统一,不同研究者因学科视角和切入点不同,导致其对交互的属性与特征理解各异。如何捕捉并建模人际间的交互已经成为困扰该领域发展的关键难题。

技术实现思路

[0006]本专利技术所要解决的技术问题是克服现有技术的不足而提供一种交互式对话情感分析方法。本专利技术构建一个基于真实社交聊天平台的对话情感语料集,分别计算对话情感分析场景下交互的三种特性,将其融入到长短期记忆网络LSTM的内部结构中,自动捕捉并提取每句语句的交互特征,训练并优化网络参数,通过softmax分类器,获得更加准确的情感分类结果。本专利技术的目的是通过以下技术方案来实现的:
[0007]一种基于交互式长短期记忆网络的对话情感分析方法,其特征在于:包含如下步骤:
[0008](1)构建对话情感语料集,每个对话包含轮数不等的文本语句,将两个谈话者匿名表示为A和B。
[0009](2)对对话情感语料集中的对话进行预处理,人工标注和一致性分析,最终该对话情感语料集包含N个主观性文本对话;
[0010](3)定义对话情感分析场景中的交互,归纳出交互蕴含的三大特性:语义理解、可信度与影响力,并针对不同的特性采用相应的计算方法,方法如下:
[0011]第一步:对于语义理解,确定每句语句的语义向量u
i
=(u
i1
,u
i2
,...,u
in
),用于表示每句话的语义理解;
[0012]第二步:对于每个语句的语义向量u
i
的可信度,计算u
i
与其他语句的语义向量u
j
的文本语义相似度sim(u
i
,u
j
),然后通过线性加权计算每个语句的语义向量u
i
的支持度sup(u
i
),执行归一化后得到每个语句的语义向量u
i
的可信度cred(u
i
);
[0013]第三步:对于每个语句的语义向量u
i
的影响力,建立对话影响力模型,将对话中每句语句的情感标签作为输入,采用监督性学习算法,即频数法对其进行训练,计算出每句语句的影响力R,R是一个2
×
2的矩阵,包含了第p

1轮与第p轮谈话者A与B的相互影响,影响力R的每个矩阵元素的取值分别表示三种情感状态,即积极、消极、中性,影响力R包含的信息有:谈话者A如何影响自身,B如何影响A,A如何影响B以及B自身的影响;
[0014](4)将计算出的每个语句的语义向量u
i
、可信度cred(u
i
)及影响力R,分别融入到LSTM结构中,使得其能够建模对话中的谈话者之间的交互,称之为交互式长短期记忆网络Interactive

LSTM,方法如下:
[0015]第一步:设t时刻单元的输入语义向量是,x
t
建立LSTM框架;
[0016]第二步:将每个语句的语义向量u
i
作为Interactive

LSTM的输入,即x
t
=u
i

[0017]第三步:在每个LSTM单元之前增加一个“可信门”,用于判断前一个谈话者语句的可信度,筛选前LSTM单元输入到当前单元的可信信息,即:
[0018][0019][0020]和分别表示第p轮谈话者A,B的新隐层输出,和是第p轮谈话者A,B的旧隐层输出,cre(B
p
‑1)是第p

1轮谈话者B的语句的可信度,cre(A
p
)是第p轮谈话者A的语句的可信度;
[0021]第四步:根据计算得到的影响力R,改进LSTM框架的输出门,组建新输出门,用于衡量前一个谈话者施加的影响;
[0022]第五步:基于新输出门,计算Interactive

LSTM的第p轮谈话者A和B的隐层输出和
[0023](5)利用训练情感语料集与反向传播算法逐步调整交互式长短期记忆网络中的参数,使得模型损失函数J(θ)达到最小值,选取最佳网络模型,保存此时的参数;
[0024](6)将测试情感语料集的对话语料得到的和输入最佳网络模型,得到最终的分类结果。
[0025]进一步地,步骤(1)中,利用“爬虫”技术,构建对话情感语料集,每个对话包含轮数不等的文本语句,为突出交互性,只保留两个谈话者的对话。
[0026]进一步地,步骤(2)的方法如下:
[0027]第一步:矫正拼写错误,去除每个文本的不合法字符,然后对每个对话语句人工标注其
[0028]情感极性:积极+1、消极

1、中性0;
[0029]第二步:标注过程之后,应用一致性检验指标Kappa系数进行一致性分析计算,得到一
[0030]致性分析结果;...

【技术保护点】

【技术特征摘要】
1.一种基于交互式长短期记忆网络的对话情感分析方法,其特征在于,包含如下步骤:(1)构建对话情感语料集,每个对话包含轮数不等的文本语句,将两个谈话者匿名表示为A和B。(2)对对话情感语料集中的对话进行预处理,人工标注和一致性分析,最终该对话情感语料集包含N个主观性文本对话;(3)定义对话情感分析场景中的交互,归纳出交互蕴含的三大特性:语义理解、可信度与影响力,并针对不同的特性采用相应的计算方法,方法如下:第一步:对于语义理解,确定每句语句的语义向量u
i
=(u
i1
,u
i2
,...,u
in
),用于表示每句话的语义理解;第二步:对于每个语句的语义向量u
i
的可信度,计算u
i
与其他语句的语义向量u
j
的文本语义相似度sim(u
i
,u
j
),然后通过线性加权计算每个语句的语义向量u
i
的支持度sup(u
i
),执行归一化后得到每个语句的语义向量u
i
的可信度cred(u
i
);第三步:对于每个语句的语义向量u
i
的影响力,建立对话影响力模型,将对话中每句语句的情感标签作为输入,采用监督性学习算法,即频数法对其进行训练,计算出每句语句的影响力R,R是一个2
×
2的矩阵,包含了第p

1轮与第p轮谈话者A与B的相互影响,影响力R的每个矩阵元素的取值分别表示三种情感状态,即积极、消极、中性,影响力R包含的信息有:谈话者A如何影响自身,B如何影响A,A如何影响B以及B自身的影响;(4)将计算出的每个语句的语义向量u
i
、可信度cred(u
i
)及影响力R,分别融入到LSTM结构中,使得其能够建模对话中的谈话者之间的交互,称之为交互式长短期记忆网络Interactive

LSTM,方法如下:第一步:设t时刻单元的输入语义向量是,x
t
建立LSTM框架;第二步:将每个语句的语义向量u
i
作为Interactive

LSTM的输入,即x
t
=u
i
;第三步:在每个LSTM单元之前增加一个“可信门”,用于判断前一个谈话者语句的可信度,筛选前LSTM单元输入到当前单元的可信信息,即:度,筛选前LSTM单元输入到当前单元的可信信息,即:度,筛选前LSTM单元输入到当前单元的可信信息,即:和分别表示第p轮谈话者A,B的新隐层输出,和是第p轮谈话者A,B的旧隐层输出,cre(B
p
‑1)是第p

1轮谈话者B的语句的可信度,cre(A
p
)是第p轮谈话者A的语句的可信度;第四步:根据计算得到的影响力R,改进LSTM框架的输出门,组建新输出门,用于衡量前一个谈话者施加的影响;第五步:基于新输出门,计算Interactive

LSTM的第p轮谈话者A和B的隐层输出和(5)利用训练情感语料集与反向传播算法逐步调整交互式长短期记忆网络中的参数,使得模型损失函数J(θ...

【专利技术属性】
技术研发人员:马军霞张亚洲陈锐楚杨阳
申请(专利权)人:郑州轻工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1