【技术实现步骤摘要】
一种基于交互式长短期记忆网络的对话情感分析方法
[0001]本专利技术涉及对话情感分类
,特别是涉及一种文本对话情感分析方法。
技术介绍
[0002]随着互联网和社交网络的迅速发展,越来越多的用户依赖于微信、QQ、钉钉等即时通讯软件,成为人们日常交流沟通的主要渠道,互联网每天都会记录海量的聊天对话,这些对话通常携带着大量不断演化的谈话者的主观性态度和情感,对话情感分析正在成为一个崭新的研究课题,吸引了学术界与工业界的共同目光。它的重要性已经被社会各行各业认识到,例如可以帮助产品商改进产品,帮助政府了解民众的喜好等。因此,对话情感分析不仅具有重要的理论意义,而且蕴含巨大的社会价值。本专利技术主要研究社交平台中最普遍的聊天对话情感,即文本对话情感分析技术。
[0003]对话情感分析旨在检测对话过程中每位谈话者的情感态度,研究他们在整个交互过程中情感状态的演化趋势。目前的文本情感分析技术主要是围绕个人叙述式的评论或者博文,很少涉及多人交互的建模。相比于此,对话情感分析是一项更具挑战性的任务,原因在于:(1)在聊天活动中,每位谈话者都会受到其他谈话者的影响(反映到文本上,即是上下文影响),使得他或她的情感状态可能不会保持一致,而是出现前后变化;(2)谈话者之间的交互隐藏了许多信息,譬如他们的文化背景、职业环境与社会关系等;(3)在聊天活动中,谈话者的思维逻辑会产生跳跃,前后话语内容可能并不连贯。
[0004]目前,情感分析领域已经涌现出各种各样的数据语料集,用于支持情感分析模型的评价验证。这些语料集主要
【技术保护点】
【技术特征摘要】
1.一种基于交互式长短期记忆网络的对话情感分析方法,其特征在于,包含如下步骤:(1)构建对话情感语料集,每个对话包含轮数不等的文本语句,将两个谈话者匿名表示为A和B。(2)对对话情感语料集中的对话进行预处理,人工标注和一致性分析,最终该对话情感语料集包含N个主观性文本对话;(3)定义对话情感分析场景中的交互,归纳出交互蕴含的三大特性:语义理解、可信度与影响力,并针对不同的特性采用相应的计算方法,方法如下:第一步:对于语义理解,确定每句语句的语义向量u
i
=(u
i1
,u
i2
,...,u
in
),用于表示每句话的语义理解;第二步:对于每个语句的语义向量u
i
的可信度,计算u
i
与其他语句的语义向量u
j
的文本语义相似度sim(u
i
,u
j
),然后通过线性加权计算每个语句的语义向量u
i
的支持度sup(u
i
),执行归一化后得到每个语句的语义向量u
i
的可信度cred(u
i
);第三步:对于每个语句的语义向量u
i
的影响力,建立对话影响力模型,将对话中每句语句的情感标签作为输入,采用监督性学习算法,即频数法对其进行训练,计算出每句语句的影响力R,R是一个2
×
2的矩阵,包含了第p
‑
1轮与第p轮谈话者A与B的相互影响,影响力R的每个矩阵元素的取值分别表示三种情感状态,即积极、消极、中性,影响力R包含的信息有:谈话者A如何影响自身,B如何影响A,A如何影响B以及B自身的影响;(4)将计算出的每个语句的语义向量u
i
、可信度cred(u
i
)及影响力R,分别融入到LSTM结构中,使得其能够建模对话中的谈话者之间的交互,称之为交互式长短期记忆网络Interactive
‑
LSTM,方法如下:第一步:设t时刻单元的输入语义向量是,x
t
建立LSTM框架;第二步:将每个语句的语义向量u
i
作为Interactive
‑
LSTM的输入,即x
t
=u
i
;第三步:在每个LSTM单元之前增加一个“可信门”,用于判断前一个谈话者语句的可信度,筛选前LSTM单元输入到当前单元的可信信息,即:度,筛选前LSTM单元输入到当前单元的可信信息,即:度,筛选前LSTM单元输入到当前单元的可信信息,即:和分别表示第p轮谈话者A,B的新隐层输出,和是第p轮谈话者A,B的旧隐层输出,cre(B
p
‑1)是第p
‑
1轮谈话者B的语句的可信度,cre(A
p
)是第p轮谈话者A的语句的可信度;第四步:根据计算得到的影响力R,改进LSTM框架的输出门,组建新输出门,用于衡量前一个谈话者施加的影响;第五步:基于新输出门,计算Interactive
‑
LSTM的第p轮谈话者A和B的隐层输出和(5)利用训练情感语料集与反向传播算法逐步调整交互式长短期记忆网络中的参数,使得模型损失函数J(θ...
【专利技术属性】
技术研发人员:马军霞,张亚洲,陈锐,楚杨阳,
申请(专利权)人:郑州轻工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。