【技术实现步骤摘要】
一种采用双向长短期记忆网络的方面级情感分析方法
[0001]本专利技术涉及一种方面级情感分析方法,特别是一种采用双向长短期记忆网络的方面级情感分析方法,属于计算机
中的情感分析领域。
技术介绍
[0002]随着互联网的迅猛发展,社交媒体已深入到人们日常生活和工作中的方方面面。越来越多的人愿意在网络上表达自己的态度和情感,而非单纯地浏览与接受。人们希望通过相应的技术对这些评论文本进行自动化处理、分析,提取有价值的知识。在这样的应用需求背景下,出现了针对文本的情感分析技术,即通过计算机手段,帮助用户快速获取、整理和分析相关评论信息的过程。
[0003]方面级情感分析是情感分析领域中一种更为细化的模型。目前,常见的方面级情感分析方法主要分为以下三个方面:1.基于情感词典和语言规则的方法,其更接近于传统情感分析方法利用情感词典的解决思路,需要使用标注好的情感词典或语言规则来判别情感极性;2.基于机器学习的方法,此方法较为广泛地应用于方面级情感分析领域,其主要思想是将方面级情感分析任务建模成为分类问题;3.基于其他建模问题的方法,常用的建模方案包括序列标注和阅读理解等。然而上述方法大多是用单一的方法去解决方面级情感分析问题,无论是算法模型的可解释性、有效性还是应用性,都还有改进的空间。
技术实现思路
[0004]针对上述现有技术,本专利技术要解决的技术问题是提供一种解决了传统情感分析算法中的单一性和笼统性问题的采用双向长短期记忆网络的方面级情感分析方法,利用双向长短期记忆网络分析用户的评论信息,并 ...
【技术保护点】
【技术特征摘要】
1.一种采用双向长短期记忆网络的方面级情感分析方法,其特征在于,包括以下步骤:步骤1:数据预处理,具体为:进行数据清洗并将其词向量化,采用word2vec模型来将数据转换成向量形式,该矩阵维度为n
×
d,其中n是数据所包含的单词数,d为单个词向量的维度;步骤2:建立带有方面感知的双向长短期记忆网络,具体为:将步骤1得到的词向量作为双向长短期记忆网络的序列化输入,使模型分别从两个方向上提取文本的语义特征,同时把方面向量合并到双向长短期记忆网络单元中,设计三个方面门来控制分别被导入到输入门、遗忘门和输出门中的方面向量数量,最终获得每个时间步上的隐藏层状态和带有方面感知的句子整体表示;步骤3:建立基于多重注意力模型的Encoder-Decoder模型,具体为:在Encoder-Decoder模型中引入注意力机制,将双向长短期记忆网络输出的隐藏层状态与方面信息相结合,并进行注意力操作,最终提取特征表示;步骤4:情感极性分析,具体为:所用数据集经过步骤3的模型的训练建立不同方面与其相应情感词之间的联系,针对不同方面的文本经过全连接层和softmax函数后,输出待分类样本在每个情感分类上的概率,即可得到与不同方面相对应的情感极性。2.根据权利要求1所述的一种采用双向长短期记忆网络的方面级情感分析方法,其特征在于:步骤2所述的双向长短期记忆网络具体为:a
i
=σ(W
ai
[A,h
t-1
]+b
ai
)I
t
=σ(W
I
[x
t
,h
t-1
]+a
i
⊙
A+b
I
)a
f
=σ(W
af
[A,h
t-1
]+b
af
)f
t
=σ(W
f
[x
t
,h
t-1
]+a
f
⊙
A+b
f
))a
o
=σ(W
ao
[A,h
t-1
]+b
ao
)o
t
=σ(W
o
[x
t
,h
t-1
]+a
o
⊙
A+b
o
)h
t
=o
t
*tanh(C
t
)其中,x
t
为时间步长t对应的上下文词的输入嵌入向量,A为方面向量,h
t-1
为前一隐藏状态,h
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。