方面级情感分析方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35642164 阅读:12 留言:0更新日期:2022-11-19 16:34
本发明专利技术涉及一种方面级情感分析方法,包括:获取待分析的目标句子,并进行嵌入得到目标嵌入向量;构建模板句子,对模板句子的模板词、方面词和掩码词进行嵌入操作得到模板词嵌入向量、方面词嵌入向量和掩码嵌入向量;将模板词嵌入向量输入Prompt编码器得到模板词张量,将模板词张量、方面词嵌入向量和掩码嵌入向量拼接得到连续模板向量;将目标嵌入向量和连续模板向量共同输入预训练语言模型并进行池化操作,得到上下文特征;根据目标句子生成句法依存树,根据句法依存树提取句法依存特征;将上下文特征和句法依存特征进行特征融合,得到融合特征;根据融合特征进行预测,得到目标句子中方面词的情感极性。能够提高方面级情感分析的准确性。情感分析的准确性。情感分析的准确性。

【技术实现步骤摘要】
方面级情感分析方法、装置、电子设备及存储介质


[0001]本专利技术涉及方面级情感分析
,尤其是涉及一种方面级情感分析方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来,以深度学习为代表的新一代人工智能技术的兴起,推动了自然语言处理技术(NLP)的蓬勃发展。方面级情感分析,是情感分析的一个子任务,旨在识别方面词所蕴含的情感极性。例如:“I like the food here,but the service is terrible.”在这句话中,“food”和“service”是两个不同的方面,可以看出,“food”的情感极性是积极的,而“service”的情感极性是消极的。由于两个方面词蕴含的情感极性是相反的,因此不能只考虑句子层面上的情感极性。
[0003]然而,现有技术的方面级情感分析方法往往忽略了句子中上下文和方面词之间存在的句法依存信息,导致注意力机制学习不到合适的权重,现有的注意力机制可能会将句子中不相关的上下文词识别为情感词,且目前存在的大多数情感分析方法都没有结合句法依存关系进行建模,用这些模型进行情感分析效果并不出色。而且预训练和微调阶段之间的任务形式往往存在巨大差距,限制了预训练模型发挥其全部潜力,影响了情感分类的准确性。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的缺点与不足,提供一种方面级情感分析方法,能够提取丰富的特征,且能充分发挥预训练模型的特征提取潜力,从而提高方面级情感分析的准确性。
[0005]本专利技术是通过以下技术方案实现的:一种方面级情感分析方法,包括步骤:
[0006]获取待分析的目标句子,对所述目标句子进行嵌入操作得到目标嵌入向量;
[0007]根据所述目标句子构建模板句子,所述模板句子包括所述目标句子中的方面词、掩码词和间隔在所述方面词和掩码词之间的模板词,对所述模板词、方面词和掩码词进行嵌入操作得到模板词嵌入向量、方面词嵌入向量和掩码嵌入向量;
[0008]将所述模板词嵌入向量输入Prompt编码器得到模板词张量,将所述模板词张量、所述方面词嵌入向量和所述掩码嵌入向量拼接得到连续模板向量;
[0009]将所述目标嵌入向量和所述连续模板向量共同输入预训练语言模型并进行池化操作,得到上下文特征;
[0010]根据所述目标句子生成句法依存树,根据所述句法依存树提取句法依存特征;
[0011]将所述上下文特征和所述句法依存特征进行特征融合,得到融合特征;
[0012]根据所述融合特征进行预测,得到目标句子中方面词的情感极性。
[0013]相对于现有技术,本专利技术的一种方面级情感分析方法,所提出的连续模板携带提示信息,对预训练语言模型的特征提取起到引导性作用,注入与任务相关的知识,达到情感
知识增强的目的,同时能够使预训练语言模型的预训练阶段的训练任务与微调阶段任务相匹配,提高模型的鲁棒性,以及情感分类的准确性。其次本专利技术提取了目标句子的句法依赖关系,利用句法依存关系,分配合理的注意力权重,能够准确识别与方面词相关的情感词,提取更深层次的情感特征。
[0014]进一步地,所述模板词为包含多个unk_token的词组。
[0015]进一步地,所述Prompt编码器用于将所述模板词嵌入向量依序输入双向长短期记忆人工神经网络和使用ReLU激活函数的多层感知机,得到模板词张量。
[0016]进一步地,所述预训练语言模型的预训练阶段,包括步骤:
[0017]将训练数据集中一定比例的原始词替换为掩码词[MASK],一定比例的原始词替换为随机词;
[0018]预测所述掩码词[MASK]替换的所述原始词。
[0019]进一步地,根据所述句法依存树提取句法依存特征,包括步骤:将所述句法依存树输入图注意力网络并进行池化操作,获得句法依存特征。
[0020]进一步地,所述融合特征的表达式为:
[0021]h
f
=g
·
h
syn
+(1

g)
·
h
con
[0022]其中,g=σ(W
g
[h
syn
;h
con
]+b
g
),[h
syn
;h
con
]表示上下文特征h
syn
和句法依存特征h
con
的拼接,W
g
为可学习权重,b
g
为偏置。
[0023]基于同一专利技术构思,本专利技术还提供一种方面级情感分析装置,包括:
[0024]目标句子嵌入模块,用于获取待分析的目标句子,对所述目标句子进行嵌入操作得到目标嵌入向量;
[0025]模板句子构建模块,用于根据所述目标句子构建模板句子,所述模板句子包括所述目标句子中的方面词、掩码词和间隔在所述方面词和掩码词之间的模板词,对所述模板词、方面词和掩码词进行嵌入操作得到模板词嵌入向量、方面词嵌入向量和掩码嵌入向量;
[0026]连续模板构建模块,用于将所述模板词嵌入向量输入Prompt编码器得到模板词张量,将所述模板词张量、所述方面词嵌入向量和所述掩码嵌入向量拼接得到连续模板向量;
[0027]上下文特征提取模块,用于将所述目标嵌入向量和所述连续模板向量共同输入预训练语言模型并进行池化操作,得到上下文特征;
[0028]句法依存特征提取模块,用于根据所述目标句子生成句法依存树,根据所述句法依存树提取句法依存特征;
[0029]特征融合模块,用于将所述上下文特征和所述句法依存特征进行特征融合,得到融合特征;
[0030]预测模块,用于根据所述融合特征进行预测,得到目标句子中方面词的情感极性。
[0031]进一步地,所述句法依存特征提取模块还用于将所述句法依存树输入图注意力网络并进行池化操作,获得句法依存特征。
[0032]基于同一专利技术构思,本专利技术还提供一种电子设备,包括:
[0033]处理器;
[0034]存储器,用于存储由所述处理器执行的计算机程序;
[0035]其中,所述处理器执行所述计算机程序时实现上述方法的步骤。
[0036]基于同一专利技术构思,本专利技术还提供一种计算机可读存储介质,其上存储有计算机
程序,所述计算机程序被执行时实现上述方法的步骤。
[0037]为了更好地理解和实施,下面结合附图详细说明本专利技术。
附图说明
[0038]图1为一个实施例的方面级情感分析方法的流程示意图;
[0039]图2为一个实施例的方面级情感分析装置的结构示意图。
具体实施方式
[0040]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
[0041]应当明确,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方面级情感分析方法,其特征在于,包括步骤:获取待分析的目标句子,对所述目标句子进行嵌入操作得到目标嵌入向量;根据所述目标句子构建模板句子,所述模板句子包括所述目标句子中的方面词、掩码词和间隔在所述方面词和掩码词之间的模板词,对所述模板词、方面词和掩码词进行嵌入操作得到模板词嵌入向量、方面词嵌入向量和掩码嵌入向量;将所述模板词嵌入向量输入Prompt编码器得到模板词张量,将所述模板词张量、所述方面词嵌入向量和所述掩码嵌入向量拼接得到连续模板向量;将所述目标嵌入向量和所述连续模板向量共同输入预训练语言模型并进行池化操作,得到上下文特征;根据所述目标句子生成句法依存树,根据所述句法依存树提取句法依存特征;将所述上下文特征和所述句法依存特征进行特征融合,得到融合特征;根据所述融合特征进行预测,得到目标句子中方面词的情感极性。2.根据权利要求1所述的方法,其特征在于:所述模板词为包含多个unk_token的词组。3.根据权利要求1所述的方法,其特征在于:所述Prompt编码器用于将所述模板词嵌入向量依序输入双向长短期记忆人工神经网络和使用ReLU激活函数的多层感知机,得到模板词张量。4.根据权利要求1所述的方法,其特征在于,在所述预训练语言模型的预训练阶段,包括步骤:将训练数据集中一定比例的原始词替换为掩码词[MASK],一定比例的原始词替换为随机词;预测所述掩码词[MASK]所替换的所述原始词。5.根据权利要求1所述的方法,其特征在于,根据所述句法依存树提取句法依存特征,包括步骤:将所述句法依存树输入图注意力网络并进行池化操作,获得句法依存特征。6.根据权利要求1所述的方法,其特征在于,所述融合特征的表达式为:h
f
=g
·
h
syn
+(1

g)
·
h
con
其中,g=σ(W
g
[h
syn
;h

【专利技术属性】
技术研发人员:曾碧卿黄梓芃宋逸云杜睿擎
申请(专利权)人:华南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1