基于语义信息的文本属性级情感分类方法及相关设备技术

技术编号:39293320 阅读:11 留言:0更新日期:2023-11-07 11:01
本公开提供了一种基于语义信息的文本属性级情感分类方法及相关设备,涉及自然语言处理技术领域。该方法包括:获取待分类文本中目标句子中每个单词的局部上下文表征信息、全局上下文表征信息以及属性词的上下文表征信息,以根据每个单词的局部上下文表征信息、全局上下文表征信息以及属性词的上下文表征信息确定目标句子中每个单词的局部语义信息和全局语义信息;根据目标句子中每个单词的局部语义信息和全局语义信息,确定目标句子的情感分类结果。本公开在确定目标句子的情感极性时,同时关注了属性词周围单词的局部语义信息对目标句子情感极性的影响,和全局语义信息对目标句子情感极性的影响,提升了对待分类文本进行情感分类时的准确度。情感分类时的准确度。情感分类时的准确度。

【技术实现步骤摘要】
基于语义信息的文本属性级情感分类方法及相关设备


[0001]本公开涉及自然语言处理
,尤其涉及一种基于语义信息的文本属性级情感分类方法及相关设备。

技术介绍

[0002]随着互联网技术的快速发展,在互联网平台和应用上,每天会产生数以万计的数据,这些海量的数据中蕴含着人们对某些商品、事件、人物等各种事物的观点和意见。如何让机器自动地从这些海量的数据中挖掘人们的观点和意见,理解文本的语义,识别文本中的情感倾向性(积极、消极、中性),是当前学术界和工业界的研究热点。
[0003]属性级情感分类是属性级情感分析的一项关键子任务,旨在识别句子中关于不同实体或者实体的不同属性的情感极性(积极、消极、中性)。近年来,虽然基于深度神经网络的属性级情感分类方法取得一定的进展,但是此类属性级情感分类方法在建模属性词依赖的文本语义方面仍存在一些不足,尚未有效地利用和建模句子全局语义信息;现有的属性级情感分类方法建模属性词与上下文词之间的局部语义信息的能力较弱;此外,现有方法在整合局部语义信息和句子全局语义信息上的能力存在不足。为此,需要一种能够有效利用句子的局部语义信息和全局语义信息的属性级情感分类方法。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开提供一种基于语义信息的文本属性级情感分类方法及相关设备,至少在一定程度上克服由于相关技术中无法有效利用句子的局部语义信息和全局语义信息进行属性级情感分类的问题。
[0006]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0007]根据本公开的一个方面,提供了一种基于语义信息的文本属性级情感分类方法,包括:
[0008]获取待分类文本,其中,所述待分类文本包括:至少一个句子,每个句子包括:多个单词,所述多个单词中包含:属性词;
[0009]确定目标句子中每个单词的局部上下文表征信息、全局上下文表征信息以及属性词的上下文表征信息,其中,所述目标句子为所述待分类文本中的任一个句子;
[0010]根据所述目标句子中每个单词的局部上下文表征信息、属性词的上下文表征信息以及每个单词与属性词的距离信息,确定所述目标句子的局部语义信息;
[0011]根据所述目标句子中每个单词的全局上下文表征信息确定所述目标句子中每个单词的全局语义信息;
[0012]根据所述目标句子中每个单词的局部语义信息和全局语义信息,确定所述目标句
子的属性级情感分类结果。
[0013]在一些实施例中,所述确定目标句子中每个单词的局部上下文表征信息、全局上下文表征信息以及属性词的上下文表征信息,包括:
[0014]将所述目标句子中每个单词输入到预先训练好的局部表征信息获取模型,输出所述目标句子中每个单词的局部上下文特征信息;
[0015]将所述目标句子中每个单词的局部上下文特征信息输入到预先训练好的全局表征信息获取模型,输出所述目标句子中每个单词的全局上下文表征信息。
[0016]在一些实施例中,所述确定目标句子中每个单词的局部上下文表征信息、全局上下文表征信息以及属性词的上下文表征信息,还包括:
[0017]将所述目标句子中的每个属性词输入到所述预先训练好的局部表征信息获取模型,输出所述目标句子中每个属性词的上下文表征信息;
[0018]将所述目标句子中每个属性词的上下文表征信息进行平均池化,得到所述目标句子中属性词的上下文表征信息。
[0019]在一些实施例中,所述根据所述目标句子中每个单词的局部上下文表征信息、属性词的上下文表征信息以及每个单词与属性词的距离信息,确定所述目标句子的局部语义信息,包括:
[0020]将所述目标句子中每个单词的局部上下文表征信息、属性词的上下文表征信息以及每个单词与属性词的距离信息输入到预先训练好的局部语义信息获取模型,输出所述目标句子中每个单词的局部语义信息。
[0021]在一些实施例中,在将所述目标句子中每个单词的局部上下文表征信息、属性词的上下文表征信息以及每个单词与属性词的距离信息输入到预先训练好的局部语义信息获取模型之前,所述方法还包括:
[0022]按照下述公式获取所述目标句子中每个单词与属性词的距离信息;
[0023][0024]其中,l
i
为所述目标句子中第i个单词与所述目标句子中属性词之间的相对距离信息,k为超参数,k≤n,n为所述目标句子中单词的数量。
[0025]在一些实施例中,所述根据所述目标句子中每个单词的全局上下文表征信息确定所述目标句子中每个单词的全局语义信息,包括:
[0026]将所述目标句子中每个单词的全局上下文表征信息输入到预先训练好的全局语义信息获取模型,输出所述目标句子中每个单词的全局语义信息。
[0027]在一些实施例中,所述根据所述目标句子中每个单词的局部语义信息和全局语义信息,确定所述目标句子的属性级情感分类结果,包括:
[0028]将所述目标句子中每个单词的局部语义信息和全局语义信息,输入到预先训练好的语义增强情感分类模型,输出所述目标句子的属性级情感分类结果。
[0029]根据本公开的另一个方面,还提供了一种基于语义信息的文本属性级情感分类装置,包括:
[0030]文本获取模块,被配置为获取待分类文本,其中,所述待分类文本包括:至少一个句子,每个句子包括:多个单词,所述多个单词中包含:属性词;
[0031]表征信息获取模块,被配置为确定目标句子中每个单词的局部上下文表征信息、全局上下文表征信息以及属性词的上下文表征信息,其中,所述目标句子为所述待分类文本中的任一个句子;
[0032]局部语义信息获取模块,被配置为根据所述目标句子中每个单词的局部上下文表征信息、属性词的上下文表征信息以及每个单词与属性词的距离信息,确定所述目标句子的局部语义信息;
[0033]全局语义信息获取模块,被配置为根据所述目标句子中每个单词的全局上下文表征信息确定所述目标句子中每个单词的全局语义信息;
[0034]情感分类模块,被配置为根据所述目标句子中每个单词的局部语义信息和全局语义信息,确定所述目标句子的属性级情感分类结果。
[0035]根据本公开的另一个方面,还提供了一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的基于语义信息的文本属性级情感分类方法。
[0036]根据本公开的另一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于语义信息的文本属性级情感分类方法。
[0037]根据本公开的另一个方面,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语义信息的文本属性级情感分类方法,其特征在于,包括:获取待分类文本,其中,所述待分类文本包括:至少一个句子,每个句子包括:多个单词,所述多个单词中包含:属性词;确定目标句子中每个单词的局部上下文表征信息、全局上下文表征信息以及属性词的上下文表征信息,其中,所述目标句子为所述待分类文本中的任一个句子;根据所述目标句子中每个单词的局部上下文表征信息、属性词的上下文表征信息以及每个单词与属性词的距离信息,确定所述目标句子的局部语义信息;根据所述目标句子中每个单词的全局上下文表征信息确定所述目标句子中每个单词的全局语义信息;根据所述目标句子中每个单词的局部语义信息和全局语义信息,确定所述目标句子的属性级情感分类结果。2.根据权利要求1所述的基于语义信息的文本属性级情感分类方法,其特征在于,所述确定目标句子中每个单词的局部上下文表征信息、全局上下文表征信息,包括:将所述目标句子中每个单词输入到预先训练好的局部表征信息获取模型,输出所述目标句子中每个单词的局部上下文特征信息;将所述目标句子中每个单词的局部上下文特征信息输入到预先训练好的全局表征信息获取模型,输出所述目标句子中每个单词的全局上下文表征信息。3.根据权利要求2所述的基于语义信息的文本属性级情感分类方法,其特征在于,所述确定目标句子中属性词的上下文表征信息,包括:将所述目标句子中的每个属性词输入到所述预先训练好的局部表征信息获取模型,输出所述目标句子中每个属性词的上下文表征信息;将所述目标句子中每个属性词的上下文表征信息进行平均池化,得到所述目标句子中属性词的上下文表征信息。4.根据权利要求1所述的基于语义信息的文本属性级情感分类方法,其特征在于,所述根据所述目标句子中每个单词的局部上下文表征信息、属性词的上下文表征信息以及每个单词与属性词的距离信息,确定所述目标句子的局部语义信息,包括:将所述目标句子中每个单词的局部上下文表征信息、属性词的上下文表征信息以及每个单词与属性词的距离信息输入到预先训练好的局部语义信息获取模型,输出所述目标句子中每个单词的局部语义信息。5.根据权利要求4所述的基于语义信息的文本属性级情感分类方法,其特征在于,在将所述目标句子中每个单词的局部上下文表征信息、属性词的上下文表征信息以及每个单词与属性词的距离信息输入到预先训练好的局部语义信息获取模型之前,所述方法还...

【专利技术属性】
技术研发人员:刘宁
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1