基于距离信息的文本属性级情感分类方法及相关设备技术

技术编号:38837428 阅读:9 留言:0更新日期:2023-09-17 09:53
本公开提供了一种基于距离信息的文本属性级情感分类方法及相关设备,涉及自然语言处理技术领域。该方法包括:获取待分类文本中目标句子中每个单词的融合特征信息和属性词的词嵌入信息,其中,目标句子中每个单词的融合特征信息是将其词嵌入信息、局部距离嵌入信息和全局距离嵌入信息整合得到的;并对目标句子中每个单词的融合特征信息和属性词的词嵌入信息进行处理得到目标句子的句子表征信息;最终根据目标句子的句子表征信息获取目标句子的情感分类。本公开在确定目标句子的情感分类时,充分考虑了句子中每个单词的局部距离信息和全局距离信息对其情感分类的影响,提升了对待分类文本进行情感分类的准确度。待分类文本进行情感分类的准确度。待分类文本进行情感分类的准确度。

【技术实现步骤摘要】
基于距离信息的文本属性级情感分类方法及相关设备


[0001]本公开涉及自然语言处理
,尤其涉及一种基于距离信息的文本属性级情感分类方法及相关设备。

技术介绍

[0002]属性级情感分类是属性级情感分析的一个重要子任务,旨在识别句子中属性词的情感极性,属性级情感分类是当前自然语言处理领域的研究热点之一,也是实现强人工智能和智能问答的关键技术。属性级情感分类不仅在学术界,在工业界也引起了广泛关注;例如,商品供应商可以利用属性级情感分类方法从大量的用户文本评论中识别人们对某一产品或者产品的属性的褒贬评价,从而对产品进行针对性的改进,减少人工调研和分析的成本。
[0003]现有的属性级情感分类方法大体分为三类,分别是基于规则的方法、基于传统统计机器学习的方法和基于深度学习的方法。其中,基于规则的方法利用启发式规则和情感字典识别属性词的情感极性,但是这类方法的泛化能力较差,不能应用在一些资源缺乏的语言和场景中;而基于传统统计机器学习的方法,能够利用统计机器模型挖掘属性词的情感极性,却严重依赖于人工设计的特征好坏,而且人工设计特征是一项非常耗时耗力的工作;基于深度学习的方法能够自动地学习适合于具体任务的相关特征,随着层数的加深能够生成更加抽象的特征,该方法在属性级情感分类中得到了广泛应用并获得了较好的表现。
[0004]虽然基于深度学习的模型在属性级情感分类中取得巨大成功,但此类方法仍然面临着忽略了句子中的多类距离信息,在建模句子中多类距离信息上的能力存在不足,为此,需要一种能够有效利用句子中的多类距离信息的属性级情感分类方法。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开提供一种基于距离信息的文本属性级情感分类方法及相关设备,至少在一定程度上克服现有的文本属性级情感分类方法中未充分利用句子中多类距离信息的问题。
[0007]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0008]根据本公开的一个方面,提供了一种基于距离信息的文本属性级情感分类方法,包括:
[0009]获取待分类文本,其中,待分类文本包括:至少一个句子,每个句子包括:多个单词,多个单词中包含:属性词;
[0010]确定目标句子中每个单词的融合表征信息和属性词的词嵌入信息,其中,每个单词的融合表征信息为将每个单词的词嵌入信息、局部距离嵌入信息和全局距离信息进行整
合得到的,其中,目标句子为待分类文本中任一个句子;
[0011]根据目标句子中每个单词的融合表征信息和属性词的词嵌入信息,确定目标句子的句子表征信息;
[0012]根据目标句子的句子表征信息,确定目标句子的情感分类。
[0013]在一些实施例中,在确定目标句子中每个单词的融合表征信息和属性词的词嵌入信息之前,方法还包括:
[0014]确定目标句子中每个单词的局部距离信息和全局距离信息;
[0015]将目标句子中每个单词、目标句子中每个单词的局部距离信息和全局距离信息输入到预先训练好的单词信息获取模型,输出目标句子中每个单词的词嵌入信息、局部距离表征信息和全局距离表征信息。
[0016]在一些实施例中,确定目标句子中每个单词的局部距离信息和全局距离信息,包括:
[0017]根据下述公式获取目标句子中每个单词的局部距离信息:
[0018][0019]其中,l
i
为目标句子中第i个单词与目标句子中属性词的相对距离信息,k为超参数,k≤n,n为目标句子中单词的数量,为目标句子中第i个单词的局部距离信息。
[0020]在一些实施例中,确定目标句子中每个单词的局部距离信息和全局距离信息,还包括:
[0021]根据目标句子中每个单词的顺序信息,获取目标句子中每个单词的全局距离信息。
[0022]在一些实施例中,确定目标句子中每个单词的融合表征信息和属性词的词嵌入信息,包括:
[0023]将目标句子中每个单词的词嵌入信息、局部距离表征信息、全局距离表征信息输入到预先训练好的信息融合模型,输出目标句子中每个单词的融合表征信息。
[0024]在一些实施例中,确定目标句子中每个单词的融合表征信息和属性词的词嵌入信息,还包括:
[0025]将目标句子中属性词的每个单词输入到预先训练好的单词信息获取模型,输出目标句子中属性词的每个单词的词嵌入信息;
[0026]对目标句子中属性词的每个单词的词嵌入信息进行平均池化处理,得到目标句子中属性词的词嵌入信息。
[0027]在一些实施例中,根据目标句子的句子表征信息,确定目标句子的情感分类,包括:
[0028]获取预先定义的多个情感分类;
[0029]定义每个情感分类下的至少一个情感词;
[0030]确定每个情感分类下各个情感词对应的嵌入信息;
[0031]根据目标句子的句子表征信息与每个情感分类下各个情感词对应的嵌入信息,确定目标句子与每个情感分类的相似度;
[0032]根据目标句子与每个情感分类的相似度,确定目标句子对应的情感分类。
[0033]根据本公开的另一个方面,还提供了一种基于距离信息的文本属性级情感分类装置,包括:
[0034]文本获取模块,被配置为获取待分类文本,其中,所述待分类文本包括:至少一个句子,每个句子包括:多个单词,所述多个单词中包含:属性词;
[0035]单词信息获取模块,被配置为确定目标句子中每个单词的融合表征信息和属性词的词嵌入信息,其中,每个单词的融合表征信息为将每个单词的词嵌入信息、局部距离嵌入信息和全局距离信息进行整合得到的,其中,所述目标句子为所述待分类文本中任一个句子;
[0036]句子信息获取模块,被配置为根据所述目标句子中每个单词的融合表征信息和属性词的词嵌入信息,确定所述目标句子的句子表征信息;
[0037]情感分类模块,被配置为根据所述目标句子的句子表征信息,确定所述目标句子的情感分类。
[0038]根据本公开的另一个方面,还提供了一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的基于距离信息的文本属性级情感分类方法。
[0039]根据本公开的另一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于距离信息的文本属性级情感分类方法。
[0040]根据本公开的另一个方面,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任意一项的基于距离信息的文本属性级情感分类方法。
[0041]本公开的实施例中提供的基于距离信息的文本属性级情感分类方法及相关设备,通过获取待分类文本中目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于距离信息的文本属性级情感分类方法,其特征在于,包括:获取待分类文本,其中,所述待分类文本包括:至少一个句子,每个句子包括:多个单词,所述多个单词中包含:属性词;确定目标句子中每个单词的融合表征信息和属性词的词嵌入信息,其中,每个单词的融合表征信息为将每个单词的词嵌入信息、局部距离嵌入信息和全局距离信息进行整合得到的,其中,所述目标句子为所述待分类文本中任一个句子;根据所述目标句子中每个单词的融合表征信息和属性词的词嵌入信息,确定所述目标句子的句子表征信息;根据所述目标句子的句子表征信息,确定所述目标句子的情感分类。2.根据权利要求1所述的基于距离信息的文本属性级情感分类方法,其特征在于,在确定目标句子中每个单词的融合表征信息和属性词的词嵌入信息之前,所述方法还包括:确定所述目标句子中每个单词的局部距离信息和全局距离信息;将所述目标句子中每个单词、所述目标句子中每个单词的局部距离信息和全局距离信息输入到预先训练好的单词信息获取模型,输出目标句子中每个单词的词嵌入信息、局部距离表征信息和全局距离表征信息。3.根据权利要求2所述的基于距离信息的文本属性级情感分类方法,其特征在于,所述确定所述目标句子中每个单词的局部距离信息和全局距离信息,包括:根据下述公式获取所述目标句子中每个单词的局部距离信息:其中,l
i
为所述目标句子中第i个单词与所述目标句子中属性词的相对距离信息,k为超参数,k≤n,n为所述目标句子中单词的数量,为所述目标句子中第i个单词的局部距离信息。4.根据权利要求2所述的基于距离信息的文本属性级情感分类方法,其特征在于,所述确定所述目标句子中每个单词的局部距离信息和全局距离信息,还包括:根据所述目标句子中每个单词的顺序信息,获取所述目标句子中每个单词的全局距离信息。5.根据权利要求1所述的基于距离信息的文本属性级情感分类方法,其特征在于,所述确定目标句子中每个单词的融合表征信息和属性词的词嵌入信息,包括:将所述目标句子中每个单词的词嵌入信息、局部距离表征信息、全局距离表征信息输入到预先训练好的信息融合模型,输出所述目标句子中每个单词的融合表征信息...

【专利技术属性】
技术研发人员:刘宁
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1