情感分类方法技术

技术编号:39716377 阅读:9 留言:0更新日期:2023-12-17 23:24
本申请涉及一种情感分类方法

【技术实现步骤摘要】
情感分类方法、装置、设备、存储介质和程序产品


[0001]本申请涉及自然语言处理
,特别是涉及一种情感分类方法

装置

设备

存储介质和程序产品


技术介绍

[0002]随着人工智能技术的不断发展,情感分类作为一种重要的文本分类任务,在多个领域中得到了广泛的应用

情感分类的目标是根据文本中表达的情感信息,将文本分为积极

消极或中性等不同的情感类别

[0003]相关技术中,通常是将所有历史数据作为一个整体输入到模型中进行训练,但人们的情感往往会随着时间的推移发生变化,人们的情绪和观点可能会受到外部事件

趋势和上下文的影响

如果直接将所有历史数据视为一个整体进行分析,可能无法捕捉到这种时序上的演变,从而导致对文本数据的情感分类不准确


技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高文本数据情感分类结果准确性的情感分类方法

装置

设备

存储介质和程序产品

[0005]第一方面,本申请提供了一种情感分类方法,该方法包括:
[0006]获取针对目标对象的文本特征;
[0007]将文本特征分别输入到预训练的多个语言表征模型进行特征提取处理,得到多个文本向量;其中,多个语言表征模型是根据不同历史时段的文本数据训练得到的,且多个语言表征模型存在时序关系;
[0008]根据多个文本向量确定情感分类结果;情感分类结果用于表征用户针对目标对象的情感倾向

[0009]在其中一个实施例中,根据多个文本向量确定情感分类结果包括:
[0010]将多个文本向量输入双向门控循环单元中进行处理,得到目标向量;
[0011]根据目标向量进行分类处理,确定情感分类结果

[0012]在其中一个实施例中,双向门控循环单元包括正向门控循环单元和反向门控循环单元,将多个文本向量输入双向门控循环单元中进行处理,得到目标向量,包括:
[0013]将多个文本向量输入正向门控循环单元中,得到正向向量;
[0014]将多个文本向量输入反向门控循环单元中,得到反向向量;
[0015]对正向向量和反向向量进行拼接处理,得到目标向量

[0016]在其中一个实施例中,正向门控循环单元包括多个正向节点,反向门控循环单元节点包括多个反向节点,将多个文本向量输入正向门控循环单元中,得到正向向量;将多个文本向量输入反向门控循环单元,得到反向向量,包括:
[0017]将文本向量输入各正向节点进行处理,并将前一正向节点提取到的隐藏信息输入到后一正向节点,得到末尾正向节点输出的正向向量;
[0018]将文本向量输入个反向节点进行处理,并将前一反向节点提取到的隐藏信息输入到后一个反向节点,得到末尾反向节点输出的反向向量

[0019]在其中一个实施例中,该方法还包括:
[0020]获取训练样本集;训练样本集包括多个训练样本子集,不同训练样本子集对应不同历史时段且存在时序关系;
[0021]分别利用各训练样本子集对初始语言模型进行训练,得到多个中间语言模型;
[0022]基于训练样本集对中间语言模型和初始双向门控循环单元进行联合训练,得到语言表征模型和双向门控循环单元

[0023]在其中一个实施例中,训练样本子集包括多个样本数据和各样本数据对应的标签;分别利用各训练样本子集对初始语言模型进行训练,得到多个中间语言模型,包括:
[0024]对于各初始语言模型,将样本数据输入初始语言模型中,得到第一训练结果;
[0025]根据预设损失函数确定第一训练结果与样本数据对应的标签之间的损失值;
[0026]在损失值不符合预设收敛条件的情况下,调整初始语言模型中的模型参数,直至重新得到的损失值符合预设收敛条件时结束训练,得到中间语言模型

[0027]在其中一个实施例中,基于训练样本集对中间语言模型和初始双向门控循环单元进行联合训练,得到语言表征模型和双向门控循环单元,包括:
[0028]对于中间语言模型和初始双向门控循环单元,将训练样本集输入中间语言模型和初始双向门控循环单元中,得到第二训练结果;
[0029]根据预设损失函数确定第二训练结果与训练样本集对应的标签之间的损失值;
[0030]在损失值不符合预设收敛条件的情况下,调整中间语言模型和初始双向门控循环单元中的模型参数,直至重新得到的损失值符合预设收敛条件时结束训练,得到语言表征模型和双向门控循环单元

[0031]第二方面,本申请还提供了一种情感分类装置,该装置包括:
[0032]获取模块,用于获取针对目标对象的文本特征;
[0033]处理模块,用于将文本特征分别输入到预训练的多个语言表征模型进行特征提取处理,得到多个文本向量;其中,多个语言表征模型是根据不同历史时段的文本数据训练得到的,且多个语言表征模型存在时序关系;
[0034]确定模块,用于根据多个文本向量确定情感分类结果;情感分类结果用于表征用户针对目标对象的情感倾向

[0035]第三方面,本申请还提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
[0036]获取针对目标对象的文本特征;
[0037]将文本特征分别输入到预训练的多个语言表征模型进行特征提取处理,得到多个文本向量;其中,多个语言表征模型是根据不同历史时段的文本数据训练得到的,且多个语言表征模型存在时序关系;
[0038]根据多个文本向量确定情感分类结果;情感分类结果用于表征用户针对目标对象的情感倾向

[0039]第四方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0040]获取针对目标对象的文本特征;
[0041]将文本特征分别输入到预训练的多个语言表征模型进行特征提取处理,得到多个文本向量;其中,多个语言表征模型是根据不同历史时段的文本数据训练得到的,且多个语言表征模型存在时序关系;
[0042]根据多个文本向量确定情感分类结果;情感分类结果用于表征用户针对目标对象的情感倾向

[0043]第五方面,本申请还提供了一种计算机程序产品,该计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0044]获取针对目标对象的文本特征;
[0045]将文本特征分别输入到预训练的多个语言表征模型进行特征提取处理,得到多个文本向量;其中,多个语言表征模型是根据不同历史时段的文本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种情感分类方法,其特征在于,所述方法包括:获取针对目标对象的文本特征;将所述文本特征分别输入到预训练的多个语言表征模型进行特征提取处理,得到多个文本向量;其中,多个所述语言表征模型是根据不同历史时段的文本数据训练得到的,且多个所述语言表征模型存在时序关系;根据多个所述文本向量确定情感分类结果;所述情感分类结果用于表征用户针对所述目标对象的情感倾向
。2.
根据权利要求1所述的方法,其特征在于,所述根据多个所述文本向量确定情感分类结果,包括:将多个所述文本向量输入双向门控循环单元中进行处理,得到目标向量;根据所述目标向量进行分类处理,确定所述情感分类结果
。3.
根据权利要求2所述的方法,其特征在于,所述双向门控循环单元包括正向门控循环单元和反向门控循环单元,所述将多个所述文本向量输入所述双向门控循环单元中进行处理,得到目标向量,包括:将多个所述文本向量输入所述正向门控循环单元中,得到正向向量;将多个所述文本向量输入所述反向门控循环单元中,得到反向向量;对所述正向向量和所述反向向量进行拼接处理,得到所述目标向量
。4.
根据权利要求3所述的方法,其特征在于,所述正向门控循环单元包括多个正向节点,所述反向门控循环单元节点包括多个反向节点,所述将多个所述文本向量输入所述正向门控循环单元中,得到正向向量;将多个所述文本向量输入所述反向门控循环单元中,得到反向向量,包括:将所述文本向量输入各所述正向节点进行处理,并将前一正向节点提取到的隐藏信息输入到后一正向节点,得到末尾正向节点输出的所述正向向量;将所述文本向量输入个所述反向节点进行处理,并将前一反向节点提取到的隐藏信息输入到后一个反向节点,得到末尾反向节点输出的所述反向向量
。5.
根据权利要求2‑4任一项所述方法,其特征在于,所述方法还包括:获取训练样本集;所述训练样本集包括多个训练样本子集,不同训练样本子集对应不同历史时段且存在时序关系;分别利用各所述训练样本子集对初始语言模型进行训练,得到多个中间语言模型;基于所述训练样本集对所述中间语言模型和初始双向门控循环单元进行联合训练,得到所述语言表征模型和所述双向门控循环单元
。6.
根据权利要求5所述的方法,其特征在于,所述训练...

【专利技术属性】
技术研发人员:杨文琦
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1