跨领域文本情感分类方法、装置、存储介质以及电子设备制造方法及图纸

技术编号:31313410 阅读:46 留言:0更新日期:2021-12-12 21:50
本发明专利技术涉及一种跨领域文本情感分类方法、装置、存储介质以及电子设备,该方法包括:获取目标领域文本以及标注有情感类别标签的源领域文本,建立跨领域文本情感分类模型,所述模型包括第一双通道特征提取模块、第二双通道特征提取模块、第一领域适应模块和第二领域适应模块,通过相互学习和对抗网络学习对模型进行训练,将待进行情感分类的目标领域文本输入至训练好的所述跨领域文本情感分类模型中,获得情感分类结果,通过采用单词层级和句子层级的层次结构逐步提取文本的语义通道特征,通过双向门控循环单元提取浅层语义信息,然后用图注意力获得句法依赖关系,提取文本的句法通道特征,从而提高了跨领域文本情感分类的准确度。从而提高了跨领域文本情感分类的准确度。从而提高了跨领域文本情感分类的准确度。

【技术实现步骤摘要】
跨领域文本情感分类方法、装置、存储介质以及电子设备


[0001]本专利技术涉及自然语言处理
,特别是涉及一种跨领域情感分类方法、装置、存储介质以及电子设备。

技术介绍

[0002]训练一个良好的情感分类器需要大量的标记数据,然而在实践中仍然有许多领域存在大量未标记的数据,为不同的领域动态地标注足够的训练数据通常是困难且昂贵的。可能在现有的领域(称为源领域)中有足够的标记数据,但是在新的领域(称为目标领域)中很少或没有标记数据,从而激发了跨领域情感分类的研究,它从有丰富标记的源领域数据中学习来指导目标领域数据的训练,对缺乏标记的目标领域研究有着重要价值。
[0003]然而,由于不同领域的文本句法结构复杂,语义信息多样的特点,现有的跨领域文本情感分类方法,对于目标领域的文本情感分类的准确度不高。

技术实现思路

[0004]基于此,本专利技术的目的在于,提供一种跨领域文本情感分类方法、装置、存储介质以及电子设备,其具有提高跨领域文本情感分类准确度的优点。
[0005]根据本申请实施例的第一方面,提供一种跨领域文本情感分类方法,包括如下步骤:
[0006]获取目标领域文本以及标注有情感类别标签的源领域文本;
[0007]建立跨领域文本情感分类模型,所述模型包括第一双通道特征提取模块、第二双通道特征提取模块、第一领域适应模块和第二领域适应模块;
[0008]将所述源领域文本和所述目标领域文本并行输入至所述第一双通道特征提取模块进行特征提取,获得所述源领域文本的第一特征表示和所述目标领域文本的第一特征表示;所述第一特征表示包括拼接的第一语义通道表示和第一句法通道表示;
[0009]将所述源领域文本和所述目标领域文本并行输入至所述第二双通道特征提取模块进行特征提取,获得所述源领域文本的第二特征表示和所述目标领域的文本的第二特征表示;所述第二特征表示包括拼接的第二语义通道表示和第二句法通道表示;
[0010]将所述源领域文本的第一特征表示和所述目标领域文本的第一特征表示输入至所述第一领域适应模块,将所述源领域文本的第二特征表示和所述目标领域的文本的第二特征表示输入至所述第二领域适应模块,通过相互学习和对抗网络学习对所述第一双通道特征提取模块、所述第二双通道特征提取模块、所述第一领域适应模块和所述第二领域适应模块进行训练,以提取所述目标领域的文本与所述源领域的文本的不变领域特征,获得训练好的跨领域文本情感分类模型;
[0011]将待进行情感分类的目标领域文本输入至训练好的所述跨领域文本情感分类模型中,获得情感分类结果。
[0012]根据本申请实施例的第二方面,提供一种跨领域文本情感分类装置,包括:
[0013]文本获取模块,用于获取目标领域文本以及标注有情感类别标签的源领域文本;
[0014]模型建立模块,用于建立跨领域文本情感分类模型,所述模型包括第一双通道特征提取模块、第二双通道特征提取模块、第一领域适应模块和第二领域适应模块;
[0015]第一双通道特征提取模块,用于将所述源领域文本和所述目标领域文本并行输入至所述第一双通道特征提取模块进行特征提取,获得所述源领域文本的第一特征表示和所述目标领域文本的第一特征表示;所述第一特征表示包括拼接的第一语义通道表示和第一句法通道表示;
[0016]第二双通道特征提取模块,用于将所述源领域文本和所述目标领域文本并行输入至所述第二双通道特征提取模块进行特征提取,获得所述源领域文本的第二特征表示和所述目标领域的文本的第二特征表示;所述第二特征表示包括拼接的第二语义通道表示和第二句法通道表示;
[0017]模型训练模块,用于将所述源领域文本的第一特征表示和所述目标领域文本的第一特征表示输入至所述第一领域适应模块,将所述源领域文本的第二特征表示和所述目标领域的文本的第二特征表示输入至所述第二领域适应模块,通过相互学习和对抗网络学习对所述第一双通道特征提取模块、所述第二双通道特征提取模块、所述第一领域适应模块和所述第二领域适应模块进行训练,以提取所述目标领域的文本与所述源领域的文本的不变领域特征,获得训练好的跨领域文本情感分类模型;
[0018]结果获得模块,用于将待进行情感分类的目标领域文本输入至训练好的所述跨领域文本情感分类模型中,获得情感分类结果。
[0019]根据本申请实施例的第三方面,提供一种电子设备,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如上述任意一项所述的跨领域文本情感分类方法。
[0020]根据本申请实施例的第四方面,提供一种计算机可读存储介质,其上储存有计算机程序,该计算机程序被处理器执行时实现如上述任意一项所述的跨领域文本情感分类方法。
[0021]本申请实施例通过获取目标领域文本以及标注有情感类别标签的源领域文本,建立跨领域文本情感分类模型,所述模型包括第一双通道特征提取模块、第二双通道特征提取模块、第一领域适应模块和第二领域适应模块。将所述源领域文本和所述目标领域文本并行输入至所述第一双通道特征提取模块进行特征提取,获得所述源领域文本的第一特征表示和所述目标领域文本的第一特征表示,所述第一特征表示包括拼接的第一语义通道表示和第一句法通道表示。将所述源领域文本和所述目标领域文本并行输入至所述第二双通道特征提取模块进行特征提取,获得所述源领域文本的第二特征表示和所述目标领域的文本的第二特征表示,所述第二特征表示包括拼接的第二语义通道表示和第二句法通道表示。将所述源领域文本的第一特征表示和所述目标领域文本的第一特征表示输入至所述第一领域适应模块,将所述源领域文本的第二特征表示和所述目标领域的文本的第二特征表示输入至所述第二领域适应模块,通过相互学习和对抗网络学习对所述第一双通道特征提取模块、所述第二双通道特征提取模块、所述第一领域适应模块和所述第二领域适应模块进行训练,以提取所述目标领域的文本与所述源领域的文本的不变领域特征,获得训练好的跨领域文本情感分类模型。将待进行情感分类的目标领域文本输入至训练好的所述跨领
域文本情感分类模型中,获得情感分类结果。本专利技术通过采用单词层级和句子层级的层次结构逐步提取文本的语义通道特征,通过双向门控循环单元提取浅层语义信息,然后用图注意力获得句法依赖关系,提取文本的句法通道特征,从而提高了跨领域文本情感分类的准确度。
[0022]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
[0023]为了更好地理解和实施,下面结合附图详细说明本专利技术。
附图说明
[0024]图1为本专利技术跨领域文本情感分类方法的流程示意图;
[0025]图2为本专利技术跨领域文本情感分类方法中S30的流程示意图;
[0026]图3为本专利技术跨领域文本情感分类方法中S40的流程示意图;
[0027]图4为本专利技术跨领域文本情感分类方法中S50的流程示意图;
[0028]图5为本专利技术跨领域文本情感分类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种跨领域文本情感分类方法,其特征在于,包括:获取目标领域文本以及标注有情感类别标签的源领域文本;建立跨领域文本情感分类模型,所述模型包括第一双通道特征提取模块、第二双通道特征提取模块、第一领域适应模块和第二领域适应模块;将所述源领域文本和所述目标领域文本并行输入至所述第一双通道特征提取模块进行特征提取,获得所述源领域文本的第一特征表示和所述目标领域文本的第一特征表示;所述第一特征表示包括拼接的第一语义通道表示和第一句法通道表示;将所述源领域文本和所述目标领域文本并行输入至所述第二双通道特征提取模块进行特征提取,获得所述源领域文本的第二特征表示和所述目标领域的文本的第二特征表示;所述第二特征表示包括拼接的第二语义通道表示和第二句法通道表示;将所述源领域文本的第一特征表示和所述目标领域文本的第一特征表示输入至所述第一领域适应模块,将所述源领域文本的第二特征表示和所述目标领域的文本的第二特征表示输入至所述第二领域适应模块,通过相互学习和对抗网络学习对所述第一双通道特征提取模块、所述第二双通道特征提取模块、所述第一领域适应模块和所述第二领域适应模块进行训练,以提取所述目标领域的文本与所述源领域的文本的不变领域特征,获得训练好的跨领域文本情感分类模型;将待进行情感分类的目标领域文本输入至训练好的所述跨领域文本情感分类模型中,获得情感分类结果。2.根据权利要求1所述的跨领域文本情感分类方法,其特征在于:所述第一双通道特征提取模块包括第一语义提取模块和第一句法提取模块;所述第一语义提取模块包括依次连接的第一双向门控循环单元、第一软注意力机制模型、第二双向门控循环单元以及第一卷积神经网络注意模型;所述第一句法提取模块包括依次连接的第三双向门控循环单元、第一图注意力机制模型以及第二卷积神经网络注意模型;所述将所述源领域文本和所述目标领域文本并行输入至所述第一双通道特征提取模块进行特征提取,获得所述源领域文本的第一特征表示和所述目标领域文本的第一特征表示;所述第一特征表示包括拼接的第一语义通道表示和第一句法通道表示,包括:将所述源领域文本输入至所述第一双向门控循环单元进行编码,获得第一隐藏层状态表示;将所述第一隐藏层状态表示输入至所述第一软注意力机制模型,获得所述源领域文本中每个单词的注意力权重;根据所述第一隐藏层状态表示和所述每个单词的注意力权重,获得句子的特征表示;将所述句子的特征表示输入至所述第二双向门控循环单元进行编码,获得句子的隐藏层状态表示;将所述句子的隐藏层状态表示输入至所述第一卷积神经网络注意模型,获得所述源领域文本中每个句子的注意力权重;根据所述句子的隐藏层状态表示和所述每个句子的注意力权重,获得所述源领域文本的第一语义通道表示;将所述源领域文本输入至所述第三双向门控循环单元进行编码,获得第二隐藏层状态
表示;将所述第二隐藏层状态表示输入至所述第一图注意力机制模型进行句法依存关系提取,获得所述源领域文本的状态向量;将所述源领域文本的状态向量输入至所述第二卷积神经网络注意模型进行特征提取,获得所述源领域文本的第一句法通道表示;将所述源领域文本的第一语义通道表示和所述源领域文本的第一句法通道表示拼接,获得所述源领域文本的第一特征表示。3.根据权利要求1所述的跨领域文本情感分类方法,其特征在于:所述第一领域适应模块包括第一情感分类器、第一梯度反转层和第一领域鉴别器、以及第一标签探测器;所述第二领域适应模块包括第二情感分类器、第二梯度反转层和第二领域鉴别器、以及第二标签探测器;所述将所述源领域文本的第一特征表示和所述目标领域文本的第一特征表示输入至所述第一领域适应模块,将所述源领域文本的第二特征表示和所述目标领域的文本的第二特征表示输入至所述第二领域适应模块,通过相互学习和对抗网络学习对所述第一双通道特征提取模块、所述第二双通道特征提取模块、所述第一领域适应模块和所述第二领域适应模块进行训练,以提取所述目标领域的文本与所述源领域的文本的不变领域特征,获得训练好的跨领域文本情感分类模型,包括:将所述源领域文本的第一特征表示输入至所述第一情感分类器,得到源领域文本情感类别第一预测值;将所述源领域文本的第一特征表示和所述目标领域文本的第一特征表示分别输入至所述第一梯度反转层和所述第一领域鉴别器,获得所述源领域文本的领域第一鉴别结果和所述目标领域文本的领域第一鉴别结果;其中,通过所述第一梯度反转层将所述第一领域鉴别器作为对抗网络学习中的判别器,使所述第一领域鉴别器无法判别文本的领域来源,以提取领域不变特征;将所述目标领域文本的第一特征表示输入至所述第一情感分类器,获得目标领域文本情感类别第一预测值,将所述目标领域的文本的第二特征表示输入至所述第二标签探测器,获得所述目标领域文本情感类别第二伪标签;将所述源领域文本的第二特征表示输入至所述第二情感分类器,得到源领域文本情感类别第二预测值;将所述源领域文本的第二特征表示和所述目标领域文本的第二特征表示分别输入至所述第二梯度反转层和所述第二领域鉴别器,获得所述源领域文本的领域第二鉴别结果和所述目标领域文本的领域第二鉴别结果;其中,通过所述第二梯度反转层将所述第二领域鉴别器作为对抗网络学习中的判别器,使所述第二领域鉴别器无法判别文本的领域来源,以提取领域不变特征;将所述目标领域文本的第二特征表示输入至所述第二情感分类器,获得目标领域文本情感类别第二预测值,并所述目标领域的文本的第一特征表示输入至所述第一标签探测器,获得所述目标领域文本情感类别第一伪标签;根据所述源领域文本情感类别第一预测值、所述源领域文本情感类别的第二预测值和源领域文本情感类别标签,最小化所述第一情感分类器和所述第二情感分类器的情感分类
损失函数;根据所述源领域文本的领域第一鉴别结果和所述目标领域文本的领域第一鉴别结果,述源领域文本的领域第二鉴别结果和所述目标领域文本的领域第二鉴别结果,最小化所述第一领域鉴别器和所述第二领域鉴别器的对抗网络学习损失函数;根据目标领域文本情感类别第一预测值和所述目标领域文本情感类别第二伪标签,根据目标领域文本情感类别第二预测值和所述目标领域文本情感类别第一伪标签,最小化所述第一标签探测器和所述第二标签探测器的相互学习损失函数;对所述第一双通道特征提取模块、所述第二双通道特征提取模块、所述第一领域适应模块和所述第二领域适应模块中的网络参数进行优化,获得训练好的跨领域文本情感分类模型。4.根据权利要求1所述的跨领域文本情感分类方法,其特征在于:所述第二双通道特征提取模块包括第二语义提取模块和第二句法提取模块;所述第二语义提取模块包括依次连接的第四双向门控循环单元、第二软注意力机制模型、第五双向门控循环单元以及第三卷积神经网络注意模型;所述第二句法提取模块包括依次连接的第六双向门控循环单元、第二图注意力机制模型以及第四卷积神经网络注意模型;所述将所述源领域文本和所述目标领域文本并行输入至所述第二双通道特征提取模块进行特征提取,获得所述源领域文本的第二特征表示和所述目标领域文本的第二特征表示;所述第二特征表示包括拼接的第二语义通道表示和第二句法通道表示,包括:将所述源领域文本输入至所述第四双向门控循环单元进行编码,获得第三隐藏层状态表示;将所述第三隐藏层状态表示输入至所述第二软注意力机制模型,获得所述源领域文本中每个单词的注意力权重;根据所述第三隐藏层状态表示和所述每个单词的注意力权重,获得句子的特征表示;将所述句子的特征表示输入至所述第五双向门控循环单元进行编码,获得句子的隐藏层状态表示;将所述句子的隐藏层状态表示输入至所述第三卷积神经网络注意模型,获得所述源领域文本中每个句子的注意力权重;根据所述句子的隐藏层状态表示和所述每个句子的注意力权重,获得所述源领域文本的第二语义通道表示;将所述源领域文本输入至所述第六双向门控循环单元进行编码,获得第四隐藏层状态表示;将所述第四隐藏层状态表示输入至所述第二图注意力机制模型进行句法依存关系提取,获得所述源领域文本的状态向量;将所述源领域文本的状态向量输入至所述第四卷积神经网络模型进行特征提取,获得所述源领域文本的第二句法通道表示;将所述源领域文本的第二语义通道表示和所述源领域文本的第二句法通道表示拼接,获得所述源领域文本的第二特征表示。5.根据权利要求3所述的跨领域文本情感分类方法,其特征在于,所述跨领域文本情感
分类模型的损失函数包括第一目标损失函数和第二目标损失函数,通过最小化所述第一目标损...

【专利技术属性】
技术研发人员:杨驰薛云周波陈建颖
申请(专利权)人:华南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1