文本的情感分析方法及其装置、计算设备与可读介质制造方法及图纸

技术编号:32639422 阅读:31 留言:0更新日期:2022-03-12 18:15
本发明专利技术提供一种文本的情感分析方法及其装置、计算设备与可读介质。其方法包括:获取待分析文本的分词表达;获取所述待分析文本的否定词与情感词表达;将所述待分析文本的所述分词表达、以及所述否定与情感词表达,输入至经训练的情感分析模型中,获取所述情感分析模型预测并输出的所述待分析文本的倾向情感分类。本发明专利技术通过采用上述技术方案,能够同时基于待分析文本的分词表达和否定词与情感词表达,采用经训练的情感分析模型来预测该待分析文本的倾向情感分类。与现有技术相比,由于参考了待分析文本中的否定词与情感词,能够有效地提高情感分类的准确性。高情感分类的准确性。高情感分类的准确性。

【技术实现步骤摘要】
文本的情感分析方法及其装置、计算设备与可读介质
[0001]本申请是申请日为2019年5月28日、申请号为201910451510.3、题为“文本的情感分析方法及其装置、计算设备与可读介质”的专利申请的分案申请。


[0002]本专利技术涉及计算机应用
,尤其涉及一种文本的情感分析方法及其装置、计算设备与可读介质。

技术介绍

[0003]在自然语言处理领域中,文本的情感分析能够有助于对文本的理解。因此,文本的情感分析在自然语言处理中尤为重要。
[0004]现有的文本的情感分析方案,主要采用注意力机制继续情感分析。具体地,首先采集大量的文本语料,作为训练数据。然后基于注意力机制,采用训练数据训练情感分析模型。后续基于训练得到的情感分析模型来对文本的情感进行分析。
[0005]但是,现有的情感分析模型采用注意力机制,仅注意了文本中的情感词,而在文本中同时包括否定词的时候,可能与预测出反向的情感,导致现有的情感分析方案分析的准确性较差。

技术实现思路

[0006]本专利技术提供一种文本的情感分析方法及其装置、计算设备与可读介质,用于提高情感分析的准确性。
[0007]本专利技术提供一种文本的情感分析方法,其中,所述方法包括:
[0008]获取待分析文本的分词表达;
[0009]获取所述待分析文本的否定词与情感词表达;
[0010]将所述待分析文本的所述分词表达、以及所述否定与情感词表达,输入至经训练的情感分析模型中,获取所述情感分析模型预测并输出的所述待分析文本的倾向情感分类。
[0011]本专利技术还提供一种情感分析模型的训练方法,其中,所述方法包括:
[0012]获取训练文本集;
[0013]基于训练文本集提取训练样本集,所述训练样本集中每条训练样本包括分词表达、否定词与情感词表达以及已知的情感分类;
[0014]基于所述训练样本集,训练情感分析模型。
[0015]本专利技术还提供一种文本的情感分析装置,其中,所述装置包括:
[0016]分词信息获取模块,用于获取待分析文本的分词表达;
[0017]否定词与情感词信息获取模块,用于获取所述待分析文本的否定词与情感词表达;
[0018]预测模块,用于将所述待分析文本的所述分词表达、以及所述否定与情感词表达,
输入至经训练的情感分析模型中,获取所述情感分析模型预测并输出的所述待分析文本的倾向情感分类。
[0019]本专利技术还提供一种情感分析模型的训练装置,其中,所述装置包括:
[0020]获取模块,用于获取训练文本集;
[0021]提取模块,用于基于训练文本集提取训练样本集,所述训练样本集中每条训练样本包括分词表达、否定词与情感词表达以及已知的情感分类;
[0022]训练模块,用于基于所述训练样本集,训练情感分析模型。
[0023]本专利技术还提供一种计算设备,包括:
[0024]处理器;以及
[0025]存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上任何一项所述的方法。
[0026]本专利技术还提供一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上任一项所述的方法。
[0027]本专利技术的文本的情感分析方法及其装置、计算设备与可读介质,通过采用上述技术方案,能够同时基于待分析文本的分词表达和否定词与情感词表达,采用经训练的情感分析模型来预测该待分析文本的倾向情感分类。与现有技术相比,由于参考了待分析文本中的否定词与情感词,能够有效地提高情感分类的准确性。
附图说明
[0028]通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
[0029]图1为本专利技术的文本的情感分析方法实施例一的流程图。
[0030]图2为本专利技术提供的一种情感分析模型的结构图。
[0031]图3为本专利技术的文本的情感分析方法实施例二的流程图。
[0032]图4为本专利技术提供的另一种情感分析模型的结构图。
[0033]图5为本专利技术的文本的情感分析方法实施例三的流程图。
[0034]图6为本专利技术的情感分析模型的训练方法实施例一的流程图。
[0035]图7为本专利技术的情感分析模型的训练方法实施例二的流程图。
[0036]图8为本专利技术的文本的情感分析装置实施例的结构图。
[0037]图9为本专利技术的情感分析模型的训练装置实施例的结构图。
[0038]图10示出了根据本专利技术一实施例可用于实现上述方法的计算设备的结构示意图。
具体实施方式
[0039]下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0040]图1为本专利技术的文本的情感分析方法实施例一的流程图。如图1所示,本实施例的
情感分析方法,具体可以包括如下步骤:
[0041]100、获取待分析文本的分词表达;
[0042]本实施例的文本的情感分析方法的执行主体为文本的情感分析装置,该文本的情感分析装置具体可以为一独立的电子实体,或者也可以为采用集成的应用,使用时运行计算机设备上即可。
[0043]例如,步骤100获取待分析文本的分词表达,具体可以包括:对待分析文本进行分词;根据预设的词典库和词典库对应的映射词典,对待分析文本中的各分词进行映射,得到待分析文本的分词表达。
[0044]本实施例的词典库可以为预先采集的、包括很多分词的库。该词典库的映射词典中可以记录有该词典库中每一个分词到其映射标识之间的映射关系。例如A

A

之类的映射。例如,一种最简便的映射词典中可以包括词典库中每一个分词到一个数字之间的一对一的映射。不同的分词不能对应相同的映射标识。例如词典库中的第一个分词映射为1,第二个分词映射为2,以此类推,第n个分词可以映射为n。具体在映射词典中,可以将数字作为分词的下标来表示这种映射关系。当然实际应用中,也可以采用字母或者数字与字母的组合作为映射标识,实现原理同理。
[0045]本实施例中,将待分析文本分词之后通过映射词典,将各个分词按在待分析文本中的先后顺序映射为对应的映射标识,得到该待分析文本的一个分词表达。该分词表达中每个分词采用对应的映射标识来表示,且本实施例生成的分词表达可以为一个一维向量。这样可以将待分析文本转换成可以处理的分词表达。
[0046]101、获取待分析文本的否定词与情感词表达;
[0047]本实施例的否定词与情感词表达用于表征待分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本的情感分析方法,其中,所述方法包括:获取待分析文本的分词表达;获取所述待分析文本的否定词与情感词表达;将所述待分析文本的所述分词表达、以及所述否定与情感词表达,输入至经训练的情感分析模型中,获取所述情感分析模型预测并输出的所述待分析文本的倾向情感分类。2.根据权利要求1所述的方法,其中,获取待分析文本的分词表达,包括:对所述待分析文本进行分词;根据预设的词典库和所述词典库对应的映射词典,对所述待分析文本中的各分词进行映射,得到所述待分析文本的分词表达。3.根据权利要求1所述的方法,其中,获取所述待分析文本的否定词与情感表达,包括:对所述待分析文本进行分词;根据预设的否定词词库和预设的情感词词库,从所述待分析文本的所有分词中获取否定词与情感词;根据预设的否定词的特征映射策略和预设的情感词的特征映射策略,对所述待分析文本中的否定词和情感词分别进行特征映射,得到所述待分析文本的否定与情感表达。4.根据权利要求1所述的方法,其中,所述经训练的情感分析模型包括:用于处理所述分词表达的基于循环神经网络的分词处理层;用于处理所述否定词与情感词表达的基于卷积神经网络的否定词情感词处理层;和拼接处理层。5.根据权利要求4所述的方法,其中,所述分词处理层依次包括:词嵌入层、循环神经网络层和第一注意力机制层;所述否定词情感词处理层依次包括:情感嵌入层、卷积神经网络层和第二注意力机制层;所述拼接处理层依次包括:拼接层、全连接层和归一化层;将所述待分析文本的所述分词表达以及所述否定与情感词表达,输入至经训练的情感分析模型中,获取所述情感分析模型预测并输出的所述待分析文本的情感倾向分类,包括:将所述待分析文本的所述分词表达输入至所述词嵌入层,得到分词的嵌入表达;由所述循环神经网络层基于所述分词的嵌入表达,提取分词的包含上下文信息的特征表达;由所述第一注意力机制层基于所述循环神经网络层得到的分词的特征表达,对每个分词赋予不同的权重,加权求和得到文本特征表达;将所述否定词与情感词表达输入至所述情感嵌入层,得到否定词与情感词的嵌入表达;由所述卷积神经网络层...

【专利技术属性】
技术研发人员:赵汉光陈伟
申请(专利权)人:第四范式北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1