一种方面级情感分类方法、装置及设备制造方法及图纸

技术编号:38330540 阅读:16 留言:0更新日期:2023-07-29 09:13
本说明书实施例公开了一种方面级情感分类方法、装置及设备。该方案可以包括:利用BERT模型接收目标业务处的待分类文本数据,输出第一特征向量数据;所述待分类文本数据是根据目标业务处的目标语句以及方面词生成的;利用双向长短期记忆网络模型接收所述第一特征向量数据后,输出第二特征向量数据;利用胶囊网络模型,对所述第二特征向量数据进行聚类分析处理,得到第三特征向量数据;利用输出层,根据所述第三特征向量数据进行分类处理,得到与方面词对应的情感分类结果。基于本发明专利技术的方案,可以在训练样本较少的情况下,提高方面级情感分类模型的分类准确率。类模型的分类准确率。类模型的分类准确率。

【技术实现步骤摘要】
一种方面级情感分类方法、装置及设备


[0001]本说明书涉及计算机
,尤其涉及一种方面级情感分类方法、装置及设备。

技术介绍

[0002]随着电商的蓬勃发展,产生了海量的商品评论数据。这些商品评论数据可以帮助商家分析市场行情,判断用户喜好。商品评论中蕴涵的情感信息有着广泛的应用价值。
[0003]方面级情感分类能够判断评论中不同方面的情感极性,实现文本的细粒度情感分类,有着较强的应用需求。目前方面级情感分析研究集中在使用单一神经网络模型进行方面级情感分类,如使用LSTM模型或者BERT模型执行针对用户评论的方面级情感分类任务。但是,单一神经网络模型在执行方面级情感分类任务时,常由于语义特征获取的不够全面,导致模型的分类准确率较低。
[0004]另外,训练一个好的情感分类模型,需要大量的标注语料,而方面级情感分类任务不仅需要像传统情感分类任务一样标注文本的情感极性,还需要标注对应的方面项。目前,方面级情感分类标注语料资源十分有限且主要是英文标注语料资源,而其他语种的标注语料资源则更加匮乏。
[0005]基于此,如何在训练样本较少的情况下,提高方面级情感分类模型的分类准确率成为了亟待解决的技术问题。

技术实现思路

[0006]有鉴于此,本说明书实施例提供了一种方面级情感分类方法、装置及设备,用于在训练样本较少的情况下,提高方面级情感分类模型的分类准确率。
[0007]为解决上述技术问题,本说明书实施例是这样实现的:
[0008]本说明书实施例提供了一种方面级情感分类方法,所述方法使用了方面级情感分类模型,所述方面级情感分类模型包括:BERT模型、双向长短期记忆网络模型、胶囊网络模型、输出层;其中,所述BERT模型与所述双向长短期记忆网络模型连接,所述双向长短期记忆网络模型与所述胶囊网络模型连接,所述胶囊网络模型与所述输出层连接;所述方法包括:
[0009]利用所述BERT模型接收目标业务处的待分类文本数据,输出第一特征向量数据;所述待分类文本数据是根据目标业务处的目标语句以及方面词生成的;所述第一特征向量数据用于反映所述待分类文本数据中各词的位置特征以及局部语义特征;
[0010]利用所述双向长短期记忆网络模型接收所述第一特征向量数据后,输出第二特征向量数据;所述第二特征向量数据用于反映所述待分类文本数据的上下文语义特征;
[0011]利用所述胶囊网络模型,对所述第二特征向量数据进行聚类分析处理,得到第三特征向量数据;
[0012]利用所述输出层,根据所述第三特征向量数据进行分类处理,得到与所述方面词对应的情感分类结果。
[0013]本说明书实施例提供了一种方面级情感分类模型训练方法,所述方面级情感分类模型包括:BERT模型、双向长短期记忆网络模型、胶囊网络模型、输出层;其中,所述BERT模型与所述双向长短期记忆网络模型连接,所述双向长短期记忆网络模型与所述胶囊网络模型连接,所述胶囊网络模型与所述输出层连接;所述方法包括:
[0014]获取训练样本集合;所述训练样本集合中的一个训练样本中包含目标业务处的第一目标语句样本以及第一方面词样本;所述训练样本的标签数据用于反映所述第一目标语句样本对应于所述第一方面词样本的情感分类结果;
[0015]利用所述训练样本集合中的所述训练样本对初始的所述方面级情感分类模型进行训练,得到训练后的所述方面级情感分类模型。
[0016]本说明书实施例提供了一种方面级情感分类装置,所述装置使用了方面级情感分类模型,所述方面级情感分类模型包括:BERT模型、双向长短期记忆网络模型、胶囊网络模型、输出层;其中,所述BERT模型与所述双向长短期记忆网络模型连接,所述双向长短期记忆网络模型与所述胶囊网络模型连接,所述胶囊网络模型与所述输出层连接;所述装置包括:
[0017]第一特征向量生成模块,用于利用所述BERT模型接收目标业务处的待分类文本数据,输出第一特征向量数据;所述待分类文本数据是根据目标业务处的目标语句以及方面词生成的;所述第一特征向量数据用于反映所述待分类文本数据中各词的位置特征以及局部语义特征;
[0018]第二特征向量生成模块,用于利用所述双向长短期记忆网络模型接收所述第一特征向量数据后,输出第二特征向量数据;所述第二特征向量数据用于反映所述待分类文本数据的上下文语义特征;
[0019]第三特征向量生成模块,用于利用所述胶囊网络模型,对所述第二特征向量数据进行聚类分析处理,得到第三特征向量数据;
[0020]输出模块,用于利用所述输出层,根据所述第三特征向量数据进行分类处理,得到与所述方面词对应的情感分类结果。
[0021]本说明书实施例提供了方面级情感分类模型训练装置,所述方面级情感分类模型包括:BERT模型、双向长短期记忆网络模型、胶囊网络模型、输出层;其中,所述BERT模型与所述双向长短期记忆网络模型连接,所述双向长短期记忆网络模型与所述胶囊网络模型连接,所述胶囊网络模型与所述输出层连接;所述装置包括:
[0022]训练样本获取模块,用于获取训练样本集合;所述训练样本集合中的一个训练样本中包含目标业务处的目标语句样本以及方面词样本;所述训练样本的标签数据用于反映所述目标语句样本对应于所述方面词样本的情感分类结果;
[0023]模型训练模块,用于利用所述训练样本集合中的所述训练样本对初始的所述方面级情感分类模型进行训练,得到训练后的所述方面级情感分类模型。
[0024]本说明书实施例提供了一种方面级情感分类设备,包括:
[0025]至少一个处理器;以及,
[0026]与所述至少一个处理器通信连接的存储器;其中,
[0027]所述存储器存储有方面级情感分类模型,其中,所述方面级情感分类模型包括:BERT模型、双向长短期记忆网络模型、胶囊网络模型、输出层;其中,所述BERT模型与所述双
向长短期记忆网络模型连接,所述双向长短期记忆网络模型与所述胶囊网络模型连接,所述胶囊网络模型与所述输出层连接;所述存储器还存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
[0028]利用所述BERT模型接收目标业务处的待分类文本数据,输出第一特征向量数据;所述待分类文本数据是根据目标业务处的目标语句以及方面词生成的;所述第一特征向量数据用于反映所述待分类文本数据中各词的位置特征以及局部语义特征;
[0029]利用所述双向长短期记忆网络模型接收所述第一特征向量数据后,输出第二特征向量数据;所述第二特征向量数据用于反映所述待分类文本数据的上下文语义特征;
[0030]利用所述胶囊网络模型,对所述第二特征向量数据进行聚类分析处理,得到第三特征向量数据;
[0031]利用所述输出层,根据所述第三特征向量数据进行分类处理,得到与所述方面词对应的情感分类结果。
[0032]本说明书实施例提供了一种方面级情感分类模型训练设备,包括:...

【技术保护点】

【技术特征摘要】
1.一种方面级情感分类方法,其特征在于,所述方法使用了方面级情感分类模型,所述方面级情感分类模型包括:BERT模型、双向长短期记忆网络模型、胶囊网络模型、输出层;其中,所述BERT模型与所述双向长短期记忆网络模型连接,所述双向长短期记忆网络模型与所述胶囊网络模型连接,所述胶囊网络模型与所述输出层连接;所述方法包括:利用所述BERT模型接收目标业务处的待分类文本数据,输出第一特征向量数据;所述待分类文本数据是根据目标业务处的目标语句以及方面词生成的;所述第一特征向量数据用于反映所述待分类文本数据中各词的位置特征以及局部语义特征;利用所述双向长短期记忆网络模型接收所述第一特征向量数据后,输出第二特征向量数据;所述第二特征向量数据用于反映所述待分类文本数据的上下文语义特征;利用所述胶囊网络模型,对所述第二特征向量数据进行聚类分析处理,得到第三特征向量数据;利用所述输出层,根据所述第三特征向量数据进行分类处理,得到与所述方面词对应的情感分类结果。2.根据权利要求1所述的方法,其特征在于,所述利用所述BERT模型接收目标业务处的待分类文本数据,输出第一特征向量数据之前,还包括:获取所述目标业务处的所述目标语句以及所述方面词;根据所述方面词,为所述目标语句匹配相应的构造句;对所述构造句、所述目标语句以及所述方面词进行数据处理,得到所述目标业务处的待分类文本数据。3.根据权利要求2所述的方法,其特征在于,所述根据所述方面词,为所述目标语句匹配相应的构造句,具体包括:根据所述方面词,确定出所述方面词所属的方面词类别;根据所述方面词类别,从预先设置的构造句集合中,确定出与所述方面词类别对应的构造句;将所述确定出的与所述方面词类别对应的构造句匹配给所述目标语句。4.根据权利要求2所述的方法,其特征在于,所述对所述构造句、所述目标语句以及所述方面词进行数据处理,得到目标业务处的待分类文本数据,具体包括:对所述构造句、所述目标语句以及所述方面词进行数据拼接,得到拼接后数据;对所述拼接后数据进行数据补偿,直到所述拼接后数据的数据长度达到预设数据长度,得到所述目标业务处的待分类文本数据。5.一种方面级情感分类模型训练方法,其特征在于,所述方面级情感分类模型包括:BERT模型、双向长短期记忆网络模型、胶囊网络模型、输出层;其中,所述BERT模型与所述双向长短期记忆网络模型连接,所述双向长短期记忆网络模型与所述胶囊网络模型连接,所述胶囊网络模型与所述输出层连接;所述方法包括:获取训练样本集合;所述训练样本集合中的一个训练样本中包含目标业务处的第一目标语句样本以及第一方面词样本;所述训练样本的标签数据用于反映所述第一目标语句样本对应于所述第一方面词样本的情感分类结果;利用所述训练样本集合中的所述训练样本对初始的所述方面级情感分类模型进行训练,得到训练后的所述方面级情感分类模型。
6.根据权利要求5所述的方法,其特征在于,所述利用所述训练样本集合中的所述训练样本对初始的所述方面级情感分类模型进行训练,得到训练后的所述方面级情感分类模型之后,还包括:获取验证样本集合;所述验证样本集合中的一个验证样本中包含所述目标业务处的第二目标语句样本以及第二方面词样本;针对所述验证样本集合中的所述验证样本,将所述验证样本输入所述训练后的所述方面级情感分类模型,得到所述训练后的所述方面级情感分类模型输出的情感分类结果;获取所述验证样本对应的情感分类标签;根据所述情感分类标签和所述情感分类结果,生成所述训练后的所述方面级情感分类模型的性能测试结果。7.一种方面级情感分类装置,其特征在于,所述装置使用了方面级情感分类模型,所述方面级情感分类模型包括:BERT模型、双向长短期记忆网络模型、胶囊网络模型、输出层;其中,所述BERT模型与所述双向长短期记忆网络模型连接...

【专利技术属性】
技术研发人员:任萍梁慧杰蒋天奇
申请(专利权)人:安徽理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1