一种基于混合神经网络的可解释中文评论情感分析方法技术

技术编号：37308004 阅读：21 留言：0更新日期：2023-04-21 22:52

本发明专利技术提供了一种基于混合神经网络的可解释中文评论情感分析方法，该方法提出了一种由分析器和解释生成器两个模块组成的可解释中文评论情感模型，其中分析器是MacBERT

全部详细技术资料下载

【技术实现步骤摘要】
一种基于混合神经网络的可解释中文评论情感分析方法

[0001]本专利技术涉及一种基于混合神经网络的可解释中文评论情感分析方法，属于情感分析

技术介绍

[0002]随着互联网的高速发展，电子商务逐渐融入人们的日常生活,电商平台上积累了分布广泛且数量庞大的用户评论数据。通过分析用户评论，商家可以了解人们对产品的满意度，及时知晓市场动态，且及时了解用户的喜好情感，有助于商家推出新的产品，改进自身的服务。因此在各大平台分析用户评论中的情感色彩和具有倾向性的言论，对商家而言具有重要意义。然而，由于用户评论数量庞大，商家很难直接从众多评论中获取有效信息，因此需要借助人工智能技术从众多评论中挖掘有用的信息。近年来，深度学习在自然语言处理领域取得了很好的效果，一些基本的方向包括词向量化，分词，词性标注，命名实体识别，文本结构化等研究逐渐成熟，可以直接被用于一些基础的文本处理任务，诸如快递地址自动识别与填充，文本文件的分类，文章标签与摘要提取，标题生成等。研究发现，在众多情感分析算法中，基于深度学习的情感分析算法因为可以利用上下文信息取得了最佳效果。
[0003]然而，在实际应用时，人们不能完全相信模型的分析结果。这是因为人们缺乏对深度学习内部工作机理的理解与分析，而深度神经网络通常被看作“黑盒”模型，导致只能观察模型的预测结果，而不能了解模型产生决策的原因。因此提出一个可解释的评论分析模型具有重要的理论意义与实际应用价值。

技术实现思路

[0004]针对以上问题，本专利技术提出一种基于混合神经网络的...

【技术保护点】

【技术特征摘要】
1.一种基于混合神经网络的可解释中文评论情感分析方法，其特征在于，所述方法包括以下步骤：(1)获取训练样本集：所述训练样本集来源于电商平台商品评论，(2)数据预处理：对获取到的评论进行去重，清洗，分词，(3)构建模型：分别构建分析器MacBERT
‑
TextCNN模型和解释生成器RCNN模型，(4)联合训练分析器和解释生成器：输入样本数据联合训练分析器与解释生成器。2.根据权利要求1所述的基于混合神经网络的可解释中文评论情感分析方法，其特征在于，其中获取训练样本集包括：利用网络爬虫爬取电商平台长度超过5个字的评论，评分小于3分的评论划为差评集，评分等于3分评论的划为中评集，评分超过3分的评论划为好评集。3.根据权利要求1所述的基于混合神经网络的可解释中文评论情感分析方法，其特征在于，其中数据预处理包括：先去除系统的默认好评，再清洗掉评论中的表情、颜文字、标点符号，然后利用比较删除法去除重复的文本，之后再删除清洗后长度小于5的评论，最后利用jieba第三方库进行分词。4.根据权利要求1所述的基于混合神经网络的可解释中文评论情感分析方法，其特征在于，其中构建分析器包括：先利用MacBERT捕捉底层语义语法信息，获取文本表示，然后使用TextCNN对文本进行特征提取后输入到全连接的Softmax层得到输出。5.根据权利要求1所述的基于混合神经网络的可解释中文评论情感分析方法，其特征在于，其中构建解释生成器包括：解释生成器为两层...

【专利技术属性】
技术研发人员：王红兵，张钰，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人