【技术实现步骤摘要】
一种基于文本胶囊神经网络的句子级情感分析方法
[0001]本专利技术属于文本情感分析中的句子级情感分析领域,尤其涉及一种基于文本胶囊神经网络的句子级情感分析方法。
技术介绍
[0002]情感分析是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。句子级情感分析任务,因其具备识别主体情感的特点,在实时情感分析等场景得到了广泛应用,已成为情感分析领域的研究热点之一。
[0003]传统的情感分类主要采用基于规则和机器学习的方法。由于特征提取过程中存在大量人为干扰因素,越来越多的研究人员使用深度学习方法来实现情感分类。LSTM(长短记忆网络)采用多任务训练模型调整参数,可以提高模型的特征提取能力。尽管LSTM具有特定的记忆能力,但它仍然无法记住所有信息,并且计算速度较慢。使用CNN(卷积神经网络)对文本信息进行分类的方法逐渐活跃起来,并取得了良好的分类效果。目前,越来越多的学者开始使用Transformer模型提取文本特征,通过自注意机制获取句子中单词之间的依赖关系,并更有效地捕捉句子结构。与使用标量值来表示特征的传统神经元不同,胶囊网络节点使用向量值来表示文本中词汇的多属性特征,并使用动态路由机制而不是汇集层结构来识别不明显的文本情感特征。
[0004]但是目前,深度学习在情感分析领域仍然存在一些困难。一方面,训练样本不足。RNN(递归神经网络)常用于文本分析,但其并行计算困难,梯度容易消失,而Transformer具有较强的特征提取能力,但其空间信息提取能力较弱。此外,胶囊神经网络的出现赋予计算 ...
【技术保护点】
【技术特征摘要】
1.一种基于文本胶囊神经网络的句子级情感分析方法,其特征在于,包括如下步骤:步骤1:使用字词级别与句子级别的编码器获取句子的特征表示;步骤2:使用数据增强的方式获取同一句子的大量特征表示,为每个句子分别生成多个向量表示;步骤3:将每个句子的多个特征表示拼接,得到一个二维矩阵;步骤4:提出改进的文本胶囊神经网络模型来建模步骤3矩阵中句子局部特征与整体情感极性之间的内在联系;步骤5;矩阵中的每个句子经由文本胶囊网络进行分类,最终预测该句子所对应的情感极性。2.根据权利要求1所述的基于文本胶囊神经网络的句子级情感分析方法,其特征在于,所述步骤1原始输入是包含多个单词的一个句子C,形式化描述为:c=[w1,w2,...,w
|c|
],其中w为句子中的词,l为句子中词的个数,ed为词嵌入维度。3.根据权利要求1所述的基于文本胶囊神经网络的句子级情感分析方法,其特征在于,所述步骤1使用的词向量文件经由Word2vec模型预训练得出,词向量的维度取200,框架中BiLSTM隐藏层状态都为100,在训练过程,使用SGD算法和mini
‑
batch Adam进行优化更新,数据的批量大小和学习率分别设为32和0.005,对词嵌入向量使用0.6的失活率,损失函数中的初始权重δ1和δ2都设置为1。4.根据权利要求1所述的基于文本胶囊神经网络的句子级情感分析方法,其特征在于,所述步骤1包括如下具体步骤:步骤1.1:首先对输入句子c使用BiLSTM网络以获取字词级别的特征表示h,为句子中的每个词积累上下文信息,其中,h=BiLSTM(c),l是句子中词的数目,hs是LSTM隐藏层状态的特征数目;步骤1.2:使用Attention Pooling机制处理h,使得句子中每个词都能融合句子中其他词的关键信息,过程如下所示:α=softmax(Linear(tanh(Linear(h)))e=α
T
h其中,Linear表示全连接神经网络,得到句子c的特征表示e。5.根据权利要求1所述的基于文本胶囊神经网络的句子级情感分析方法,其特征在于,所述步骤2包括如下具体步骤:步骤2.1:使用多次dropout神经元随机失活作为文本数据增强的方式,为每个句子获取n个特征表示e
i
=Dropout(e)步骤2.2:将e
′
=[e1,e2,...,e
n
]作为文本胶囊神经网络的原始输入向量。6.根据权利要求1所述的基于文本胶囊神经网络的句子级情感分析方法,其特征在于,所述步骤3将句子的多个特征表示按列的维...
【专利技术属性】
技术研发人员:杨成,郑俊辉,占佩倩,宋霞文,闫永健,余曼能,
申请(专利权)人:浙江工商大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。