一种基于细粒度事件信息增强的短文本隐式情感分类方法技术

技术编号：37420357 阅读：22 留言：0更新日期：2023-04-30 09:43

本发明专利技术公开了一种基于细粒度事件信息增强的短文本隐式情感分类方法，其步骤包括：1、使用事件抽取器抽取短文本中的事件类型、触发词及其他事件元素形成细粒度的单事件元组；2、使用BERT预训练模型分别对单事件元组和短文本进行表征，分别得到单事件元组和短文本的特征向量；3、将步骤2中得到的特征向量通过张量组合的方式进行融合，使用细粒度事件信息增强短文本的表征；4、将步骤3中得到的细粒度事件信息增强后的特征向量输入Bi

全部详细技术资料下载

【技术实现步骤摘要】
一种基于细粒度事件信息增强的短文本隐式情感分类方法

[0001]本专利技术属于自然语言处理领域，具体的说是一种基于细粒度事件信息增强短文本表征的隐式情感分类方法。

技术介绍

[0002]随着社交媒体的发展，网络中积累了大量的短文本信息，对这些短文本信息进行情感分类可以有效挖掘评论者隐藏在短文本中的情感，这不仅可以帮助决策机关了解网络舆情，同时也可以帮助商家了解消费者的喜好。
[0003]根据文本中是否含有情感词，情感分类任务可以分为显示情感分类和隐式情感分类。显式情感分类方法主要基于情感相关词语的出现来检测情感，并得到了广泛的探索。与受到广泛关注的显式情感分析相比，隐式情感分析由于缺少情感词，是一项更加困难的任务。

技术实现思路

[0004]本专利技术是为了解决上述现有技术存在的不足之处，提出一种基于细粒度事件信息增强的短文本隐式情感分类方法，以期能对缺少情感词的短文本情感进行分类识别，并能提高情感预测准确性。
[0005]本专利技术为达到上述专利技术目的，采用如下技术方案：
[0006]本专利技术一种基于细粒度事件信息增强的短文本隐式情感分类方法的特点在于，是按如下步骤进行：
[0007]步骤1、获取评论数据中的短文本并构建数据集，对所述数据集中的所有短文本进行数据预处理，得到每个短文本对应的分词集合，其中，任意一个短文本的分词集合s＝(s1，s2，...，s
i
，...，s
a
)，其中，s
i
表示分词集合s中第i...

【技术保护点】

【技术特征摘要】
1.一种基于细粒度事件信息增强的短文本隐式情感分类方法，其特征在于，是按如下步骤进行：步骤1、获取评论数据中的短文本并构建数据集，对所述数据集中的所有短文本进行数据预处理，得到每个短文本对应的分词集合，其中，任意一个短文本的分词集合s＝(s1,s2,...,s
i
,...,s
a
)，其中，s
i
表示分词集合s中第i个词，a表示分词集合s中词的总数；步骤2、使用事件抽取器对分词集合s进行单事件的抽取，以抽取出单事件的各个元素，从而得到相应短文本对应的细粒度单事件元组t＝(t1,t2,...,t
l
,...,t
b
)，其中，t
l
表示单事件元组t中第l个元素，b表示单事件元组t中元素的总数，l∈[1,b]；步骤3、将单事件元组t输入BERT预训练模型，得到单事件元组t中每个元素的隐藏状态，其中，第l个元素的隐藏状态记为H
l
；步骤4、将单事件元组t中每个元素的隐藏状态输入到注意力机制网络中，用于得到单事件元组t的表征向量；步骤4.1、利用式(1)和式(2)计算单事件元组t中第l个元素t
l
的注意力得分α
l
：u
l
＝sigmoid(W1H
l
+b1)
ꢀꢀꢀꢀꢀ
(1)式(1)中，W1是第一权重矩阵，b1是第一偏置向量，sigmoid表示激活函数，u
l
是单事件元组t中第l个元素t
l
的新隐藏状态；式(2)中，T表示转置操作，θ
l
表示随机初始化的第l个元素t
l
的注意力矩阵；步骤4.2、利用式(3)得到单事件元组t的注意力特征向量h...

【专利技术属性】
技术研发人员：倪丽萍，刘玉强，陈星月，王琪，
申请(专利权)人：合肥工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人