基于双重情感感知的谣言检测方法及装置制造方法及图纸

技术编号:34328588 阅读:55 留言:0更新日期:2022-07-31 01:37
本发明专利技术涉及基于双重情感感知的谣言检测方法及装置,该方法,包括:获取谣言文本和用户评论,并对谣言文本和用户评论进行向量嵌入表示;根据向量嵌入表示,提取谣言文本语义特征及提取谣言文本情感特征和用户评论情感特征;将谣言文本语义特征与用户评论情感特征结合,以获得语义融合特征,将谣言文本情感特征与用户评论情感特征结合,以获得情感融合特征;将语义融合特征和情感融合特征进行分类,以获得检测结果。本发明专利技术通过分别提取谣言文本语义特征,谣言文本情感特征和用户评论情感特征进行谣言检测,具有较高的检测结果,可用于社交媒体上,尤其是当前社交媒体上认知战正愈演愈烈,可利用该方案进行仇恨语言检测,意识形态检测等任务。检测等任务。检测等任务。

【技术实现步骤摘要】
基于双重情感感知的谣言检测方法及装置


[0001]本专利技术涉及谣言检测
,尤其是指基于双重情感感知的谣言检测方法及装置。

技术介绍

[0002]社交媒体的快捷性和便利性等优点给工作、生活和学习带来了巨大的便利,为用户发布、分享和获取各种信息提供了便捷的渠道。不可忽视的是社交媒体正演变成“网络认知战”的主战场,也导致了谣言泛滥,严重影响网络的良性发展,甚至影响社会、经济和文化的发展。为了遏制谣言传播,消除谣言带来的影响,政府、社会媒体、学术界等都展开了相应的行动,越来越多的学者致力于谣言检测任务。有效检测谣言和扼制谣言的传播有助于社会的安定和健康发展,具有重要的现实意义。
[0003]谣言的发布者希望使用各种方法来实现谣言的传播和带来影响,其中一种方法是激发受众的情绪。情感分析作为文本分析中负责确定文本表达的情感极性和强度的部分,被用于谣言检测方法,作为系统的基础,或作为增强特征。在基于内容的谣言检测模型中,情感分析一直被认为是谣言检测方法的重要部分。现有的模型大多利用谣言获取发布者的情感特征,而很少关注在评论中引起的情感。目前基于情感特征的谣言检测方法,没有考虑到评论情感与谣言文本的关系、谣言情感与用户评论情感的关系,谣言内容与情感为什么引起评论情感的?用户评论情感能不能解释为什么一条消息被检测为谣言?因此,导致谣言检测效果不佳。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的不足,提供基于双重情感感知的谣言检测方法及装置。
[0005]为了解决上述技术问题,本专利技术采用如下技术方案:
[0006]第一方面,本实施例提供了一种基于双重情感感知的谣言检测方法,包括以下步骤:
[0007]获取谣言文本和用户评论,并对谣言文本和用户评论进行向量嵌入表示;
[0008]根据向量嵌入表示,提取谣言文本语义特征及提取谣言文本情感特征和用户评论情感特征;
[0009]将谣言文本语义特征与用户评论情感特征结合,以获得语义融合特征,将谣言文本情感特征与用户评论情感特征结合,以获得情感融合特征;
[0010]将语义融合特征和情感融合特征进行分类,以获得检测结果。
[0011]其进一步技术方案为:所述获取谣言文本和用户评论,并对谣言文本和用户评论进行向量嵌入表示步骤中,谣言文本中一条谣言由M个句子组成,其中每个句子s由m个词组成一条谣言对应的用户评论由n个句子组成,其中每个句子e由N个词组成
[0012]其进一步技术方案为:所述根据向量嵌入表示,提取谣言文本语义特征及提取谣言文本情感特征和用户评论情感特征步骤中,谣言文本语义特征的提取包括:
[0013]谣言文本中的词与上下文具有关联性,具有较强的双向语义依赖,从词的两个方向建模获取谣言文本语义特征;其中,词嵌入的向量为前向隐藏状态为后向隐藏状态为词的特征表示为句子向量s∈
2d
×
m

[0014][0015][0016][0017]其中,用于衡量第t个单词对句子s的重要性,的计算公式如下:
[0018][0019][0020]其中,是通过完全嵌入层从隐藏状态获得的,W
w
,b
w
是可训练的参数,u
w
为权重矩阵;
[0021]谣言文本情感特征和用户评论情感特征的提取包括:谣言文本情感特征为U=[u1,u2,

u
M
],用户评论情感特征为V=[v1,v2,

v
N
],其中,对用户评论中某一行评论情感嵌入后的向量进行卷积操作:
[0022][0023]其中,W∈
λ
×
d
是可学习的参数矩阵,b是偏置项,偏ReLU是激活函数;对卷积得到h
j
进行最大池化,可得到每一句评论的情感特征:
[0024][0025]其中,通过CNN层使用2个过滤器λ∈{2,3},以获取多个特征,将不同的输出连接起来,形成v
j
作为用户评论的单个表示,通过同样的方式,得到用户评论中每个评论的情感特征,形成用户评论的情感特征矩阵V=[v1,v2,

,v
N
]。
[0026]其进一步技术方案为:所述将谣言文本语义特征与用户评论情感特征结合,以获得语义融合特征,将谣言文本情感特征与用户评论情感特征结合,以获得情感融合特征步骤中,谣言文本表示为:S=[s1,s2,

,s
M
],用户评论情感特征表示为:E=[e1,e2,

,e
N
];
[0027]首先计算相似矩阵F=tanh(EW
se
S),其中F=
N
×
M
,W
se

2d
×
2d
是可学习的参数矩阵,将相似矩阵作为一个特征,则谣言文本语义特征和用户评论情感特征的协同表示:
[0028]H
s
=tanh(W
s
S+(W
e
E)F)
[0029]H
e
=tanh(W
e
E+(W
s
S)F
T
)
[0030]其中,W
s
,W
e

k
×
2d
为可学习的参数矩阵,谣言文本和用户评论情感特征的注意力权重为:
[0031][0032][0033]其中,a
s
∈1×
M
,a
e
∈1×
N
分别是谣言文本中每个词和评论的情感特征中每个评论的注意权重,W
hs
,W
he
是可训练权重,最终,通过加权协同表示,得到语义融合特征为:
[0034][0035]利用协同注意力机制对谣言文本情感特征和用户评论情感特征,通过计算相似矩阵,获取对应的权重分别生成协同表示,得到情感融合特征为:
[0036][0037]其进一步技术方案为:所述将语义融合特征和情感融合特征进行分类,以获得检测结果步骤中,检测结果的计算包括:
[0038][0039]其中,为softmax函数计算的概率值,W
f
为权重矩阵,b为偏置项。
[0040]第二方面,本实施例提供了一种基于双重情感感知的谣言检测装置,包括:获取嵌入单元,提取单元,结合单元及分类单元;
[0041]所述获取嵌入单元,用于获取谣言文本和用户评论,并对谣言文本和用户评论进行向量嵌入表示;
[0042]所述提取单元,用于根据向量嵌入表示,提取谣言文本语义特征及提取谣言文本情感特征和用户评论情感特征;
[0043]所述结合单元,用于将谣言文本语义特征与用户评论情感特征结合,以获得语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于双重情感感知的谣言检测方法,其特征在于,包括以下步骤:获取谣言文本和用户评论,并对谣言文本和用户评论进行向量嵌入表示;根据向量嵌入表示,提取谣言文本语义特征及提取谣言文本情感特征和用户评论情感特征;将谣言文本语义特征与用户评论情感特征结合,以获得语义融合特征,将谣言文本情感特征与用户评论情感特征结合,以获得情感融合特征;将语义融合特征和情感融合特征进行分类,以获得检测结果。2.根据权利要求1所述的基于双重情感感知的谣言检测方法,其特征在于,所述获取谣言文本和用户评论,并对谣言文本和用户评论进行向量嵌入表示步骤中,谣言文本中一条谣言由M个句子组成,其中每个句子s由m个词组成一条谣言对应的用户评论由n个句子组成,其中每个句子e由N个词组成3.根据权利要求2所述的基于双重情感感知的谣言检测方法,其特征在于,所述根据向量嵌入表示,提取谣言文本语义特征及提取谣言文本情感特征和用户评论情感特征步骤中,谣言文本语义特征的提取包括:谣言文本中的词与上下文具有关联性,具有较强的双向语义依赖,从词的两个方向建模获取谣言文本语义特征;其中,词嵌入的向量为前向隐藏状态为后向隐藏状态为词的特征表示为句子向量s∈
2d
×
m
;;;其中,用于衡量第t个单词对句子s的重要性,的计算公式如下:的计算公式如下:其中,是通过完全嵌入层从隐藏状态获得的,W
w
,b
w
是可训练的参数,u
w
为权重矩阵;谣言文本情感特征和用户评论情感特征的提取包括:谣言文本情感特征为U=[u1,u2,

u
M
],用户评论情感特征为V=[v1,v2,

v
N
],其中,对用户评论中某一行评论情感嵌入后的向量进行卷积操作:其中,W∈
λ
×
d
是可学习的参数矩阵,b是偏置项,偏ReLU是激活函数;对卷积得到h
j
进行最大池化,可得到每一句评论的情感特征:其中,通过CNN层使用2个过滤器λ∈{2,3},以获取多个特征,将不同的输出连接起来,
形成v
j
作为用户评论的单个表示,通过同样的方式,得到用户评论中每个评论的情感特征,形成用户评论的情感特征矩阵V=[v1,v2,

,v
N
]。4.根据权利要求3所述的基于双重情感感知的谣言检测方法,其特征在于,所述将谣言文本语义特征与用户评论情感特征结合,以获得语义融合特征,将谣言文本情感特征与用户评论情感特征结合,以获得情感融合特征步骤中,谣言文本表示为:S=[s1,s2,

,s
M
],用户评论情感特征表示为:E=[e1,e2,

,e
N
];首先计算相似矩阵F=tanh(EW
se
S),其中F=
N
×
M
,W
se

2d
×
2d
是可学习的参数矩阵,将相似矩阵作为一个特征,则谣言文本语义特征和用户评论情感特征的协同表示:H
s
=tanh(W
s
S+(W
e
E)F)H
e
=tanh(W
e
E+(W
s
S)F
T
)其中,W
s
,W
e

k
×
2d
为可学习的参数矩阵,谣言文本和用户评论情感特征的注意力权重为:为:其中,a
s
∈1×
M
,a
e
∈1×
N
分别是谣言文本中每个词和评论的情感特征中每个评论的注意权重,W
hs
,W
he
是可训练权重,最终,通过加权协同表示,得到语义融合特征为:利用协同注意力机制对谣言文本情感特征和用户评论情感特征,通过计算相似矩阵,获取对应的权重分别生成协同表示,得到情感融合特征为:5.根据权利要求4所述的基于双重情感感知的谣言检测方法,其特征在于,所述将语义融合特征和情感融合特征进行分类,以获得检测结果步骤中,检测结果的计算包括:其中,为softm...

【专利技术属性】
技术研发人员:葛晓义张明书刘佳魏彬
申请(专利权)人:中国人民武装警察部队工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1