【技术实现步骤摘要】
一种基于传播结构动态保持的网络谣言检测方法
[0001]本专利技术属于网络谣言检测领域,涉及一种基于传播结构动态保持的网络谣言检测方法
。
技术介绍
[0002]与传统的信息媒介相比,网络媒体上的信息流通具有门槛低
、
规模大
、
传播迅速
、
实时性强
、
覆盖面广等特点,这使得网络谣言的形成与发酵异常容易
。
因此,准确
、
高效地检测网络谣言对于营造良好网络空间至关重要
。
[0003]一方面,网络谣言具有明确的发展和演变机理,在酝酿期
、
爆发期
、
蔓延期和平息期等不同阶段均对应不同的传播特点
。
为了准确刻画网络谣言的演化机理,捕捉网络谣言的传播模式,应当针对谣言自形成到平息所处的各个阶段分别建模并挖掘相邻阶段的动态演进特征,而非直接针对整个谣言传播事件进行建模,忽略不同传播阶段所呈现的不同发展状态
。
另一方面,网络谣言检测一般考虑信息内容和传播拓扑两个方面的特征
。
[0004]然而,随着众包等在线协作方式的兴起,网络谣言相比以前更具隐蔽性,发布者和传播者会对内容本身进行针对性修改,使得信息真假难辨从而规避传统的检测方案
。
此外,由于不同的网络谣言在传播拓扑上差异较大,现有基于传播树统计特征(如树的广度与深度)的方案难以准确刻画谣言传播树的局部特征与全局特征,检测效果并不理想
。 ...
【技术保护点】
【技术特征摘要】
1.
一种基于传播结构动态保持的网络谣言检测方法,其特征在于,包括如下步骤:步骤
1. 获取包含信息传播树和传播内容流的信息传播事件;步骤
2. 设定时间间隔将得到的信息传播事件划分为多个传播阶段;步骤
3. 针对每个传播阶段,分别抽取该传播阶段的内容特征和整体结构特征;步骤
4. 将每个传播阶段的内容特征和整体结构特征进行拼接,获得每个传播阶段的整体特征,再将连续传播阶段的整体特征序列视作时间序列,并基于时间序列建模方法构建最终的网络谣言检测模型;步骤
5. 基于神经网络二分类方式训练网络谣言检测模型;步骤
6. 对于给定的来自网络空间的任意信息传播事件,利用训练好的网络谣言检测模型判断信息传播事件的初始信息是否为网络谣言
。2.
根据权利要求1所述的基于传播结构动态保持的网络谣言检测方法,其特征在于,所述步骤1具体为:针对网络谣言传播事件,通过爬虫程序获取网络谣言的初始信息链接后,爬取网络谣言的初始信息以及相关的转发与评论信息;针对真实信息传播事件,通过爬虫程序直接爬取真实信息的初始信息以及相关的转发与评论信息;对于每一类信息传播事件中的每个样本,将初始信息以及相关的转发与评论信息按时间先后顺序分别形成信息传播树和传播内容流
。3.
根据权利要求1所述的基于传播结构动态保持的网络谣言检测方法,其特征在于,所述步骤2具体为:针对每一类信息传播事件中的每个样本,选取时间间隔
Δ
t
,将信息传播树和传播内容流划分为
s
个传播阶段,其中位置相对靠后的传播阶段完全覆盖位置相对靠前的传播阶段
。4.
根据权利要求1所述的基于传播结构动态保持的网络谣言检测方法,其特征在于,所述步骤3具体为:针对内容特征,利用双向长短时记忆网络
Bi
‑
LSTM
学习每一条信息的嵌入表示,即对于任意一条信息
m
i
,通过
Bi
‑
LSTM
将其映射为
l
维向量表示
x
i
∈R
l
;定义第
i
个传播阶段为
S
i
,将传播阶段
S
i
的内容流视作时间序列,再次利用
Bi
‑
LSTM
将传播阶段
S
i
的内容流映射为
l
维向量表示 ∈R
l
;针对整体结构特征,首先利用图注意力网络
GAT
学习原始传播树的节点表示;设传播阶段
S
i
的原始传播树为
G(S
i
)
,设第
n
层节点的嵌入表示矩阵为
h
n
,则第
n+1
层节点的嵌入表示矩阵按如下公式获得:
h
n+1
=GAT(h
n
, G(S
i
))
;当
n=0
时,令
h0为随机初始化的
N
×
l
维矩阵,
N
表示原始传播树
G(S
i
)
的节点数量;对传播阶段
S
i
的原始传播树
G(S
i
)
进行结构无损的标准化操作,即将原始传播树
G(S
i
)
通过定位
、
移除和旋转操作转换为标准的二叉树;使用元树路径对二叉树的全局结构进行表达,利用深度
d≤3
的元树构造元树路径;通过独热编码为构造的元树路径按照广度优先遍历进行编码,获得元树路径编码矩阵,随后利用卷积神经网络
CNN
对编码矩阵进行卷积操作,自上而下抽取编码矩阵的结构特征,获得编码矩阵的全局结构特征;在
CNN
中设置
k
个卷积核,每个卷积核各自独立地运行,设
k
个卷积核学习到的全局结构特征分别为
q1、q2、
…
、q
k
;
通过如下方式计算全局结构特征
q
i
对于原始传播树中任意节点
z
j
的影响概率
p(z
j
|q
i
)
:;其中,
z
j
表示原始传播树中节点
z
j
的嵌入表示,
w
i
表示在全局结构特征
q
i
下待学习的权重向量,
w
iT
表示权重向量的转置,
【专利技术属性】
技术研发人员:胥帅,许建秋,李博涵,关东海,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。