一种基于传播结构动态保持的网络谣言检测方法技术

技术编号:39488163 阅读:9 留言:0更新日期:2023-11-24 11:08
本发明专利技术公开了一种基于传播结构动态保持的网络谣言检测方法,其包括如下步骤:获取包含信息传播树和传播内容流的信息传播事件;设定时间间隔将信息传播事件划分为多个传播阶段;抽取每个信息传播阶段的内容特征和整体结构特征;基于时间序列方法建模连续的传播阶段;基于神经网络二分类方式训练网络谣言检测模型;利用训练好的模型判断任意信息传播事件的初始信息是否为网络谣言

【技术实现步骤摘要】
一种基于传播结构动态保持的网络谣言检测方法


[0001]本专利技术属于网络谣言检测领域,涉及一种基于传播结构动态保持的网络谣言检测方法


技术介绍

[0002]与传统的信息媒介相比,网络媒体上的信息流通具有门槛低

规模大

传播迅速

实时性强

覆盖面广等特点,这使得网络谣言的形成与发酵异常容易

因此,准确

高效地检测网络谣言对于营造良好网络空间至关重要

[0003]一方面,网络谣言具有明确的发展和演变机理,在酝酿期

爆发期

蔓延期和平息期等不同阶段均对应不同的传播特点

为了准确刻画网络谣言的演化机理,捕捉网络谣言的传播模式,应当针对谣言自形成到平息所处的各个阶段分别建模并挖掘相邻阶段的动态演进特征,而非直接针对整个谣言传播事件进行建模,忽略不同传播阶段所呈现的不同发展状态

另一方面,网络谣言检测一般考虑信息内容和传播拓扑两个方面的特征

[0004]然而,随着众包等在线协作方式的兴起,网络谣言相比以前更具隐蔽性,发布者和传播者会对内容本身进行针对性修改,使得信息真假难辨从而规避传统的检测方案

此外,由于不同的网络谣言在传播拓扑上差异较大,现有基于传播树统计特征(如树的广度与深度)的方案难以准确刻画谣言传播树的局部特征与全局特征,检测效果并不理想

[0005]归结起来,现有网络谣言检测方案存在三个方面不足:
1.
现有方案一般针对网络谣言的整个传播事件(即初始信息及其评论

转发信息)进行建模,忽略了谣言在不同传播阶段具有的内容和结构特征;
2.
现有方案针对谣言的传播拓扑,主要提取传播树的统计特征(如树的广度与深度),然而不同的网络谣言在传播拓扑上差异较大,这种浅层的统计特征难以真正刻画网络谣言的传播结构;
3.
现有方案一般直接利用图神经网络学习谣言传播树的节点特征,这种方式仅能学习到节点及其邻居所具有的局部特征,难以学习到谣言传播树的全局特征

[0006]综上所述,现有实现方案没有针对网络谣言传播事件进行分阶段动态建模,难以兼顾谣言传播树的局部与全局结构特征,针对网络谣言的检测性能并不理想


技术实现思路

[0007]本专利技术的目的在于提出一种基于传播结构动态保持的网络谣言检测方法,该方法能够针对网络谣言传播事件进行分阶段动态建模,同时能够兼顾谣言传播树的局部与全局结构特征,以提高具有阶段性传播特点的网络谣言的检测性能

[0008]本专利技术为了实现上述目的,采用如下技术方案:一种基于传播结构动态保持的网络谣言检测方法,包括如下步骤:步骤
1. 获取包含信息传播树和传播内容流的信息传播事件;步骤
2. 设定时间间隔将得到的信息传播事件划分为多个传播阶段;步骤
3. 针对每个传播阶段,分别抽取该传播阶段的内容特征和整体结构特征;
步骤
4. 将每个传播阶段的内容特征和整体结构特征进行拼接,获得每个传播阶段的整体特征,再将连续传播阶段的整体特征序列视作时间序列,并基于时间序列建模方法构建最终的网络谣言检测模型;步骤
5. 基于神经网络二分类方式训练网络谣言检测模型;步骤
6. 对于给定的来自网络空间的任意信息传播事件,利用训练好的网络谣言检测模型判断信息传播事件的初始信息是否为网络谣言

[0009]本专利技术具有如下优点:如上所述,本专利技术述及了一种基于传播结构动态保持的网络谣言检测方法,该方法一方面将网络空间中的信息传播事件按时间划分为不同的演化阶段,考虑内容特征和结构特征对信息传播事件进行动态建模;另一方面,针对每一传播阶段的原始传播树进行结构无损的标准化转换,以解决网络谣言传播结构差异大的问题,并通过元树路径学习标准化二叉树的全局传播结构特征,同时兼顾传播过程的全局结构特征和局部结构特征,在不同传播阶段均可保持谣言的传播结构,因而,本专利技术能够有效检测具有阶段性传播特点的网络谣言

附图说明
[0010]图1为本专利技术实施例中基于传播树结构动态保持的网络谣言检测方法流程图

[0011]图2为本专利技术实施例中信息传播树和传播内容流示意图

[0012]图3为本专利技术实施例中网络谣言检测模型结构图

[0013]图4为本专利技术实施例中结构无损的传播树标准化转换过程示意图

[0014]图5为本专利技术实施例中深度
d≤3
的元树集合示意图

[0015]图6为本专利技术实施例中针对二叉树构造元树路径的示意图

[0016]图7为本专利技术实施例中基于
CNN
的全局传播结构特征学习示意图

具体实施方式
[0017]下面结合附图以及具体实施方式对本专利技术作进一步详细说明:本专利技术针对具有阶段性传播特点的网络谣言,设计了一种基于传播树结构动态保持的网络谣言检测方法,该方法在对信息传播事件进行阶段划分的基础上,首先建模不同传播阶段的内容与传播特征,在传播特征建模上兼顾信息传播树的局部与全局结构特征,随后将各传播阶段视作时间序列,利用时序神经网络捕捉相邻传播阶段的时序依赖关系,最后利用汇总的多阶段建模结果对传播事件进行二分类,判断传播事件的初始信息是网络谣言或真实信息

[0018]基于以上专利技术构思,下面对基于传播树结构动态保持的网络谣言检测方法进行详细说明

如图1所示,基于传播树结构动态保持的网络谣言检测方法,包括如下步骤:步骤
1. 获取包含信息传播树和传播内容流的信息传播事件

[0019]针对网络谣言传播事件,通过爬虫程序获取网络谣言的初始信息链接后,爬取网络谣言的初始信息以及相关的转发与评论信息;针对真实信息传播事件,通过爬虫程序直接爬取真实信息的初始信息以及相关的转发与评论信息

[0020]以新浪微博这一中文在线社交网络为例,具体阐述如何获取包含传播树和内容流
的信息传播事件集合(包含网络谣言和真实信息)

[0021]针对网络谣言传播事件,新浪微博社区管理中心页面展示了经由用户举报且官方判定为不实信息的网络谣言,并在公示页面中给出了初始信息的访问链接

[0022]对于任一网络谣言,通过 Scrapy 爬虫程序获取初始信息链接后,爬取初始信息以及相关的转发与评论信息(仅爬取被微博社区管理中心标记为网络谣言时间点之前的信息)

[0023]针对真实信息传播事件,则通过 Scrapy 爬虫程序直接从新浪微博认证的官方账号中爬取,对于任一真实信息,爬取初始信息以及相关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于传播结构动态保持的网络谣言检测方法,其特征在于,包括如下步骤:步骤
1. 获取包含信息传播树和传播内容流的信息传播事件;步骤
2. 设定时间间隔将得到的信息传播事件划分为多个传播阶段;步骤
3. 针对每个传播阶段,分别抽取该传播阶段的内容特征和整体结构特征;步骤
4. 将每个传播阶段的内容特征和整体结构特征进行拼接,获得每个传播阶段的整体特征,再将连续传播阶段的整体特征序列视作时间序列,并基于时间序列建模方法构建最终的网络谣言检测模型;步骤
5. 基于神经网络二分类方式训练网络谣言检测模型;步骤
6. 对于给定的来自网络空间的任意信息传播事件,利用训练好的网络谣言检测模型判断信息传播事件的初始信息是否为网络谣言
。2.
根据权利要求1所述的基于传播结构动态保持的网络谣言检测方法,其特征在于,所述步骤1具体为:针对网络谣言传播事件,通过爬虫程序获取网络谣言的初始信息链接后,爬取网络谣言的初始信息以及相关的转发与评论信息;针对真实信息传播事件,通过爬虫程序直接爬取真实信息的初始信息以及相关的转发与评论信息;对于每一类信息传播事件中的每个样本,将初始信息以及相关的转发与评论信息按时间先后顺序分别形成信息传播树和传播内容流
。3.
根据权利要求1所述的基于传播结构动态保持的网络谣言检测方法,其特征在于,所述步骤2具体为:针对每一类信息传播事件中的每个样本,选取时间间隔
Δ
t
,将信息传播树和传播内容流划分为
s
个传播阶段,其中位置相对靠后的传播阶段完全覆盖位置相对靠前的传播阶段
。4.
根据权利要求1所述的基于传播结构动态保持的网络谣言检测方法,其特征在于,所述步骤3具体为:针对内容特征,利用双向长短时记忆网络
Bi

LSTM
学习每一条信息的嵌入表示,即对于任意一条信息
m
i
,通过
Bi

LSTM
将其映射为
l
维向量表示
x
i
∈R
l
;定义第
i
个传播阶段为
S
i
,将传播阶段
S
i
的内容流视作时间序列,再次利用
Bi

LSTM
将传播阶段
S
i
的内容流映射为
l
维向量表示 ∈R
l
;针对整体结构特征,首先利用图注意力网络
GAT
学习原始传播树的节点表示;设传播阶段
S
i
的原始传播树为
G(S
i
)
,设第
n
层节点的嵌入表示矩阵为
h
n
,则第
n+1
层节点的嵌入表示矩阵按如下公式获得:
h
n+1
=GAT(h
n
, G(S
i
))
;当
n=0
时,令
h0为随机初始化的
N
×
l
维矩阵,
N
表示原始传播树
G(S
i
)
的节点数量;对传播阶段
S
i
的原始传播树
G(S
i
)
进行结构无损的标准化操作,即将原始传播树
G(S
i
)
通过定位

移除和旋转操作转换为标准的二叉树;使用元树路径对二叉树的全局结构进行表达,利用深度
d≤3
的元树构造元树路径;通过独热编码为构造的元树路径按照广度优先遍历进行编码,获得元树路径编码矩阵,随后利用卷积神经网络
CNN
对编码矩阵进行卷积操作,自上而下抽取编码矩阵的结构特征,获得编码矩阵的全局结构特征;在
CNN
中设置
k
个卷积核,每个卷积核各自独立地运行,设
k
个卷积核学习到的全局结构特征分别为
q1、q2、

、q
k

通过如下方式计算全局结构特征
q
i
对于原始传播树中任意节点
z
j
的影响概率
p(z
j
|q
i
)
:;其中,
z
j
表示原始传播树中节点
z
j
的嵌入表示,
w
i
表示在全局结构特征
q
i
下待学习的权重向量,
w
iT
表示权重向量的转置,

【专利技术属性】
技术研发人员:胥帅许建秋李博涵关东海
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1