当前位置: 首页 > 专利查询>重庆大学专利>正文

基于级别感知注意GRU网络的社交网络谣言早期检测系统技术方案

技术编号:32755157 阅读:12 留言:0更新日期:2022-03-23 18:51
本发明专利技术公开基于级别感知注意GRU网络的社交网络谣言早期检测系统,包括新闻事件获取模块、转发级别度量模块、基本特征提取模块、推文特征表示模块和谣言检测模块;本发明专利技术提出了一种基于注意力机制的新系统,该系统根据节点的转发级别关注更重要的推文内容,通过基于GRU神经网络的分类器从时间序列中学习推文整体特征来预测标签(谣言或非谣言)。特征来预测标签(谣言或非谣言)。特征来预测标签(谣言或非谣言)。

【技术实现步骤摘要】
基于级别感知注意GRU网络的社交网络谣言早期检测系统


[0001]本专利技术涉及社交网络领域,具体是基于级别感知注意GRU网络的社交网络谣言早期检测系统。

技术介绍

[0002]社交网络近年来发展迅速,这给人们提供了获取更多信息的机会,然而,这也为谣言低成本的批量制造和传播提供了便利。谣言不仅严重误导人们的思想,损害人们的精神文明,而且对公共安全构成进一步的威胁。及早发现谣言,清理网络环境,迫在眉睫。
[0003]在社交网络中,检测延迟时间与谣言的生命周期近似线性。谣言传播的时间越长,越容易被用户发现,但是当谣言大规模传播,甚至造成了很大的破坏时,发现它的时间已经太晚了。因此,在谣言传播的早期阶段发现谣言(即:谣言早期检测)是至关重要和必要的。
[0004]现有关于社交网络中谣言检测的研究大多数依赖于文本或图像进行检测。然而,一些谣言为了使人们更信服,是通过模仿真实的新闻精心制造的。因此这些仅从文本或图像中提取特征的检测方法存在局限性。最近,一些研究人员发现了基于社交内容的谣言,但他们都忽视了谣言传播的拓扑结构。社交网络中的谣言由于用户的交互作用(如转发,关注,评论)形成了特定的传播结构。
[0005]虽然现有的谣言检测方法在谣言被大量转发后达到了较高的检测准确率,但它们有一个重要的问题:他们忽略了不同时间跨度和转发跳数的推文节点对推文的贡献不同。具体来说,首先,直接转发源推文的推文内容往往与新闻主题更相关,而间接转发的推文内容可能会偏离新闻主题;其次,社交平台的推荐系统使得在短时间内参与一个话题的用户通常对这些话题更感兴趣或更了解,所以他们往往有更多的发言权。因此需要给予推文内容不同程度的关注。

技术实现思路

[0006]本专利技术的目的是提供基于级别感知注意GRU网络的社交网络谣言早期检测系统,包括新闻事件获取模块、转发级别度量模块、基本特征提取模块、推文特征表示模块和谣言检测模块。
[0007]所述新闻事件获取模块获取社交网络中待检测新闻事件i的传播信息,并传输至转发级别度量模块。
[0008]所述转发级别度量模块根据新闻事件i的传播信息建立新闻事件i的传播结构,并计算传播网中每个节点的转发级别。所述转发级别度量模块将传播结构和每个节点的转发级别传输至基本特征提取模块、推文特征表示模块。
[0009]所述基本特征提取模块提取传播结构中每个节点的基本特征,并传播至推文特征表示模块。
[0010]所述推文特征表示模块根据每个节点的基本特征和转发级别更新节点特征,并传输至谣言检测模块。
[0011]所述谣言检测模块存储有谣言检测模型。
[0012]所述谣言检测模型对节点特征进行检测,得到节点推文检测结果。
[0013]进一步,所述传播结构记为G
i
=<V
i
,E
i
>,V
i
是节点集,E
i
是交互节点之间的边集。
[0014]进一步,传播结构中节点的转发级别如下所示:
[0015][0016]式中,表示节点的转发级别。d
l
为转发级别特征向量的维度。是连接操作。是将融合特征转换为高维向量空间的转换矩阵,是偏置。节点是偏置。节点表示推文的时间跨度。表示转发跳数。
[0017]进一步,所述基本特征包括用户特征和文本特征
[0018]所述文本特征如下所示:
[0019][0020]式中,为文本特征向量。d
c
为向量的维度。u为列数为的矩阵的第一个奇异向量。
[0021]其中,来自节点的句向量如下所示:
[0022][0023]式中,S
i
为来自节点的句子。a是超参数。p(w)为词向量w的估计概率。
[0024]进一步,所述推文特征表示模块根据每个节点的基本特征和转发级别更新节点特征的步骤包括:
[0025]1)将文本特征和用户特征结合,得到节点特征向量即:
[0026][0027]式中,为节点特征向量。d
t
是节点特征向量的维度。
[0028]2)基于节点的转发级别,计算节点特征向量的注意力评分即:
[0029][0030]式中,为权重。为偏置。
[0031]3)基于注意力评分对节点特征向量进行优化,得到优化后的节点特征即:
[0032][0033]式中,n为事件中所有节点的数量。
[0034]进一步,所述谣言检测模型包括节点前向传播模型和节点检测模型。
[0035]节点特征输入到所述节点前向传播模型中,输出节点的隐向量
[0036]节点的隐向量输入到节点预测模型中,输出节点推文的检测结果。所述节点推文检测结果包括节点推文是谣言、节点推文不是谣言。
[0037]进一步,所述节点前向传播模型如下:
[0038][0039][0040][0041][0042]式中,[W
*
,U
*
]为GRU内部的权重连接。表示节点的隐向量。

表示表示element

wise乘法。r
ij
表示重置门。表示更新门。
[0043]进一步,所述节点检测模型如下所示:
[0044][0045]式中,为阈值为k时的隐向量。W
i
和b
i
为输出层的权值和偏置。为输出。
[0046]进一步,所述节点检测模型的损失函数L(θ,k)如下所示:
[0047][0048]式中,为谣言分类器。Y为新闻标签集。
[0049]值得说明的是,本专利技术提出了一种基于GRU神经网络的具有级别感知注意机制的谣言早期检测模型(GLA4RD)。该系统首先提取传播结构中每个节点的的转发时间跨度和转发跳数,然后结合这两个特征来衡量节点的优先级别。同时,GLA4RD从文本内容和用户简介中提取文本特征向量和用户特征向量,并将它们组合为推文特征向量。为了促进谣言的早期检测,本专利技术还提出了一种新的级别感知注意机制来更新节点的特征向量。然后将这些特征按时间序列作为GRU分类器各单元的输入,最终的输出向量用于将新闻分类为谣言或非谣言。
[0050]本专利技术的技术效果是毋庸置疑的,本专利技术的有益效果如下:
[0051]1)本专利技术提出了一种基于GRU神经网络的具有级别感知注意机制的谣言早期检测模型(GLA4RD),它融合文本特征和用户特征,并根据传播过程对传播节点进行度量从而给予不同的关注。
[0052]2)本专利技术提出了一种层次感知的注意机制,从时间跨度和转发跳数中挖掘传播结构的隐藏特征,对节点特征进行更新。
[0053]3)本专利技术从给定推文的推文中提取文本特征和用户特征,生成每个推文的统一推文节点表示,同时本专利技术模拟新闻传播的传播结构,计算源推文与转发之间的时间跨度和转发跳数,并将其编码为推文转发节点的级别。总的来说,本专利技术提出了一种基于注意力机本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于级别感知注意GRU网络的社交网络谣言早期检测系统,其特征在于:包括所述新闻事件获取模块、转发级别度量模块、基本特征提取模块、推文特征表示模块和谣言检测模块。所述新闻事件获取模块获取社交网络中待检测新闻事件i的传播信息,并传输至转发级别度量模块;所述转发级别度量模块根据新闻事件i的传播信息建立新闻事件i的传播结构,并计算传播网中每个节点的转发级别;所述转发级别度量模块将传播结构和每个节点的转发级别传输至基本特征提取模块、推文特征表示模块;所述基本特征提取模块提取传播结构中每个节点的基本特征,并传播至推文特征表示模块;所述推文特征表示模块根据每个节点的基本特征和转发级别更新节点特征,并传输至谣言检测模块;所述谣言检测模块存储有谣言检测模型;所述谣言检测模型对节点特征进行检测,得到节点推文检测结果。2.根据权利要求1所述的基于级别感知注意GRU网络的社交网络谣言早期检测系统,其特征在于:所述传播结构记为G
i
=<V
i
,E
i
>,V
i
是节点集,E
i
是交互节点之间的边集。3.根据权利要求1所述的基于级别感知注意GRU网络的社交网络谣言早期检测系统,其特征在于:传播结构中节点的转发级别如下所示:式中,表示节点的转发级别;d
l
为转发级别特征向量的维度;是连接操作;是将融合特征转换为高维向量空间的转换矩阵,是偏置;节点是偏置;节点表示推文的时间跨度;表示转发跳数。4.根据权利要求1所述的基于级别感知注意GRU网络的社交网络谣言早期检测系统,其特征在于:所述基本特征包括用户特征和文本特征所述文本特征如下所示:式中,为文本特征向量;d
c
为向量的维度;u为列数为的矩阵的第一个奇异向量;其中,来自节点的句向量如下所示:式中,S
i
为来自节点的句子;a是超参数;p(w)为词w的估计概率。5.根据权...

【专利技术属性】
技术研发人员:王菀周魏文俊浩曾骏贺浩然刘林胡霖峰
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1