一种不实信息检测方法技术

技术编号:39781743 阅读:11 留言:0更新日期:2023-12-22 02:25
本发明专利技术提供一种不实信息检测方法

【技术实现步骤摘要】
一种不实信息检测方法、装置与设备


[0001]本专利技术涉及信息系统检测
,尤其涉及一种不实信息检测方法

装置与设备


技术介绍

[0002]为了实现对不实信息的自动检测,机器学习方法被用来实现检测任务

这些方法的一般步骤是首先手动设计特征,然后将其输入到分类器中,通过分类器的输出来识别不实信息

然而,由于不实信息在信息系统中的传播特性不同,目前的方法大多没有考虑信息内容的多模态特征,导致信息的误报率和漏报率较高

[0003]因此,亟需开发一种能够高效

精准地检测不实信息的方法


技术实现思路

[0004]本专利技术提供一种不实信息检测方法

装置与设备,用以解决现有技术中不实信息检测精度不高的缺陷

[0005]本专利技术提供一种不实信息检测方法,包括:
[0006]S1:
获取历史信息数据集,所述历史信息数据集包括:信息内容和该信息内容对应的传播结构;其中,信息内容包括信息文本
W
和信息图片
I
;传播结构包括:原文本节点和转发文本的节点,以及节点与转发节点之间的转发关系构成的边;
[0007]S2:
根据所述信息内容和传播结构训练不实信息检测模型,得到训练好的不实信息检测模型;
[0008]S3:
将待检测的信息数据输入所述训练好的不实信息检测模型,通过该模型预测待检测信息数据的真实性

[0009]根据本专利技术提供的一种不实信息检测方法,所述
S2
包括:
[0010]S21
:基于多头注意力机制,根据所述信息内容,获得信息内容对应的多模态特征
M

[0011]S22
:根据所述传播结构,构建传播网络,并根据所述传播网络确定特征矩阵

邻接矩阵;其中,为点集合,用于表示原文本节点和转发文本的节点,为边集合,连边表示转发关系;
[0012]S23
:根据所述特征矩阵

邻接矩阵确定所述传播网络的传播特征
P

[0013]S24
:根据所述多模态特征
M
和所述传播特征
P
确定检测信息数据的真实性

[0014]根据本专利技术提供的一种不实信息检测方法,所述
S21
包括:
[0015]S211
:使用
BERT
模型对所述信息文本进行处理,得到信息文本表示;,表示信息文本中第
n
个单词;
[0016][0017]其中,表示信息文本中第
n
个单词对应的信息单词表示;
[0018]S212
:将所述信息图片
I
分割为若干信息图片块,根据所述信息图片块得到最终信
息图片表示;
[0019]S213
:将所述信息文本表示与所述最终信息图片表示拼接得到信息联合表示,然后将所述信息联合表示输入多头注意力机制模型,最终获得所述信息内容对应的多模态特征
M。
[0020]根据本专利技术提供的一种不实信息检测方法,所述
S212
包括:
[0021]将信息图片
I
分割为若干信息图片块,;表示信息图片
I
被分割的第
m
块信息图片块;
[0022]将所述若干信息图片块分别输入
ResNet

50
模型,分别得到每个信息图片块对应的信息图片块表示;
[0023][0024]其中,表示第
m
个信息图片块对应的信息图片块表示;
[0025]将所述每个信息图片块对应的信息图片块表示连接得到初始信息图片表示;
[0026][0027]将所述初始信息图片表示输入
Transformer
模型,得到所述最终信息图片表示
[0028][0029]其中为最终信息图片表示,

是训练过程中需要迭代的参数

[0030]根据本专利技术提供的一种不实信息检测方法,所述
S22
中所述特征矩阵的确定包括:
[0031]S221
:根据所述传播网络获取原文本节点对应的信息内容,并根据所述原文本节点对应的信息内容确定原文本节点的嵌入向量;
[0032]S222
:根据所述传播网络获取转发文本的节点对应的信息内容,并根据所述转发文本的节点对应的信息内容确定转发文本的嵌入向量;
[0033]S223
:根据所述原文本节点的嵌入向量和所述转发文本的嵌入向量,确定所述特征矩阵

[0034]根据本专利技术提供的一种不实信息检测方法,所述
S22
中所述邻接矩阵包括信息传播邻接矩阵
A
F
和信息扩散邻接矩阵
A
B

[0035]所述信息传播邻接矩阵
A
F
根据下式确定:
[0036][0037]其中,是原始邻接矩阵,
A
Drop
是从原始边集中随机采样边构建的邻接矩阵
;
[0038]所述信息扩散邻接矩阵
A
B
据下式确定:
[0039]。
[0040]根据本专利技术提供的一种不实信息检测方法,所述
S23
包括:
[0041]S231
:将所述特征矩阵

信息传播邻接矩阵
A
F
作为前向
GAT
模型的输入,更新所述传播网络中所有节点的表示,得到传播节点特征;
[0042]S232
:将所述特征矩阵

信息扩散邻接矩阵
A
B
作为后向
GAT
模型的输入,更新所述传播网络中所有节点的表示,得到分散节点特征;
[0043]S233
:连接所述传播节点特征和分散节点特征,获得所述传播网络的传播特征:
[0044][0045]。
[0046]根据本专利技术提供的一种不实信息检测方法,所述
S24
包括:
[0047]S241
:根据所述多模态特征
M
和所述传播特征
P
,确定亲和矩阵
[0048][0049]其中,是应该训练的权重;表示传播特征
P
的转置;
[0050]S242
:根据所述亲和矩阵学习所述多模态特征
M
的注意力图和所述传播特征
P
的注意力图;
[005本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种不实信息检测方法,其特征在于,包括:
S1:
获取历史信息数据集,所述历史信息数据集包括:信息内容和该信息内容对应的传播结构;其中,信息内容包括信息文本
W
和信息图片
I
;传播结构包括:原文本节点和转发文本的节点,以及节点与转发节点之间的转发关系构成的边;
S2:
根据所述信息内容和传播结构训练不实信息检测模型,得到训练好的不实信息检测模型;
S3:
将待检测的信息数据输入所述训练好的不实信息检测模型,通过该模型预测待检测信息数据的真实性
。2.
根据权利要求1所述的不实信息检测方法,其特征在于,所述
S2
包括:
S21
:基于多头注意力机制,根据所述信息内容,获得信息内容对应的多模态特征
M

S22
:根据所述传播结构,构建传播网络,并根据所述传播网络确定特征矩阵

邻接矩阵;其中,为点集合,用于表示原文本节点和转发文本的节点,为边集合,连边表示转发关系;
S23
:根据所述特征矩阵

邻接矩阵确定所述传播网络的传播特征
P

S24
:根据所述多模态特征
M
和所述传播特征
P
确定待检测信息数据的真实性
。3.
根据权利要求2所述的不实信息检测方法,其特征在于,所述
S21
包括:
S211
:使用
BERT
模型对所述信息文本进行处理,得到信息文本表示;,其中,表示信息文本中第
n
个单词;表示信息文本中第
n
个单词对应的信息单词表示;
S212
:将所述信息图片
I
分割为若干信息图片块,根据所述信息图片块得到最终信息图片表示;
S213
:将所述信息文本表示与所述最终信息图片表示拼接得到信息联合表示,然后将所述信息联合表示输入多头注意力机制模型,最终获得信息内容对应的所述多模态特征
M。4.
根据权利要求3所述的不实信息检测方法,其特征在于,所述
S212
包括:将信息图片
I
分割为若干信息图片块;;表示信息图片
I
被分割的第
m
块信息图片块;将所述若干信息图片块分别输入
ResNet

50
模型,分别得到每个信息图片块对应的信息图片块表示;其中,表示第
m
个信息图片块对应的信息图片块表示;将所有信息图片块对应的信息图片块表示连接得到初始信息图片表示;将所述初始信息图片表示输入
Transformer
模型,得到所述最终信息图片表示,其中为最终信息图片表示,

是训练过程中需要迭代的参数
。5.
根据权利要求2所述的不实信息检测方法,其特征在于,所述
S22
中所述特征矩阵的确定包括:
S221
:根据所述传播网络获取原文本节点对应的信息内容,并根据所述原文本节点对应的信息内容确定原文本节点的嵌入向量;
S222
:根据所述传播网络获取转发文本的节点对应的信息内容,并根据所述转发文本的节点对应的信息内容确定转发文本的嵌入向量;
S223
:根据所述原文本节点的嵌入向量和所述转发文本的嵌入向量,确定所述特征矩阵
。6.
根据权利要求2所述的不实信息检测方法,其特征在于,所述
S22
中所述邻接矩阵包括信息传播邻接矩阵
A
F
和信息扩散邻接矩阵
A
...

【专利技术属性】
技术研发人员:王震尹纾朱培灿李向华高超
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1