一种生成对抗多关系图网络的训练方法和检测方法技术

技术编号:29935334 阅读:47 留言:0更新日期:2021-09-04 19:10
本发明专利技术公开了一种用于检测机器账号的生成对抗多关系图网络模型的训练方法,所述训练方法包括:将平台建模成包含节点v和关系r的图其中,所述图的数量由所述关系r的类型数量确定;利用生成器G生成源节点v的虚假目标节点v

【技术实现步骤摘要】
一种生成对抗多关系图网络的训练方法和检测方法


[0001]本申请涉及机器账号检测领域,尤其涉及一种用于检测机器账号的生成对抗多关系图网络模型的训练方法和检测方法。

技术介绍

[0002]2016年以来已经发现了第三代机器账号,这些账号由于人为操作和自动化的混合程度加深,甚至从其他真实账号盗取信息,利用人工智能技术生成高可信的文本或图片,其行为更像真实人类账号,使得机器账号更加难以被检测识别。
[0003]目前已提出不少机器账号检测方法的专利。例如通过分析用户好友的社会关系来区分正常账户和机器人账户;使用对蜜罐账号的发帖和关注策略收集账号,从收集的账号中检测机器人账号,并利用检测出的机器人账号找到更多的机器人账号;从用户和消息两类实体出发,采用非负矩阵三分解的方法同时给出用户和消息的划分指示矩阵,检测异常用户和消息;使用K

均值(K

means)算法和DBSCAN结合的聚类算法对社交网络中的账户进行聚类,使用聚类后的聚类中心附近的数据和簇边界附近的数据来训练支持向量机分类器用训练得到的SVM分类器对机器账号进行检测;利用网络爬虫自动获取微博和其他社交网络用户数据,分成训练集和测试集,用训练集训练SVM算法的分类器,利用训练好的分类器对社交网络用户进行检测。
[0004]然而上述现有技术面临以下问题:依赖大量数据样本,检测模型提出不及时;现有检测方案利用收集到的机器账号数据进行分析训练,进而提出对应训练集的检测模型并获得较好的效果,但是这些方法的泛化性较差。
>
技术实现思路

[0005](一)要解决的技术问题
[0006]针对上述现有技术中存在的问题,本专利技术提供了一种用于检测机器账号的生成对抗多关系图网络模型的训练方法和一种基于生成对抗多关系图网络模型的机器账号的检测方法,旨在降低对数据样本的依赖,并充分利用账号之间不同交互操作所形成的不同类型的关系,丰富对账号检测的维度,提高机器账号检测的泛化性。
[0007](二)技术方案
[0008]本专利技术公开了一种用于检测机器账号的生成对抗多关系图网络模型的训练方法,其中生成对抗多关系图网络模型包括生成器G、连接关系判别器D和分类器,上述训练方法包括:将不同平台上的账号建模成节点v;将账号之间的交互操作建模成关系r,其中上述关系r的数量由账号之间交互操作的类型数量确定;将不同平台建模成包含节点和关系的图其中,上述图的数量由上述关系r的数量确定;采样成对相连的节点对(v,u),利用上述生成器G生成源节点v的虚假目标节点v
t
;将节点对(v,u)和(v,v
t
)分别输入到上述连接关系判别器D中,用于训练上述连接关系判别器D,其中,当上述连接关系判别器D能够正确区分节点对(v,u)和(v,v
t
)的连接关系后,停止对上述连接关系判别器D的训练;用训练好的上
述连接关系判别器D推理上述图中的节点对,确定上述节点对的连接关系,进而更新图的结构;选取上述图中的一个节点,选择上述节点将被聚合的邻居节点;在同种关系下,聚合上述节点的邻居节点得到同种关系下的图嵌入向量;将上述节点在不同关系下的图嵌入向量进行向量运算得到不同关系下的上述节点的表征向量;将上述节点的表征向量输入到上述分类器中,根据上述生成对抗多关系图网络模型的损失函数,反向传播更新生成对抗多关系图网络模型的参数,当上述损失函数的输出的值不再发生变化后,则停止对生成对抗多关系图网络的训练,得到训练好的生成对抗多关系图网络模型。
[0009]根据上述的训练方法,其中利用上述生成器G生成源节点v的虚假目标节点v
t
,包括:将源节点v和潜在变量z相加,其中上述潜在变量z符合多元正态分布,具体表达式为其中,d等于源节点的特征向量维度;将相加后的结果输入到上述生成器G中生成上述虚假目标节点v
t

[0010]根据上述的训练方法,其中上述生成器G的具体表达式为G(v;θ
G
)=f(z;θ
f
),其中f使用多层感知机实现,θ
f
是f的参数,v是源节点,θ
G
是上述生成器的参数;上述生成器G的损失函数定义为其中上述生成器G的参数θ
G
通过最小化进行优化。
[0011]根据上述的训练方法,其中更新图的结构包括:在上述连接关系判别器D判断节点对之间存在连接的情况下,则在节点对之间建立连接关系;在上述连接关系判别器D判断节点对之间不存在连接的情况下,则在节点对之间删除连接关系;
[0012]上述连接关系判别器D被定义为其中f使用多层感知机实现,θ
f
是f的参数,θ
D
是连接关系判别器D的参数;
[0013]上述连接关系判别器D的损失函数定义为其中是正例采样时的上述连接关系判别器D的损失函数,具体形式为是负例采样时上述连接关系判别器D的损失函数,具体形式为
[0014]其中上述正例采样即采样的节点对(v,u)在图中是实际存在边连接的;
[0015]其中上述负例采样即对于一个给定的节点v
t
表示为v的虚假邻居节点,由上述生成器生成,即v
t
~G(v;θ
G
),则(v,v
t
)称为负例采样;采用负例采样时,上述连接关系判别器的损失函数为
[0016]根据上述的训练方法,其中选择上述节点将被聚合的邻居节点,包括:计算两个节点之间的L1范数距离;根据上述L1范数距离,计算两个节点的相似度;选择相似度大于选择阈值的节点作为上述节点将被聚合的邻居节点。
[0017]根据上述的训练方法,其中上述L1范数距离的计算公式为:其中v

是节点v的邻居节点,f
(l)
代表在关系r下第l层的多层感知机,σ是非线性激活函数tanh,表示节点v在l

1层的嵌入
向量;
[0018]其中上述两个节点的相似度的计算公式为:
[0019]其中上述f
(l)
的损失函数为交叉损失函数,计算公式为:其中y
v
是节点v的标签,y
v
∈{0,1},0代表节点为正常账号,1代表节点为机器账号。
[0020]根据上述的训练方法,其中上述同种关系下的图嵌入向量的计算公式为:其中是节点v在关系r下第l层的嵌入向量,v

是节点v的邻居节点,是对于节点v的所有在关系r下抽取的邻居节点的嵌入向量取均值,ReLU是线性整流函数;其中上述表征向量的计算公式为:其中是上述节点v在l层得到的最终的嵌入向量,是从上一层中得到的上述节点v的嵌入向量,是设置的邻居过滤阈值。
[0021]根据上述的训练方法,其中上述损失函数计算公式为:其中是生成对抗多关系图神经网络的损失函数,是交叉损失函数;
[0022]根据上述的训练方法,其中上述本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于检测机器账号的生成对抗多关系图网络模型的训练方法,其中生成对抗多关系图网络模型包括生成器G、连接关系判别器D和分类器,所述训练方法包括:将不同平台上的账号建模成节点v;将账号之间的交互操作建模成关系r,其中所述关系r的数量由账号之间交互操作的类型数量确定;将不同平台建模成包含节点和关系的图其中,所述图的数量由所述关系r的数量确定;采样成对相连的节点对(v,u),利用所述生成器G生成源节点v的虚假目标节点v
t
;将节点对(v,u)和(v,v
t
)分别输入到所述连接关系判别器D中,用于训练所述连接关系判别器D,其中,当所述连接关系判别器D能够正确区分节点对(v,u)和(v,v
t
)的连接关系后,停止对所述连接关系判别器D的训练;用训练好的所述连接关系判别器D推理所述图中的节点对,确定所述节点对的连接关系,进而更新图的结构;选取所述图中的一个节点,选择所述节点将被聚合的邻居节点;在同种关系下,聚合所述节点的邻居节点得到同种关系下的图嵌入向量;将所述节点在不同关系下的图嵌入向量进行向量运算得到不同关系下的所述节点的表征向量;将所述节点的表征向量输入到所述分类器中,根据所述生成对抗多关系图网络模型的损失函数,反向传播更新生成对抗多关系图网络模型的参数,当所述损失函数的输出的值不再发生变化后,则停止对生成对抗多关系图网络的训练,得到训练好的生成对抗多关系图网络模型。2.根据权利要求1所述的训练方法,其中利用所述生成器G生成源节点v的虚假目标节点v
t
,包括:将源节点v和潜在变量z相加,其中所述潜在变量z符合多元正态分布,具体表达式为其中,d等于源节点的特征向量维度;将相加后的结果输入到所述生成器G中生成所述虚假目标节点v
t
。3.根据权利要求1所述的训练方法,其中所述生成器G的具体表达式为G(v;θ
G
)=f(z;θ
f
),其中f使用多层感知机实现,θ
f
是f的参数,v是源节点,θ
G
是所述生成器的参数;所述生成器G的损失函数定义为其中所述生成器G的参数θ
G
通过最小化进行优化。4.根据权利要求1所述的训练方法,其中更新图的结构包括:在所述连接关系判别器D判断节点对之间存在连接的情况下,则在节点对之间建立连接关系;在所述连接关系判别器D判断节点对之间不存在连接的情况下,则在节点对之间删除连接关系;所述连接关系判别器D被定义为其中f使用多层感知
机实现,θ
f
是f的参数,θ
D
是连接关系判别器D的参数;所述连接关系判别器D的损失函数定义为其中是正例采样时的所述连接关系判别器D的损失函数,具体形式为具体形式为是负例采样时所述连接关系判别器D的损失函数,...

【专利技术属性】
技术研发人员:杨英光谢海永吴曼青
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1