本发明专利技术公开了一种缓解了过平滑的图神经网络套利欺诈识别方法,包括以下流程:1.根据业务系统中的用户行为日志构建用户关系拓扑图,如根据相同IP信息或转账关系构建无向图网络;2.根据历史累计的套利欺诈正负样本,为图中节点打上标签,所有节点分为有标签和无标签两种,有标签节点又分为套利用户节点和正常用户节点;3.在拓扑图上进行k次图卷积的信息聚合操作。本发明专利技术通过重构图的方式缓解了网络中因节点层数加深导致的过平滑问题,提升了节点表征精度;同时,在重构拓扑图的基础上,根据节点的邻居节点数,自适应的调整重构方式,缓解了拓扑图的噪声问题,进一步提升节点分类效果,提升套利欺诈识别精度。提升套利欺诈识别精度。提升套利欺诈识别精度。
【技术实现步骤摘要】
一种缓解了过平滑的图神经网络套利欺诈识别方法
[0001]本专利技术涉及互联网风控领域,特别涉及一种缓解了过平滑的图神经网络套利欺诈识别方法。
技术介绍
[0002]近年来互联网公司和各类电子业务不断发展,在给用户带来便利的同时,也出现了很多影响行业发展的黑色产业。其中一个较为突出的问题就是营销套利欺诈。它主要是指不法分子利用互联网公司的营销活动,在注册、交易等环节中恶意套取优惠金额的行为。这些套利欺诈手段不仅给互联网公司造成巨大损失,同时也影响了其他正常用户享受优惠活动的机会,影响行业发展。
[0003]传统识别套利欺诈的方法主要是依靠专家经验,随着套利分子欺诈手段的复杂化,互联网公司也开始使用更为智能化的深度学习模型来进行套利欺诈的识别。其中一种就是通过拓扑图描绘用户的关联关系,并使用图神经网络的方法进行套利用户的判断。
[0004]现有通过图神经网络进行套利欺诈识别的方法通常是将用户作为节点,将用户的交互关系作为边,用图卷积的方式进行节点表征,再对节点分类预测。这些方法存在以下不足:1)由于图神经网络的特殊性,通常只能使用浅层网络聚合邻居信息以避免过平滑问题,导致学习的节点信息不够充分,而若网络层数过深又导致过平滑,使得节点收敛到同一点无法区分;2)网络拓扑图中通常存在边信息的噪声,影响图结构,从而影响节点间的信息传递导致节点表征精度下降。
技术实现思路
[0005]本专利技术要解决的技术问题是克服现有技术的缺陷,提供一种缓解了过平滑的图神经网络套利欺诈识别方法。
[0006]本专利技术提供了如下的技术方案:
[0007]本专利技术提供一种缓解了过平滑的图神经网络套利欺诈识别方法,包括以下流程:
[0008]一、根据业务系统中的行为日志构建用户关系拓扑图,如将具有相同的设备IP信息或用户的转账交互关系构建设备关系无向图网络G(V,E),其中V代表用户节点集合,E表示边集合;
[0009]二、根据历史累计的套利欺诈用户正负样本,为网络图G的节点打上正负标签;这样图中节点将分为有标签(V
labeled
)和无标签(V
unlabeled
)两种节点,有标签节点又分为已知套利用户节点V
labeled
=1和已知非套利用户节点V
labeled
=0;
[0010]三、为网络图G生成对应的邻接矩阵A和度矩阵D,初始化生成节点表示向量查询表H:
[0011][0012]其中都是d维的行向量,N表示用户节点总数;
[0013]在拓扑图上进行k次图卷积的信息聚合操作,前k
‑
1次卷积的向量表示为:
[0014]H
l
=ReLU(D
‑
1/2
AD
‑
1/2
H
l
‑1W
l
)
[0015]式中l表示卷积层层数,H
l
表示第l层卷积后节点的表示向量查询表,W
l
表示第l轮的参数矩阵,是一个d维的方阵;
[0016]最后一层的卷积公式如下:
[0017]H
k
=Softmax(D
‑
1/2
AD
‑
1/2
H
l
‑1W
k
)
[0018]其中W
k
是一个d*2维的矩阵,H
k
是N*2维矩阵,表示对应用户是否是套利欺诈用户的概率;
[0019]四、利用有标签的节点进行交叉熵损失函数计算损失,并利用Adam算法更新权重;
[0020]五、上述步骤四
‑
五为一轮训练,每轮训练后根据当前节点情况进行网络图的自适应重构,以缓解过平滑问题和信息噪声问题,方式如下:
[0021]a)对前k
‑
1次卷积后每个节点获得k个表示向量,通过average pooling得到表示向量
[0022][0023]b)计算节点i、节点j间距离Dis
ij
;
[0024][0025]c)当节点i、j有连接时,为节点i、j计算距离的自适应阈值
[0026][0027]其中,d
i
、d
j
表示节点i和j的度,τ
‑
是一个自定义的缩放参数;考虑到邻居越多的节点越容易产生过平滑,因此它更倾向于减少连接;只要当节点i、j的距离Dis
ij
小于该阈值,则认为原本的连接可能为噪声连接;对于所有满足上述条件的节点对,随机抽取num
‑
,删除连接;
[0028]d)当节点i、j没有连接时,为节点i、j计算距离的自适应阈值
[0029][0030]其中,d
i
、d
j
表示节点i和j的度,τ
+
是一个自定义的缩放参数;考虑到邻居越少的节点更倾向于增加连接;对于所有距离Dis
ij
大于该阈值的节点对,随机抽取num
+
个节点对,增加连接;
[0031]e)图重构后,重新计算邻接矩阵A和度矩阵D,按步骤四至五进行新一轮训练。
[0032]与现有技术相比,本专利技术的有益效果如下:
[0033]本专利技术通过重构图的方式缓解了网络中因节点层数加深导致的过平滑问题,提升了节点表征精度;同时,在重构拓扑图的基础上,根据节点的邻居节点数,自适应的调整重构方式,缓解了拓扑图的噪声问题,进一步提升节点分类效果,提升套利欺诈识别精度。
附图说明
[0034]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:
[0035]图1是本专利技术的整体流程示意图;
[0036]图2是本专利技术的构建用户关系拓扑图
[0037]图3是本专利技术的实施例示意图。
具体实施方式
[0038]以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。
[0039]实施例1
[0040]本专利技术如图1
‑
3所示,本专利技术提供一种缓解了过平滑的图神经网络套利欺诈识别方法,包括以下流程:
[0041]一、根据业务系统中的行为日志构建用户关系拓扑图,如图2;如将具有相同的设备IP信息或用户的转账交互关系构建设备关系无向图网络G(V,E),其中V代表用户节点集合,E表示边集合;
[0042]二、根据历史累计的套利欺诈用户正负样本,为网络图G的节点打上正负标签;这样图中节点将分为有标签(V
labeled
)和无标签(V
unlabeled
)两种节点,有标签节点又分为已知套利用户节点V
labeled
=1本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种缓解了过平滑的图神经网络套利欺诈识别方法,其特征在于,包括以下流程:一、根据业务系统中的行为日志构建用户关系拓扑图,如将具有相同的设备IP信息或用户的转账交互关系构建设备关系无向图网络G(V,E),其中V代表用户节点集合,E表示边集合;二、根据历史累计的套利欺诈用户正负样本,为网络图G的节点打上正负标签;这样图中节点将分为有标签(V
labeled
)和无标签(V
unlabeled
)两种节点,有标签节点又分为已知套利用户节点V
labeled
=1和已知非套利用户节点V
labeled
=0;三、为网络图G生成对应的邻接矩阵A和度矩阵D,初始化生成节点表示向量查询表H:其中都是d维的行向量,N表示用户节点总数;在拓扑图上进行k次图卷积的信息聚合操作,前k
‑
1次卷积的向量表示为:H
l
=ReLU(D
‑
1/2
AD
‑
1/2
H
l
‑1W
l
)式中l表示卷积层层数,H
l
表示第l层卷积后节点的表示向量查询表,W
l
表示第l轮的参数矩阵,是一个d维的方阵;最后一层的卷积公式如下:H
k
=Softmax(D
‑
1/2
AD
‑
1/2
H
l
‑1W
k
)其中W
k
...
【专利技术属性】
技术研发人员:何越平,傅剑文,陈心童,
申请(专利权)人:天翼电子商务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。