一种数据处理的方法、装置以及存储介质制造方法及图纸

技术编号:35242003 阅读:16 留言:0更新日期:2022-10-19 09:47
本申请公开了一种数据处理的方法、装置以及存储介质。通过获取交易信息;然后将交易对象和交易平台作为网络节点,并基于交易信息对网络节点进行连接,以得到异构网络;并在异构网络中进行节点游走,以得到元路径;并根据元路径进行向量表示,以得到节点向量;进而基于节点向量之间的距离对交易对象进行分类,以得到目标类型的对象。从而实现基于人工智能的商户识别过程,由于交易平台的分布广泛,保证了交易对象的覆盖量,且识别过程中涉及的向量表示为基于交易行为的发生进行的,提高了向量表示的准确性,并提高了对象类型识别的准确性。并提高了对象类型识别的准确性。并提高了对象类型识别的准确性。

【技术实现步骤摘要】
一种数据处理的方法、装置以及存储介质


[0001]本申请涉及计算机
,尤其涉及一种数据处理的方法、装置以及存储介质。

技术介绍

[0002]随着互联网技术的迅速发展,人们对网络交易的安全性要求越来越高,由于商户可以在不同的互联网平台上进行交易设置,故对于商户的安全性评价尤为重要。
[0003]一般,可以通过关联分析的方式进行黑白商户挖掘,主要是通过共同交易对手或者共同股东建立的节点都为商户、边为商户间关联的图谱,即一种同构网络;再通过图算法或其他分类器对图中的节点(商户)进行分类。
[0004]但是,由共同交易对手建立的图谱中的边描述的是经过交易对手抽象后的间接关联,会造成部分信息失真,影响异常对象识别的准确性。
[0005]申请内容
[0006]有鉴于此,本申请提供一种数据处理的方法,可以有效提高异常对象识别的准确性。
[0007]本申请第一方面提供一种数据处理的方法,可以应用于终端设备中包含数据处理的功能的系统或程序中,具体包括:
[0008]获取交易对象和交易平台之间的交易信息;
[0009]将所述交易对象和所述交易平台作为网络节点,并基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述网络节点进行连接,以得到异构网络;
[0010]基于预设路径类别在所述异构网络中进行节点游走,以得到元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;
[0011]根据所述元路径进行向量表示,以得到所述网络节点对应的节点向量;
[0012]基于所述节点向量之间的距离对所述交易对象进行分类,并根据分类结果进行识别以得到所述交易对象中的异常对象。
[0013]可选的,在本申请一些可能的实现方式中,所述将所述交易对象和所述交易平台作为网络节点,并基于所述交易信息中指示的所述交易对象和所述交易平台之间关联关系对所述网络节点进行连接,以得到异构网络,包括:
[0014]将所述交易对象作为所述网络节点中的商户节点,并将所述交易平台作为所述网络节点中的平台节点;
[0015]基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述商户节点和所述平台节点进行连接,以确定第一网络边;
[0016]基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述平台节点之间存在跳转关系的节点进行连接,以确定第二网络边;
[0017]根据所述商户节点、所述平台节点、所述第一网络边和所述第二网络边得到所述异构网络。
[0018]可选的,在本申请一些可能的实现方式中,所述基于预设路径类别在所述异构网
络中进行节点游走,以得到元路径,包括:
[0019]基于所述预设路径类别确定商户起始节点和平台起始节点;
[0020]根据所述商户起始节点在所述异构网络中进行节点游走,并以终止节点为交易对象时作为停止时机,以得到商户路径;
[0021]根据所述平台起始节点在所述异构网络中进行节点游走,并以终止节点为交易平台时作为停止时机,以得到平台路径;
[0022]基于所述商户路径和所述平台路径确定所述元路径。
[0023]可选的,在本申请一些可能的实现方式中,所述根据所述元路径进行向量表示,以得到所述网络节点对应的节点向量,包括:
[0024]将所述元路径中的起始节点作为中心节点,并将所述元路径中的终止节点作为相邻节点;
[0025]基于预设算法对所述中心节点进行向量表示,以使得所述相邻节点的出现概率最大化,并基于目标函数得到所述网络节点对应的所述节点向量。
[0026]可选的,在本申请一些可能的实现方式中,所述基于预设算法对所述中心节点进行向量表示,以使得所述相邻节点的出现概率最大化,并基于目标函数得到所述网络节点对应的所述节点向量,包括:
[0027]基于所述预设算法对所述中心节点进行向量表示,以得到中心向量;
[0028]基于所述预设算法对所述相邻节点进行向量表示,以得到相邻向量;
[0029]基于所述目标函数获取所述中心向量和所述相邻向量对应的内积,并采用逻辑回归模型计算所述相邻节点的出现概率,以使得所述相邻节点的出现概率最大化,并得到所述网络节点对应的所述节点向量。
[0030]可选的,在本申请一些可能的实现方式中,所述方法还包括:
[0031]采用负采样的方式获取非相邻节点;
[0032]通过最小化所述非相邻节点的出现概率对所述目标函数进行更新。
[0033]可选的,在本申请一些可能的实现方式中,所述基于所述节点向量之间的距离对所述交易对象进行分类,并根据分类结果进行识别以得到所述交易对象中的异常对象,包括:
[0034]将目标向量输入分类器,以确定所述目标向量对应的样本类别;
[0035]确定与所述目标向量距离满足阈值条件的节点向量,以基于所述样本类别进行类别标记得到所述分类结果;
[0036]确定所述分类结果中的黑样本商户,以作为所述交易对象中的异常对象。
[0037]可选的,在本申请一些可能的实现方式中,所述方法还包括:
[0038]确定所述分类结果中的黑样本平台;
[0039]将与所述黑样本平台对应的节点向量的距离小于预设值的交易对象作为所述异常对象。
[0040]可选的,在本申请一些可能的实现方式中,所述方法还包括:
[0041]确定与所述交易对象存在交易关系的交易用户;
[0042]将所述交易用户作为所述网络节点,以对所述异构网络进行更新;
[0043]基于所述预设路径类别在更新后的所述异构网络中进行节点游走,以得到更新后
的元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;
[0044]根据更新后的所述元路径进行向量表示,以得到更新后的节点向量;
[0045]基于更新后的所述节点向量之间的距离进行所述交易用户、所述交易对象或所述交易平台的识别进程。
[0046]可选的,在本申请一些可能的实现方式中,所述方法还包括:
[0047]获取所述交易用户与所述交易对象之间的交易参数;
[0048]基于所述交易参数对所述交易用户与所述交易对象组成的网络边进行加权,以对所述异构网络进行更新。
[0049]可选的,在本申请一些可能的实现方式中,所述交易平台为公众号,所述预设路径类别包括交易对象通过所述公众号进行关联的路径以及所述公众号之间的跳转路径,所述交易对象的数量大于所述公众号的数量。
[0050]可选的,在本申请一些可能的实现方式中,所述数据处理的方法应用于区块链设备,所述区块链设备为区块链中的节点。
[0051]本申请第二方面提供一种数据处理的装置,包括:
[0052]获取单元,用于获取交易对象和交易平台之间的交易信息;
[0053]连接单元,用于将所述交易对象和所述交易平台作为网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理的方法,其特征在于,包括:获取交易对象和交易平台之间的交易信息;将所述交易对象和所述交易平台作为网络节点,并基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述网络节点进行连接,以得到异构网络;基于预设路径类别在所述异构网络中进行节点游走,以得到元路径,所述预设路径类别中路径的起始节点与终止节点对应的节点类型相同;根据所述元路径进行向量表示,以得到所述网络节点对应的节点向量;基于所述节点向量之间的距离对所述交易对象进行分类,并根据分类结果进行识别以得到所述交易对象中的异常对象。2.根据权利要求1所述的方法,其特征在于,所述将所述交易对象和所述交易平台作为网络节点,并基于所述交易信息中指示的所述交易对象和所述交易平台之间关联关系对所述网络节点进行连接,以得到异构网络,包括:将所述交易对象作为所述网络节点中的商户节点,并将所述交易平台作为所述网络节点中的平台节点;基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述商户节点和所述平台节点进行连接,以确定第一网络边;基于所述交易信息中指示的所述交易对象和所述交易平台之间的关联关系对所述平台节点之间存在跳转关系的节点进行连接,以确定第二网络边;根据所述商户节点、所述平台节点、所述第一网络边和所述第二网络边得到所述异构网络。3.根据权利要求1所述的方法,其特征在于,所述基于预设路径类别在所述异构网络中进行节点游走,以得到元路径,包括:基于所述预设路径类别确定商户起始节点和平台起始节点;根据所述商户起始节点在所述异构网络中进行节点游走,并以终止节点为交易对象时作为停止时机,以得到商户路径;根据所述平台起始节点在所述异构网络中进行节点游走,并以终止节点为交易平台时作为停止时机,以得到平台路径;基于所述商户路径和所述平台路径确定所述元路径。4.根据权利要求1所述的方法,其特征在于,所述根据所述元路径进行向量表示,以得到所述网络节点对应的节点向量,包括:将所述元路径中的起始节点作为中心节点,并将所述元路径中的终止节点作为相邻节点;基于预设算法对所述中心节点进行向量表示,以使得所述相邻节点的出现概率最大化,并基于目标函数得到所述网络节点对应的所述节点向量。5.根据权利要求4所述的方法,其特征在于,所述基于预设算法对所述中心节点进行向量表示,以使得所述相邻节点的出现概率最大化,并基于目标函数得到所述网络节点对应的所述节点向量,包括:基于所述预设算法对所述中心节点进行向量表示,以得到中心向量;基于所述预设算法对所述相邻节点进行向量表示,以得到相邻向量;
基于所述目标函数获取所述中心向量和所述相邻向量对应的内积,并采用逻辑回归模型计算所述相邻节点的出现概率,以使得所述相邻节点的出现概率最大化,并得到所述网络节点对应的所述节点向量。6.根据权利要求4所述的方法,其特征在于,所述方法还包括:采用负采样的方式获取非相邻节点;通过最小化所述非相邻节点的出现概率对所述目...

【专利技术属性】
技术研发人员:蒋乐怡
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1