数据缺失情况下的黑名单多维信息验证方法及系统及可读存储介质及设备技术方案

技术编号:19745512 阅读:45 留言:0更新日期:2018-12-12 04:47
本发明专利技术公开了一种数据缺失情况下的黑名单多维信息验证方法及系统及可读存储介质及设备,其中验证方法包括如下步骤:S1:获取交易平台上当前交易的账户注册人的基础信息,所述基础信息为交易平台获取到的账户注册人在注册时提交的注册信息和/或在交易时上传的动态信息;S3:从获取到的基础信息中挖掘出与黑名单系统中相同字段的信息;S5:将挖掘到的信息与黑名单系统中每条记录从各个字段角度进行相似度比对,并记下与每条记录中和各个字段的相似度值;S7:采用决策树算法对相似度的比对结果进行综合判定,判定所述账户注册人是否落入黑名单系统。本发明专利技术方法,增加了比对的维度,提高了黑名单验证的效率和准确度。

【技术实现步骤摘要】
数据缺失情况下的黑名单多维信息验证方法及系统及可读存储介质及设备
本专利技术属于黑名单验证领域,尤其涉及一种数据缺失情况下的黑名单多维信息验证方法及系统及可读存储介质及设备。
技术介绍
随着全球经济一体化的发展,利用金融机构进行的洗钱活动日益猖獗。与此同时,越来越多的个人或实体通过违反相关国家的法律和国际法来进行洗钱活动,我们将这些由各国政府、国际组织制定的应受到制裁的个人、实体或国家的名单统称为黑名单。黑名单中通常包括执行主体的姓名、身份证号码、户籍地、家庭地址、银行卡号、银行卡预留手机号、紧急联系人。联合国不定期向各国发布涉嫌恐怖组织和个人的银行资金帐户黑名单,要求各国实施密切监控、资金冻结等措施,在交易过程中,首先会向黑名单系统发一个查询,检查这个帐户的持有人是否存在在黑名单中,如果存在在黑名单中,系统即时给正在交易的系统进行反馈,并提醒冻结帐户。因此,为了实现黑名单客户筛选的计算机化,提高黑名单信息自动录入、黑名单客户识别效率,各个银行及支付机构都开始研究开发反洗钱黑名单自动过滤系统。传统的黑名单比对方法由于缺乏待检测账户注册人完整的信息,以致于单纯的采用姓名进行比对,此方法由于重复个体的大量存在,会导致大量不准确结果的出现,比对效率低下且容易出错。
技术实现思路
本专利技术需要解决的技术问题是针对现有技术中,在进行黑名单验证时验证机构缺乏待检测账户持有人完整身份信息,而单独采用姓名进行比对,导致大量的比对结果不准确的情况,提出一种数据缺失情况下的黑名单多维信息验证方法及系统及可读存储介质及设备,其能够提高黑名单验证的效率以及准确度。为解决上述问题,本专利技术的技术方案为:一种数据缺失情况下的黑名单多维信息验证方法,包括如下步骤:S1:获取交易平台上当前交易的账户注册人的基础信息,所述基础信息为在所述交易平台获取到的所述账户注册人在注册账户时提交的注册信息和/或所述账户注册人在交易时上传的动态信息;S3:从获取到的所述基础信息中挖掘出与黑名单系统中相同字段的信息;S5:将挖掘到的信息与所述黑名单系统中的每条记录从各个字段角度进行相似度比对,并记下与每条记录中和各个字段的相似度值;S7:采用决策树算法对相似度的比对结果进行综合判定,判定所述账户注册人是否落入所述黑名单系统。根据本专利技术的一实施例,步骤S1中,所述账户注册人的注册信息包括所述账户注册人的姓名、身份证号码、银行卡号、电话号码,所述动态信息包括所述账户注册人的历史定位轨迹信息以及所述账户注册人授权的社交网络信息;步骤S3中,所述从获取到的所述基础信息中挖掘出与黑名单系统中相同字段的信息,包括从所述账户注册人的历史定位轨迹信息得到的所述账户注册人的家庭地址;以及从所述账户注册人授权的社交网络信息中,获取到的所述账户注册人的好友信息,包括好友的姓名和联系电话;所述账户注册人的姓名、身份证号码、电话号码、银行卡号、家庭地址、好友的姓名和联系电话记为账户注册人信息。根据本专利技术的一实施例,步骤S3中,所述从获取到的所述基础信息中挖掘出与黑名单系统中相同字段的信息,还包括从所述账户注册人的银行卡号中挖掘出所述银行卡的注册人的基本信息,记为银行卡注册人信息,所述银行卡注册人信息包括所述银行卡注册人的姓名、身份证号码、户籍地址、预留电话号码、家庭地址、紧急联系人姓名和电话号码;在步骤S3之后、S5之前,还包括步骤S4:判断所述账户注册人和所述银行卡注册人是否为相同人员。根据本专利技术的一实施例,在步骤S4的判断中,若为相同人员,则步骤S5具体为:分别将所述账户注册人信息和所述银行卡注册人信息与所述黑名单系统中每条记录从各个字段角度进行相似度比对,记下与每条记录中和各个字段的相似度值,当所述账户注册人信息和所述银行卡注册人信息中同一个字段存在不同时,选择并保留与黑名单系统中相应字段相似度值较高的信息,删除与所述黑名单系统中相应字段相似度值较低的信息;若为不同人员,则步骤S5具体为:分别将所述账户注册人信息和所述银行卡注册人信息与所述黑名单系统中每条记录从各个字段角度进行相似度比对,记下与每条记录中和各个字段的相似度值。根据本专利技术的一实施例,当所述账户注册人和所述银行卡注册人是相同人员,则步骤S7具体为:采用第一决策树算法对相似度的比对结果进行综合判定,判定所述账户注册人是否落入所述黑名单系统,具体步骤如下:通过基于字段相似度的第一决策树对所述账户注册人信息进行判定,确定所述账户注册人是否落入所述黑名单系统中;其中,所述基于字段相似度的第一决策树的构建步骤包括:A1.设定落入所述黑名单系统的判断标准,将具有以下特征的所述账户注册人信息判定为落入黑名单系统:根据字段的权重设定每个字段相似度的阈值,若所述账户注册人信息中权重较高的字段与黑名单中记录的相似度值均超过阈值,则判定所述账户注册人落入所述黑名单系统,具体为:A2.从落入所述黑名单系统的账户注册人信息中提取属性特征并生成训练数据集,所述属性特征包括姓名相似度、身份证是否相同、银行卡号是否相同、户籍地址是否相同、手机号码是否与预留手机号码相同、好友与黑名单中紧急联系人的相似度、家庭地址相似度;A3.计算训练数据集中包含的每个属性特征的信息增益,根据该信息增益选择最佳的分裂决策属性作为节点构造所述第一决策树;当所述账户注册人和所述银行卡注册人是不同人员,则步骤S7具体为:先采用账户注册人信息决策树判定所述账户注册人信息是否落入黑名单系统中,并在所述账户注册人信息未落入黑名单系统时,再采用银行卡注册人信息决策树判定所述银行卡注册人信息是否落入黑名单系统中;其中所述账户注册人信息决策树构造步骤如下:B1:设定落入所述黑名单系统的判断标准,将满足以下条件的所述账户注册人信息判定为落入所述黑名单系统:根据字段的权重设定每个字段相似度的阈值,若所述账户注册人信息中权重较高的字段与黑名单中记录的相似度值均超过阈值,则判定所述账户注册人信息落入所述黑名单系统;B2.从落入所述黑名单系统的账户注册人信息中提取属性特征并生成训练数据集,所述属性特征包括姓名相似度、身份证是否相同、银行卡是否相同、手机号码是否与预留手机号码相同、好友与黑名单中紧急联系人的相似度、家庭地址相似度;B3.计算训练数据集中包含的每个属性特征的信息增益,根据该信息增益选择最佳的分裂决策属性作为节点构造所述账户注册人信息决策树;所述银行卡注册人信息决策树构造步骤如下:B4:设定落入所述黑名单系统的判断标准,将满足以下条件的所述银行卡注册人信息判定为落入所述黑名单系统:根据字段的权重设定每个字段相似度的阈值,若所述银行卡注册人信息中权重较高的字段与黑名单中记录的相似度值均超过阈值,则判定所述银行卡注册人信息落入所述黑名单系统;B5.从落入所述黑名单系统的银行卡注册人信息中提取属性特征并生成训练数据集,所述属性特征包括姓名相似度、身份证是否相同、手机号码是否与预留手机号码相同、紧急联系人与黑名单中紧急联系人的相似度、家庭地址相似度、户籍地址是否相同;B6.计算训练数据集中包含的每个属性特征的信息增益,根据该信息增益选择最佳的分裂决策属性作为节点构造所述银行卡注册人信息决策树。根据本专利技术的一实施例,所述步骤S5中,好友与紧急联系人的比对方法如下:将挖掘到的好友的姓名本文档来自技高网...

【技术保护点】
1.一种数据缺失情况下的黑名单多维信息验证方法,其特征在于,包括如下步骤:S1:获取交易平台上当前交易的账户注册人的基础信息,所述基础信息为在所述交易平台获取到的所述账户注册人在注册账户时提交的注册信息和/或所述账户注册人在交易时上传的动态信息;S3:从获取到的所述基础信息中挖掘出与黑名单系统中相同字段的信息;S5:将挖掘到的信息与所述黑名单系统中的每条记录从各个字段角度进行相似度比对,并记下与每条记录中和各个字段的相似度值;S7:采用决策树算法对相似度的比对结果进行综合判定,判定所述账户注册人是否落入所述黑名单系统。

【技术特征摘要】
1.一种数据缺失情况下的黑名单多维信息验证方法,其特征在于,包括如下步骤:S1:获取交易平台上当前交易的账户注册人的基础信息,所述基础信息为在所述交易平台获取到的所述账户注册人在注册账户时提交的注册信息和/或所述账户注册人在交易时上传的动态信息;S3:从获取到的所述基础信息中挖掘出与黑名单系统中相同字段的信息;S5:将挖掘到的信息与所述黑名单系统中的每条记录从各个字段角度进行相似度比对,并记下与每条记录中和各个字段的相似度值;S7:采用决策树算法对相似度的比对结果进行综合判定,判定所述账户注册人是否落入所述黑名单系统。2.根据权利要求1所述的数据缺失情况下的黑名单多维信息验证方法,其特征在于,步骤S1中,所述账户注册人的注册信息包括所述账户注册人的姓名、身份证号码、银行卡号、电话号码,所述动态信息包括所述账户注册人的历史定位轨迹信息以及所述账户注册人授权的社交网络信息;步骤S3中,所述从获取到的所述基础信息中挖掘出与黑名单系统中相同字段的信息,包括从所述账户注册人的历史定位轨迹信息得到的所述账户注册人的家庭地址;以及从所述账户注册人授权的社交网络信息中,获取到的所述账户注册人的好友信息,包括好友的姓名和联系电话;所述账户注册人的姓名、身份证号码、电话号码、银行卡号、家庭地址、好友的姓名和联系电话记为账户注册人信息。3.根据权利要求2所述的数据缺失情况下的黑名单多维信息验证方法,其特征在于,步骤S3中,所述从获取到的所述基础信息中挖掘出与黑名单系统中相同字段的信息,还包括从所述账户注册人的银行卡号中挖掘出所述银行卡的注册人的基本信息,记为银行卡注册人信息,所述银行卡注册人信息包括所述银行卡注册人的姓名、身份证号码、户籍地址、预留电话号码、家庭地址、紧急联系人姓名和电话号码;在步骤S3之后、S5之前,还包括步骤S4:判断所述账户注册人和所述银行卡注册人是否为相同人员。4.根据权利要求3所述的数据缺失情况下的黑名单多维信息验证方法,其特征在于,在步骤S4的判断中,若为相同人员,则步骤S5具体为:分别将所述账户注册人信息和所述银行卡注册人信息与所述黑名单系统中每条记录从各个字段角度进行相似度比对,记下与每条记录中和各个字段的相似度值,当所述账户注册人信息和所述银行卡注册人信息中同一个字段存在不同时,选择并保留与黑名单系统中相应字段相似度值较高的信息,删除与所述黑名单系统中相应字段相似度值较低的信息;若为不同人员,则步骤S5具体为:分别将所述账户注册人信息和所述银行卡注册人信息与所述黑名单系统中每条记录从各个字段角度进行相似度比对,记下与每条记录中和各个字段的相似度值。5.根据权利要求4所述的数据缺失情况下的黑名单多维信息验证方法,其特征在于,当所述账户注册人和所述银行卡注册人是相同人员,则步骤S7具体为:采用第一决策树算法对相似度的比对结果进行综合判定,判定所述账户注册人是否落入所述黑名单系统,具体步骤如下:通过基于字段相似度的第一决策树对所述账户注册人信息进行判定,确定所述账户注册人是否落入所述黑名单系统中;其中,所述基于字段相似度的第一决策树的构建步骤包括:A1.设定落入所述黑名单系统的判断标准,将具有以下特征的所述账户注册人信息判定为落入黑名单系统:根据字段的权重设定每个字段相似度的阈值,若所述账户注册人信息中权重较高的字段与黑名单中记录的相似度值均超过阈值,则判定所述账户注册人落入所述黑名单系统,具体为:A2.从落入所述黑名单系统的账户注册人信息中提取属性特征并生成训练数据集,所述属性特征包括姓名相似度、身份证是否相同、银行卡号是否相同、户籍地址是否相同、手机号码是否与预留手机号码相同、好友与黑名单中紧急联系人的相似度、家庭地址相似度;A3.计算训练数据集中包含的每个属性特征的信息增益,根据该信息增益选择最佳的分裂决策属性作为节点构造所述第一决策树;当所述账户注册人和所述银行卡注册人是不同人员,则步骤S7具体为:先采用账户注册人信息决策树判定所述账户注册人信息是否落入黑名单系统中,并在所述账户注册人信息未落入黑名单系统时,再采用银行卡注册人信息决策树判定所述银行卡注册人信息是否落入黑名单系统中;其中所述账户注册人信息决策树构造步骤如下:B1:设定落入所述黑名单系统的判断标准,将满足以下条件的所述账户注册人信息判定为落入所述黑名单系统:根据字段的权重设定每个字段相似度的阈值,若所述账户...

【专利技术属性】
技术研发人员:陈鹏熊伟陈宇芦帅汪宁谢伟良
申请(专利权)人:杭州呯嘭智能技术有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1