客户的疑似客户号的确定方法、装置、服务器以及介质制造方法及图纸

技术编号:37463145 阅读:17 留言:0更新日期:2023-05-06 09:36
本申请公开了一种客户的疑似客户号的确定方法、装置、服务器以及介质,可应用于金融领域或其他领域。获取多个客户号分别对应的第一客户信息,计算两两所述客户号对应的第一相似度,所述第一相似度为两两所述客户号分别对应的第一客户信息的相似度;将所述第一相似度高于第一预设阈值的客户号划分至同一目标集合;针对每一所述目标集合,获取所述目标集合包含的每一所述客户号对应的第二客户信息,计算两两所述客户号对应的第二相似度,所述第二相似度为两两所述客户号分别对应的第二客户信息的相似度;将第二相似度高于第二预设阈值的所述客户号划分至同一疑似集合,疑似集合包含疑似属于同一客户的所述客户号,节省了大量的时间和人力。间和人力。间和人力。

【技术实现步骤摘要】
客户的疑似客户号的确定方法、装置、服务器以及介质


[0001]本申请涉及金融领域,更具体的说,是涉及一种客户的疑似客户号的确定方法、装置、服务器以及介质。

技术介绍

[0002]随着银行机构客户群体与业务种类不断扩大,客户信息管理的难度也随之增加。客户信息管理是通过客户号将系统中属于每个客户的信息关联起来,客户号作为客户的关键标识,应该具有唯一性,即一个客户对应一个唯一的客户号,这样才能起到有效的客户信息管理效果。
[0003]因我国人口飞速增长,原有的15位的身份证号改为18位身份证号,但是15位的身份证号需要延用到身份证有效期满,所以导致了“一户多号”的问题,即同一个客户用不同身份证号开户导致的同一客户对应多个客户号的情况。针对这种情况,需要对属于同一客户的多个客户号进行归并处理,目前归并处理的做法是:人工对多个客户号分别对应的客户信息进行对比来判断多个客户号是否属于同一客户。
[0004]由于系统中存有客户号的数量非常庞大,人工的比对过程会耗费大量的时间和人力,增加了银行机构需要投入的人工成本。

技术实现思路

[0005]有鉴于此,本申请提供了一种客户的疑似客户号的确定方法、装置、服务器以及介质。
[0006]为实现上述目的,本申请提供如下技术方案:
[0007]本申请第一方面提供了一种客户的疑似客户号的确定方法,包括:
[0008]获取多个客户号分别对应的第一客户信息,所述第一客户信息包括交易地址、关系人物、电子设备标识以及机构号;
[0009]其中,所述交易地址为通过所述客户号进行的交易的地址,所述关系人物为与所述客户号所属的客户有关联的人物,所述电子设备标识为进行所述交易的电子设备的标识,所述机构号为所述客户号对应的银行机构的编号;
[0010]计算两两所述客户号对应的第一相似度,所述第一相似度为两两所述客户号分别对应的第一客户信息的相似度;
[0011]将所述第一相似度高于第一预设阈值的所述客户号划分至同一目标集合;
[0012]针对每一所述目标集合,获取所述目标集合包含的每一所述客户号对应的第二客户信息,所述第二客户信息包括所述客户号所属客户的常住地址、交易对手账号以及所述交易对手账号对应的机构号;
[0013]计算两两所述客户号对应的第二相似度,所述第二相似度为两两所述客户号分别对应的第二客户信息的相似度;
[0014]将所述第二相似度高于第二预设阈值的所述客户号划分至同一疑似集合,所述疑
似集合包含疑似属于同一客户的所述客户号。
[0015]结合第一方面,在第一种可能的实现方式中,所述将所述第一相似度高于第一预设阈值的所述客户号划分至同一目标集合的步骤包括:
[0016]确定预设数量个候选集合;
[0017]从多个所述客户号中选取所述预设数量个所述客户号分别作为所述预设数量个所述候选集合的聚类中心,每一所述候选集合包括一个聚类中心;
[0018]针对除所述候选集合以外的每一所述客户号,将所述客户号划分至与所述客户号的第一相似度高于所述第一预设阈值的所述聚类中心所在的候选集合;
[0019]针对每一所述候选集合,基于所述候选集合包含的所述客户号的所述第一客户信息更新所述候选集合的聚类中心;
[0020]针对每一所述候选集合,判断所述候选集合更新后的聚类中心是否与更新前的聚类中心相同;
[0021]若不相同,返回执行所述针对除所述候选集合以外的每一所述客户号,将所述客户号划分至与所述客户号的第一相似度高于所述第一预设阈值的所述聚类中心所在的候选集合的步骤,直至所有的所述客户号均被划分至所述候选集合,或者,迭代次数高于第三预设阈值;
[0022]若相同,将所述候选集合作为所述目标集合。
[0023]结合第一方面,在第一种可能的实现方式中,所述从多个所述客户号中选取所述预设数量个所述客户号分别作为所述预设数量个所述候选集合的聚类中心的步骤包括:
[0024]确定多个所述客户号中任意一个所述客户号作为第一个聚类中心;
[0025]从除所述第一个聚类中心以外的多个所述客户号分别与所述第一个聚类中心的所述第一相似度中,确定低于所述第一预设阈值且最小的所述第一相似度对应的所述客户号为第二个聚类中心;
[0026]从除已确定的i个聚类中心以外的所述客户号分别对应的平均值中,确定低于所述第一预设阈值且平均值最小的所述客户号为第i+1个聚类中心,1≤i<所述预设数量,所述客户号对应的平均值为所述客户号分别与i个所述聚类中心的第一相似度的均值;
[0027]若i+1小于所述预设数量,返回步骤从除已确定的i个聚类中心以外的所述客户号分别对应的平均值中,确定低于所述第一预设阈值且平均值最小的所述客户号为第i+1个聚类中心;
[0028]若i+1等于或高于所述预设数量,确定所述预设数量个所述客户号分别为所述候选集合的聚类中心。
[0029]结合第一方面,在第一种可能的实现方式中,所述从多个所述客户号中选取所述预设数量个所述客户号分别作为所述预设数量个所述候选集合的聚类中心的步骤包括:
[0030]从多个所述客户号中随机选取所述预设数量个所述客户号分别作为所述预设数量个所述候选集合的聚类中心。
[0031]结合第一方面,在第一种可能的实现方式中,所述计算两两所述客户号对应的第一相似度的步骤包括:
[0032]针对两两所述客户号分别对应的第一客户信息,确定两个所述客户号分别对应的第一客户信息中所述交易地址的相似度、所述关系人物的相似度、所述电子设备标识的相
似度以及所述机构号的相似度之和为所述第一相似度。
[0033]结合第一方面,在第一种可能的实现方式中,所述确定两个所述客户号分别对应的第一客户信息中所述交易地址的相似度、所述关系人物的相似度、所述电子设备标识的相似度以及所述机构号的相似度之和为所述第一相似度的步骤包括:
[0034]确定两个所述客户号分别对应的第一客户信息中具有的相同的所述交易地址数目与其中一个所述客户号对应的第一客户信息中所述交易地址的数目的比值为所述交易地址的相似度;
[0035]确定两个所述客户号分别对应的第一客户信息中具有的相同的所述关系人物的数目与其中一个所述客户号对应的第一客户信息中所述关系人物的数目的比值为所述关系人物的相似度;
[0036]确定两个所述客户号分别对应的第一客户信息中具有的相同的所述电子设备标识的数目与其中一个所述客户号对应的第一客户信息中所述电子设备标识的数目的比值为所述电子设备标识的相似度;
[0037]若两个所述客户号分别对应的第一客户信息中的所述机构号相同,确定所述机构号的相似度为1;
[0038]若两个所述客户号分别对应的第一客户信息中的所述机构号不相同,确定所述机构号的相似度为0;
[0039]确定两个所述客户号分别对应的第一客户信息中所述交易地址的相似度、所述关系人物的相似度、所述电子本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种客户的疑似客户号的确定方法,其特征在于,包括:获取多个客户号分别对应的第一客户信息,所述第一客户信息包括交易地址、关系人物、电子设备标识以及机构号;其中,所述交易地址为通过所述客户号进行的交易的地址,所述关系人物为与所述客户号所属的客户有关联的人物,所述电子设备标识为进行所述交易的电子设备的标识,所述机构号为所述客户号对应的银行机构的编号;计算两两所述客户号对应的第一相似度,所述第一相似度为两两所述客户号分别对应的第一客户信息的相似度;将所述第一相似度高于第一预设阈值的所述客户号划分至同一目标集合;针对每一所述目标集合,获取所述目标集合包含的每一所述客户号对应的第二客户信息,所述第二客户信息包括所述客户号所属客户的常住地址、交易对手账号以及所述交易对手账号对应的机构号;计算两两所述客户号对应的第二相似度,所述第二相似度为两两所述客户号分别对应的第二客户信息的相似度;将所述第二相似度高于第二预设阈值的所述客户号划分至同一疑似集合,所述疑似集合包含疑似属于同一客户的所述客户号。2.根据权利要求1所述的方法,其特征在于,所述将所述第一相似度高于第一预设阈值的所述客户号划分至同一目标集合的步骤包括:确定预设数量个候选集合;从多个所述客户号中选取所述预设数量个所述客户号分别作为所述预设数量个所述候选集合的聚类中心,每一所述候选集合包括一个聚类中心;针对除所述候选集合以外的每一所述客户号,将所述客户号划分至与所述客户号的第一相似度高于所述第一预设阈值的所述聚类中心所在的候选集合;针对每一所述候选集合,基于所述候选集合包含的所述客户号的所述第一客户信息更新所述候选集合的聚类中心;针对每一所述候选集合,判断所述候选集合更新后的聚类中心是否与更新前的聚类中心相同;若不相同,返回执行所述针对除所述候选集合以外的每一所述客户号,将所述客户号划分至与所述客户号的第一相似度高于所述第一预设阈值的所述聚类中心所在的候选集合的步骤,直至所有的所述客户号均被划分至所述候选集合,或者,迭代次数高于第三预设阈值;若相同,将所述候选集合作为所述目标集合。3.根据权利要求2所述的方法,其特征在于,所述从多个所述客户号中选取所述预设数量个所述客户号分别作为所述预设数量个所述候选集合的聚类中心的步骤包括:确定多个所述客户号中任意一个所述客户号作为第一个聚类中心;从除所述第一个聚类中心以外的多个所述客户号分别与所述第一个聚类中心的所述第一相似度中,确定低于所述第一预设阈值且最小的所述第一相似度对应的所述客户号为第二个聚类中心;从除已确定的i个聚类中心以外的所述客户号分别对应的平均值中,确定低于所述第
一预设阈值且平均值最小的所述客户号为第i+1个聚类中心,1≤i<所述预设数量,所述客户号对应的平均值为所述客户号分别与i个所述聚类中心的第一相似度的均值;若i+1小于所述预设数量,返回步骤从除已确定的i个聚类中心以外的所述客户号分别对应的平均值中,确定低于所述第一预设阈值且平均值最小的所述客户号为第i+1个聚类中心;若i+1等于或高于所述预设数量,确定所述预设数量个所述客户号分别为所述候选集合的聚类中心。4.根据权利要求2所述的方法,其特征在于,所述从多个所述客户号中选取所述预设数量个所述客户号分别作为所述预设数量个所述候选集合的聚类中心的步骤包括:从多个所述客户号中随机选取所述预设数量个所述客户号分别作为所述预设数量个所述候选集合的聚类中心。5.根据权利要求1至4任一所述的方法,其特征在于,所述计算两两所述客户号对应的第一相似度...

【专利技术属性】
技术研发人员:金雪晴金浩宇
申请(专利权)人:中银金融科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1