一种信用卡养卡套现团体识别的方法及系统技术方案

技术编号:25891701 阅读:22 留言:0更新日期:2020-10-09 23:34
本发明专利技术公开了一种信用卡养卡套现团体识别方法及系统,本发明专利技术依托于完善的银行、运营商及公安机关数据,使用均值移动聚类算法(MSC)识别出存在信用卡养卡套现的用户及作案人员,并通过知识图谱强大的特征挖掘能力找出与其关联的关键成员、重要成员,从而挖掘出犯罪团伙。本发明专利技术为银行及公安部门进行信用卡养卡套现犯罪活动的侦查提供了一个具有指导性和实践性的方案,为打击犯罪活动提供了有力的线索和证据,有利于信用卡行业的健康发展,并能在一定程度上遏制“洗钱”等不法行为的来源。

【技术实现步骤摘要】
一种信用卡养卡套现团体识别的方法及系统
本专利技术涉及金融诈骗识别
,具体为一种信用卡养卡套现团体识别的方法及系统。
技术介绍
所谓信用卡套现,一般是经过与商家建立联系,通过进行虚假消费将信用卡的额度提现至对应的银行卡内。而所谓养卡,即通过使用自己信用卡额度的一部分,在账单日之后提现剩下的额度并用来还款,从而可以实现无限期的贷款,只需要付出比较低的手续费即可。另外,用户也可以办理多张信用卡来实现养卡的目的。信用卡养卡套现属于金融欺诈行为,其一旦被认定为套现,个人信用将会被蒙上污点,影响持卡人生活的方方面面。另外,持卡人一旦被养卡套现团伙盯上,个人隐私信息还可能被泄露,甚至会陷入危害更大的电信诈骗、套路贷等犯罪活动。传统的反信用卡养卡套现的手段主要是通过基于规则和模型的方法,且侧重点在于对个体用户的识别和防控。如申请号为201911162068.9公开了一种训练养卡识别模型、识别养卡行为的方法及装置,其采用机器学习方法对训练样本进行有监督训练,可以得到覆盖率和准确率较高的养卡识别模型,针对单个养卡用户进行识别。然而现在的信用卡欺诈不仅手段多样、复杂多变,而且已向团伙作案的趋势发展,传统反信用卡养卡套现手段在实际应用中存在以下问题:1、难以识别出养卡套现团伙:传统的基于规则或单模型的方法,主要是对单个用户或账户进行分析识别,对诈骗团伙中的其他非直接接触成员无法进行有效的识别;2、时效性差:由于针对单用户的反养卡套现手段需要用户有一定时间范围内的交易记录,而等到能够确认风险时,用户往往已经进行了多笔交易。3、无法精准识别出团伙中的重要人物、必要人物及隐藏人物等角色:传统的手段是基于账户的交易行为进行分析,而在诈骗团伙中,组织人物是不会直接参与到诈骗实施中的,单纯的通过交易行为是无法识别出这些关键成员的。
技术实现思路
本专利技术所要解决的技术问题在于提供一种信用卡养卡套现团体识别的方法。本专利技术通过以下技术手段实现解决上述技术问题的:一种信用卡养卡套现团体识别方法,包括以下步骤:S1.疑似养卡套现数据获取,至少获取运营商通话及银行流水数据,作为待聚类数据;S2.特征提取,针对待聚类数据进行特征构造,得到基本特征、通话特征及交易特征;S3.聚类分析,采用均值漂移聚类算法对基本特征、通话特征及交易特征进行分析,得到均值漂移聚类模型及聚类结果;S4.类别确定,获取带有标签的养卡套现用户清单数据,并对清单数据进行特征提取,然后将提取的特征输入均值漂移聚类模型进行聚类,根据标签与聚类结果对应关系,确定疑似养卡套现数据中用户所处的类别,进而得到疑似养卡套现用户对象清单;S5.知识抽取,针对疑似养卡套现数据进行实体抽取、关系抽取,属性抽取;S6.知识图谱构建,将抽取的实体数据、关系数据,属性数据导入neo4j数据库中,得到知识图谱;S7.特征挖掘,基于构建好的知识图谱,通过知识图谱的深层遍历及相关图挖掘算法,进而识别出特定人员之间的关系,从而挖掘出关联网络中的隐藏节点、关键节点及其社会关系特征;S8.群体识别,通过步骤S7,从存在信用卡养卡套现行为的用户的社交网络,挖掘出其网络中的关键成员、重要成员,并结合公安机关、银行及运营商已有的养卡套现团伙成员的相关数据,进行特征匹配,从而进一步确定养卡套现团伙的成员。本专利技术依托于完善的银行、运营商及公安机关数据,使用均值移动聚类算法(MSC)识别出存在信用卡养卡套现的用户及作案人员,并通过知识图谱强大的特征挖掘能力找出与其关联的关键成员、重要成员,从而挖掘出犯罪团伙。进一步的,所述步骤S1中的样例数据至少包括信用卡持卡人基本信息、POS机持机人基本信息、通话数据、信用卡交易数据;其中信用卡持卡人基本信息至少包括信用卡卡号、持卡人手机号及信用;POS机持机人基本信息至少包括POS机序列号、商户号、手机号及身份信息。进一步的,所述步骤S2中具体为,以用户的手机号为分析对象,以近三个月为时间周期,取用户的信用卡交易数据、通话数据进行特征构建,得到基本特征、通话特征及交易特征。进一步的,所述步骤S3中采用引入核函数后的均值漂移聚类算法进行聚类计算:其中,x为中心点,xi为滑动窗口内的数据,h为滑动窗口带宽,g(x)为对核函数的导数求负。进一步的,所述步骤S4中带有标签的养卡套现用户清单数据来自于公安或银行已经确定的信用卡养卡套现用户数据。进一步的,所述步骤S7中的相关图挖掘计算过程具体为:现采用最短路径算法计算知识图谱中两点之间的最短距离,然后利用介中心度算法计算出经过某个点的最短路径数,最后用PageRank算法计算节点的重要程度。本专利技术还提供一种信用卡养卡套现团体识别系统,:应用于上述的方法,包括疑似养卡套现数据获取模块,至少获取运营商通话及银行流水数据,作为待聚类数据;特征提取模块,针对待聚类数据进行特征构造,得到基本特征、通话特征及交易特征;聚类分析模块,采用均值漂移聚类算法对基本特征、通话特征及交易特征进行分析,得到均值漂移聚类模型及聚类结果;类别确定模块,获取带有标签的养卡套现用户清单数据,并对清单数据进行特征提取,然后将提取的特征输入均值漂移聚类模型进行聚类,根据标签与聚类结果对应关系,确定疑似养卡套现数据中用户所处的类别,进而得到疑似养卡套现用户对象清单;知识抽取模块,针对疑似养卡套现数据进行实体抽取、关系抽取,属性抽取;知识图谱构建模块,将抽取的实体数据、关系数据,属性数据导入neo4j数据库中,得到知识图谱;特征挖掘模块,基于构建好的知识图谱,通过知识图谱的深层遍历及相关图挖掘算法,进而识别出特定人员之间的关系,从而挖掘出关联网络中的隐藏节点、关键节点及其社会关系特征;群体识别模块,通过特征挖掘,从存在信用卡养卡套现行为的用户的社交网络,挖掘出其网络中的关键成员、重要成员,并结合公安机关、银行及运营商已有的养卡套现团伙成员的相关数据,进行特征匹配,从而进一步确定养卡套现团伙的成员。进一步的,所述疑似养卡套现数据至少包括信用卡持卡人基本信息、POS机持机人基本信息、通话数据、信用卡交易数据;其中信用卡持卡人基本信息至少包括信用卡卡号、持卡人手机号及信用;POS机持机人基本信息至少包括POS机序列号、商户号、手机号及身份信息。进一步的,所述特征提取具体执行过程为,以疑似养卡套现用户的手机号为分析对象,以近三个月为时间周期,取用户的信用卡交易数据、通话数据进行特征构建,得到基本特征、通话特征及交易特征。进一步的,所述聚类分析模块中采用引入核函数后的均值漂移聚类算法进行聚类计算:其中,x为中心点,xi为滑动窗口内的数据,h为滑动窗口带宽,g(x)为对核函数的导数求负。进一步的,特征挖掘模块中相关图挖掘计算过程具体为:采用最短路径算法计算知识图谱中两点之间的最短距离,然后利用介中心度算法本文档来自技高网
...

【技术保护点】
1.一种信用卡养卡套现团体识别方法,其特征在于:包括以下步骤:/nS1.疑似养卡套现数据获取,至少获取运营商通话及银行流水数据,作为待聚类数据;/nS2.特征提取,针对待聚类数据进行特征构造,得到基本特征、通话特征及交易特征;/nS3.聚类分析,采用均值漂移聚类算法对基本特征、通话特征及交易特征进行分析,得到均值漂移聚类模型及聚类结果;/nS4.类别确定,获取带有标签的养卡套现用户清单数据,并对清单数据进行特征提取,然后将提取的特征输入均值漂移聚类模型进行聚类,根据标签与聚类结果对应关系,确定疑似养卡套现数据中用户所处的类别,进而得到疑似养卡套现用户对象清单;/nS5.知识抽取,针对疑似养卡套现数据进行实体抽取、关系抽取,属性抽取;/nS6.知识图谱构建,将抽取的实体数据、关系数据,属性数据导入neo4j数据库中,得到知识图谱;/nS7.特征挖掘,基于构建好的知识图谱,通过知识图谱的深层遍历及相关图挖掘算法,进而识别出特定人员之间的关系,从而挖掘出关联网络中的隐藏节点、关键节点及其社会关系特征;/nS8.群体识别,通过步骤S7,从存在信用卡养卡套现行为的用户的社交网络,挖掘出其网络中的关键成员、重要成员,并结合公安机关、银行及运营商已有的养卡套现团伙成员的相关数据,进行特征匹配,从而进一步确定养卡套现团伙的成员。/n...

【技术特征摘要】
1.一种信用卡养卡套现团体识别方法,其特征在于:包括以下步骤:
S1.疑似养卡套现数据获取,至少获取运营商通话及银行流水数据,作为待聚类数据;
S2.特征提取,针对待聚类数据进行特征构造,得到基本特征、通话特征及交易特征;
S3.聚类分析,采用均值漂移聚类算法对基本特征、通话特征及交易特征进行分析,得到均值漂移聚类模型及聚类结果;
S4.类别确定,获取带有标签的养卡套现用户清单数据,并对清单数据进行特征提取,然后将提取的特征输入均值漂移聚类模型进行聚类,根据标签与聚类结果对应关系,确定疑似养卡套现数据中用户所处的类别,进而得到疑似养卡套现用户对象清单;
S5.知识抽取,针对疑似养卡套现数据进行实体抽取、关系抽取,属性抽取;
S6.知识图谱构建,将抽取的实体数据、关系数据,属性数据导入neo4j数据库中,得到知识图谱;
S7.特征挖掘,基于构建好的知识图谱,通过知识图谱的深层遍历及相关图挖掘算法,进而识别出特定人员之间的关系,从而挖掘出关联网络中的隐藏节点、关键节点及其社会关系特征;
S8.群体识别,通过步骤S7,从存在信用卡养卡套现行为的用户的社交网络,挖掘出其网络中的关键成员、重要成员,并结合公安机关、银行及运营商已有的养卡套现团伙成员的相关数据,进行特征匹配,从而进一步确定养卡套现团伙的成员。


2.根据权利要求1所述的一种信用卡养卡套现团体识别方法,其特征在于:所述步骤S1中的疑似养卡套现数据至少包括信用卡持卡人基本信息、POS机持机人基本信息、通话数据、信用卡交易数据;其中信用卡持卡人基本信息至少包括信用卡卡号、持卡人手机号及信用;POS机持机人基本信息至少包括POS机序列号、商户号、手机号及身份信息。


3.根据权利要求2所述的一种信用卡养卡套现团体识别方法,其特征在于:所述步骤S2中具体为,以疑似养卡套现用户的手机号为分析对象,以近三个月为时间周期,取用户的信用卡交易数据、通话数据进行特征构建,得到基本特征、通话特征及交易特征。


4.根据权利要求1所述的一种信用卡养卡套现团体识别方法,其特征在于:所述步骤S3中采用引入核函数后的均值漂移聚类算法进行聚类计算:



其中,x为中心点,xi为滑动窗口内的数据,h为滑动窗口带宽,g(x)为对核函数的导数求负。


5.根据权利要求1所述的一种信用卡养卡套现团体识别方法,其特征在于:所述步骤S4中带有标签的养卡套现用户清单数据来自于公安或银行已经确定的信用卡养卡套现用户数据。


6.根据权利要求1所述的一种信用卡养卡套现团体识别方法,其特...

【专利技术属性】
技术研发人员:刘胜梁淑云马影陶景龙王启凡魏国富徐明殷钱安余贤喆周晓勇
申请(专利权)人:上海观安信息技术股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1