一种动态高风险客群检测方法及系统技术方案

技术编号:17468476 阅读:34 留言:0更新日期:2018-03-15 05:40
本发明专利技术提供了一种动态高风险客群检测算法,其用于检测归属于不同客群的新用户的风险度,包括如下步骤:i.使用聚类算法基于多个历史用户的多个历史数据对多个所述历史用户建群形成多个客群,所述聚类算法与所述历史数据的种类相关;a.基于评估指标确定每个所述客群的风险度,将所述风险度大于风险阈值的所述客群确定为高风险客群;b.基于距离函数确定所述新用户与所述高风险客群的相似度,将相似度大于第一相似度阈值的所述新用户判定为风险用户,所述距离函数所述新用户的用户数据的种类相关,这里重新定义本发明专利技术的有益效果,本发明专利技术操作简单,使用方便,提供了一种动态风险客群检测算法及相应地系统,具有极高的商业价值。

【技术实现步骤摘要】
一种动态高风险客群检测方法及系统
本专利技术属于风险检测领域,具体地,涉及一种动态高风险客群检测方法及系统。
技术介绍
在当今虚拟经济飞速发展的时代,信用体制以及其风险管理日益受到关注。促进利用个人信用进行消费是当今社会经济环境下扩大内需、促进经济发展的重要方法,当前中国首当其冲的任务就是大力发展经济,利用个人信用消费对国民经济增长起到推动力的作用,但个人信用方面的发展会遇到很多困难阻碍,从而个人信用很难得到有效的控制,而随着金融证券化的发展,银行已由卖方市场转化到了买房市场,因此,争夺实力雄厚、信用度高、还款能力强的客户是商业银行的主要竞争,调查人员在开拓市场进行信贷营销时,受理贷款人的申请,根据贷款人的资料,对其信用评估,同时对贷款的合法性、安全性、盈利性进行调查,测定贷款风险度,并提交分析报告。而传统模式对贷款人进行信用风险评估时,往往会因为各种资料的审查而导致周期过长,严重影响效率,以及贷款人提交的所有资料的真实性也无法确保,从而导致了很多高风险人群因提交了虚假资料及证明或因为评估审查工作人员的疏忽而贷款成功,一旦无法按时还款,就会给银行或放贷单位造成巨大损失。目前基于大数据的客户信用算法都是针对每个新用户进行重新计算,即,针对每个新用户都要重复执行一次信用算法,这样带来的数据处理量较高,而且处理较慢,因此,现有技术并未提供一种比较快速准确的算法,用于检测新用户的风险度。
技术实现思路
针对现有技术存在的技术缺陷,本专利技术的目的是提供一种动态高风险客群检测算法,其用于检测归属于不同客群的新用户的风险度,根据本专利技术的一个方面,提供了一种动态高风险客群检测算法具体实施步骤,其用于检测归属于不同客群的新用户的风险度,包括如下步骤:a.基于评估指标确定每个所述客群的风险度,将所述风险度大于风险阈值的所述客群确定为高风险客群;b.基于距离函数确定所述新用户与所述高风险客群的相似度,将相似度大于第一相似度阈值的所述新用户判定为风险用户,所述距离函数所述新用户的用户数据的种类相关。优选地,所述步骤a之前执行如下步骤:i.使用聚类算法基于多个历史用户的多个历史数据对多个所述历史用户建群形成多个客群,所述聚类算法与所述历史数据的种类相关。优选地,所述步骤i通过如下任一方式实现:-若所述历史数据为通讯录数据或者个人特征数据,基于杰卡德距离算法确定多个所述历史用户彼此之间的相似度,将相似度大于第二相似度阈值的所述历史用户划为一个所述客群;-若所述历史数据为定位数据,基于空间距离算法确定多个所述历史用户彼此之间的相似度,将相似度大于第三相似度阈值的所述历史用户划为一个所述客群;-若所述历史数据为个人信息数据,基于欧式距离算法确定多个所述历史用户彼此之间的相似度,将相似度大于第四相似度阈值的所述历史用户划为一个所述客群。优选地,所述步骤a包括如下步骤:a1.根据所述评估指标的种类筛选所述客群的关联数据;a2.采集超过所述评估指标的所述关联数据的数量和幅度;a3.以所述数量和所述幅度为自变量通过风险评估函数确定所述客群的反馈系数,所述反馈系数即为所述客群的风险度。优选地,所述评估指标基于如下方式确定:-确定所述客群对应的客群数据库的时间分布,基于所述客群数据库的时间分布确定所述评估指标的种类;-基于所述新用户发出的请求类型确定所述评估指标的种类。优选地,所述评估指标为反馈周期最短的指标。优选地,所述新用户与所述高风险客群的相似度通过如下任一方式实现:-若所述用户数据为通讯录数据或者个人特征数据,基于杰卡德距离算法确定所述用户与所述高风险客群之间的相似度;-若所述用户数据为定位数据,基于空间距离算法确定所述用户与所述高风险客群之间的相似度;-若所述用户数据为个人信息数据,基于欧式距离算法确定所述用户与所述高风险客群之间的相似度。优选地,所述用户与所述高风险客群之间的相似度通过如下方式确定:逐一判断所述新用户与所述高风险客户群包括的每个所述历史用户对应的历史数据之间的重合度并获得多个重合度,对所述多个重合度进行处理得到所述用户与所述高风险客群之间的相似度。根据本专利技术的另一个方面,提供了一种动态高风险客群检测系统,其用于检测归属于不同客群的新用户的风险度,包括:高风险客群确定模块1,其用于基于评估指标确定每个所述客群的风险度,将所述风险度大于风险阈值的所述客群确定为高风险客群;风险用户确定模块2,其用于于距离函数确定所述新用户与所述高风险客群的相似度,将相似度大于第一相似度阈值的所述新用户判定为风险用户,所述距离函数所述新用户的用户数据的种类相关。优选地,根据所述动态高风险客群检测算法,还包括:建群模块3,其用于使用聚类算法基于多个历史用户的多个历史数据对多个所述历史用户建群形成多个客群,所述聚类算法与所述历史数据的种类相关。优选地,所述高风险客群确定模块还包括:筛选模块11,其用于根据所述评估指标的种类筛选所述客群的关联数据;采集模块12,其用于采集超过所述评估指标的所述关联数据的数量和幅度;反馈系数确定模块13,其用于以所述数量和所述幅度为自变量通过风险评估函数确定所述客群的反馈系数,所述反馈系数即为所述客群的风险度。优选地,所述高风险客群确定模块包括:评估指标确定模块14,其用于确定所述评估指标的种类。优选地,所述建群模块和/或所述风险用户确定模块还包括:相似度判断模块4,其用于判断用户之间的相似度,所述用户包括历史用户和新用户。本专利技术提供了一种动态风险客群检测算法及系统,使用聚类算法基于多个历史用户的多个历史数据对多个所述历史用户建群形成多个客群,所述聚类算法与所述历史数据的种类相关,基于评估指标确定每个所述客群的风险度,将所述风险度大于风险阈值的所述客群确定为高风险客群,基于距离函数确定所述新用户与所述高风险客群的相似度,将相似度大于第一相似度阈值的所述新用户判定为风险用户,所述距离函数所述新用户的用户数据的种类相关,本专利技术操作简单,使用方便,提供了一种动态风险客群检测算法及相应地系统,具有极高的商业价值。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1示出了本专利技术的第一具体实施方式的,一种动态高风险客群检测算法的具体流程示意图;图2示出了本专利技术的第一实施例的,一种使用聚类算法形成多个客群的动态高风险客群检测算法的具体流程示意图;图3示出了本专利技术的第二实施例的,一种确定每个所述客群的风险度评估指标的具体流程示意图;以及图4示出了本专利技术的另一具体实施方式的,一种动态高风险客群检测系统的模块连接示意图。具体实施方式为了更好的使本专利技术的技术方案清晰地表示出来,下面结合附图对专利技术作进一步说明。图1示出了本专利技术的第一具体实施方式的,一种动态高风险客群检测算法的具体流程示意图,具体地,包括如下步骤:首先,进入步骤S101,基于评估指标确定每个所述客群的风险度,将所述风险度大于风险阈值的所述客群确定为高风险客群,将多个历史用户的多个历史数据对多个所述历史用户建群形成多个客群,并基于评估指标确定每个所述客群的风险度,将所述风险度大于风险阈值的所述客群确定为高风险客群,所述评估指标基于如下方式确定:确定所述客群对应的客群数据库的时间分布,基于所述客群数据库的时间分布确定所本文档来自技高网...
一种动态高风险客群检测方法及系统

【技术保护点】
一种动态高风险客群检测算法,其用于检测归属于不同客群的新用户的风险度,其特征在于,包括:a.基于评估指标确定每个所述客群的风险度,将所述风险度大于风险阈值的所述客群确定为高风险客群;b.基于距离函数确定所述新用户与所述高风险客群的相似度,将相似度大于第一相似度阈值的所述新用户判定为风险用户,所述距离函数所述新用户的用户数据的种类相关。

【技术特征摘要】
1.一种动态高风险客群检测算法,其用于检测归属于不同客群的新用户的风险度,其特征在于,包括:a.基于评估指标确定每个所述客群的风险度,将所述风险度大于风险阈值的所述客群确定为高风险客群;b.基于距离函数确定所述新用户与所述高风险客群的相似度,将相似度大于第一相似度阈值的所述新用户判定为风险用户,所述距离函数所述新用户的用户数据的种类相关。2.根据权利要求1所述的动态高风险客群检测算法,其特征在于,所述步骤a之前执行如下步骤:i.使用聚类算法基于多个历史用户的多个历史数据对多个所述历史用户建群形成多个客群,所述聚类算法与所述历史数据的种类相关。3.根据权利要求3所述的动态高风险客群检测算法,其特征在于,所述步骤i通过如下任一方式实现:-若所述历史数据为通讯录数据或者个人特征数据,基于杰卡德距离算法确定多个所述历史用户彼此之间的相似度,将相似度大于第二相似度阈值的所述历史用户划为一个所述客群;-若所述历史数据为定位数据,基于空间距离算法确定多个所述历史用户彼此之间的相似度,将相似度大于第三相似度阈值的所述历史用户划为一个所述客群;-若所述历史数据为个人信息数据,基于欧式距离算法确定多个所述历史用户彼此之间的相似度,将相似度大于第四相似度阈值的所述历史用户划为一个所述客群。4.根据权利要求1至3中任一项所述的动态高风险客群检测算法,其特征在于,所述步骤a包括如下步骤:a1.根据所述评估指标的种类筛选所述客群的关联数据;a2.采集超过所述评估指标的所述关联数据的数量和幅度;a3.以所述数量和所述幅度为自变量通过风险评估函数确定所述客群的反馈系数,所述反馈系数即为所述客群的风险度。5.根据权利要求1所述的动态高风险客群检测算法,其特征在于,所述评估指标基于如下方式确定:-确定所述客群对应的客群数据库的时间分布,基于所述客群数据库的时间分布确定所述评估指标的种类;-基于所述新用户发出的请求类型确定所述评估指标的种类。6.根据权利要求5所述的动态高风险客群检测算法,其特征在于,所述评估指标为反馈周期最短的指标。7.根据权利要求1至6中任一项所述的动态高风险客群检测算法,其特征在于,所述新用户与所述高风险客群的相似度通过如下任一方式实现:-若所述用户...

【专利技术属性】
技术研发人员:王军伟信亚楠彭亚栋
申请(专利权)人:上海二三四五金融科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1