一种信贷客户自动分群系统技术方案

技术编号:31623933 阅读:27 留言:0更新日期:2021-12-29 19:00
本发明专利技术公开了一种信贷客户自动分群系统,包括采集端和服务端,所述采集端,用于采集目标用户画像数据;所述服务端,用于将所述用户画像数据输入预置的信贷分群模型中,预测目标用户的信贷分群结果;所述信贷分群模型为经过训练的模糊K近邻算法模型;所述信贷分群模型在训练过程中,采用改进的斑点鬣狗算法优化模糊K近邻算法模型的参数组合(k,m),其中k为权值参数,m为阈值参数。本发明专利技术基于深度学习得到的神经网络模型评估用户的信贷分群结果,相比传统固定规则的计算评估,评估效果更好,输出的信贷分群结果参考性很强。的信贷分群结果参考性很强。的信贷分群结果参考性很强。

【技术实现步骤摘要】
一种信贷客户自动分群系统


[0001]本专利技术属于互联网金融
,尤其涉及一种信贷客户自动分群系统。

技术介绍

[0002]随着互联网金融的快速发展,不同人群对于信贷产品有不同的需求,金融公司需要对客户分群,主要是根据用户个人属性、历史行为特征和偏好等属性进行精准分群,定位不同用户的需求,根据不同用户的需求进行差异化运营,比如提供不同的信贷产品,客户分群能够实现利润最大化,成为互联网金融企业迫切追求的目标。现有技术中的客户分群方法,主要为人工分群,具有快速简单的优点,但缺陷也很明显:阈值的设定容易带入人为主观性,特征简单准确率不高,用户分层越多区分度越低,不能满足在信贷业务中更精细化的需求。如何提高对客户分群的准确性是目前本领域技术人员亟待解决的问题。

技术实现思路

[0003]本专利技术所要解决的技术问题在于针对上述现有技术中的不足,提供一种信贷客户自动分群系统,基于深度学习得到的神经网络模型评估用户的信贷分群结果,相比传统固定规则的计算评估,评估效果更好,输出的信贷分群结果参考性很强。
[0004]为解决上述技术问题,本专利技术采用的技术方案是:一种信贷客户自动分群系统,包括采集端和服务端,
[0005]所述采集端,用于采集目标用户画像数据;
[0006]所述服务端,用于将所述用户画像数据输入预置的信贷分群模型中,预测目标用户的信贷分群结果;
[0007]所述信贷分群模型为经过训练的模糊K近邻算法模型;
[0008]所述信贷分群模型在训练过程中,采用改进的斑点鬣狗算法优化模糊 K近邻算法模型的参数组合(k,m),其中k为权值参数,m为阈值参数;
[0009]采用改进的斑点鬣狗算法执行优化时,所述斑点鬣狗算法的控制因子 h的递减方式,具体所示:
[0010][0011]其中,t为当前迭代次数,T表示最大迭代次数;Q表示衰减系数,Q 取值范围为[0,10]的整数值。
[0012]上述信贷客户自动分群系统,采用改进的斑点鬣狗算法执行优化时,斑点鬣狗算法基于混沌Tent映射理论产生鬣狗种群的初始位置。
[0013]上述信贷客户自动分群系统,所述目标用户画像数据包括用户个人信息、贷款信息和用户行为数据;
[0014]用户个人信息包括:个人基本信息、职业信息、信用信息、消费特征信息、兴趣爱好信息;
[0015]贷款信息包括:贷款申请次数、申请金额、放款金额、还款历史、逾期历史、催收历史、逾期次数、逾期天数;
[0016]用户行为数据通过信贷软件的用户端的操作埋点数据获取,对用户行为的每一个事件对应的位置进行开发埋点,事件对应的行为包括:打开、注册、点击、申请、提现,采集整个行为链路的数据信息以及用户个人属性,并通过信贷软件的用户端开发工具包SDK上传的埋点数据至信贷软件的服务端,信贷软件的服务端将埋点数据记录并汇总后生成用户行为数据,生成时序化特征发送至所述采集端,时序化特征包括:登录采集端的次数、最近一次登录时间、最近网页点击次数、点击频率、页面停留时间。
[0017]上述信贷客户自动分群系统,所述采集端采集目标用户画像数据时,还包括对采集到的目标用户画像数据进行异常值判定、缺失值处理和标准化处理;
[0018]异常值判定:根据描述性统计画出目标用户画像数据对应的变量的箱线图,大于或小于箱型图设定的上下界的数值即为异常值,将异常值视为缺失值,执行缺失值处理;
[0019]缺失值处理:根据描述性统计,查看缺失值的缺失数量以及比例,当目标用户画像数据对应的特征的缺失率低于指定阈值并且所述缺失值在样本中随机出现,采用均值、中位数或众数填充,当该特征的缺失率大于指定阈值,且变量的解释性与分群相关不高时,直接删除该条特征。
[0020]上述信贷客户自动分群系统,所述模糊K近邻算法模型训练时,对样本数据采用五折交叉验证方式划分训练集和验证集两部分。
[0021]上述信贷客户自动分群系统,所述模糊K近邻算法模型训练时,将样本数据对应的样本用户分成特优客户、优质客户、一般用户、谨慎放款客户,对所述样本数据标记对应的用户分群标签,形成训练用的样本数据。
[0022]上述信贷客户自动分群系统,采用改进的斑点鬣狗算法执行优化时,包括以下步骤:
[0023]步骤1、参数初始化;其中,初始化的参数包括:种群个数N、最大迭代次数Max
_iter
、k的搜索空间[k
min
,k
max
]和m的搜索空间[m
min
,m
max
];
[0024]步骤2、种群位置初始化:随机产生N个个体位置,其中第i个个体的位置为X
i
=(x
i1
,x
i2
),i=1,2,

,N;其中,x
i1
表示个体i在当前位置时的k值,x
i2
表示个体i在当前位置时的m值;
[0025]步骤3、对N个个体计算其适应度fi,该适应度值是基于个体i当前位置的k和m值;首先,根据公式(1)以内部K折交叉验证策略计算模糊K 近邻算法模型的准确度ACC,并将该值作为个体i的适应度f
i
的值;然后,根据公式(2)更新领队的位置,根据公式(3)更新跟随者的位置;
[0026]公式(1)为
[0027]公式(2)为
[0028]公式(3)为
[0029]步骤4、采取和步骤2和步骤3中相同的k和m编码方式后以内部K 折交叉验证策略计算每一个个体的适应度;
[0030]步骤5、判断是否超过最大迭代次数Max_iter;若否,则跳转至步骤 3;若是,则执行下一步骤6;
[0031]步骤6、输出个体最佳位置bestPosition及其对应的适应度,即最优的近邻个数k和模糊强度系数m值;
[0032]步骤7、直至迭代次数达到设定的最大迭代次数,返回最佳解作为最佳模糊K近邻算法模型参数对(k,m)。
[0033]本专利技术与现有技术相比具有以下优点:本专利技术基于深度学习得到的神经网络模型评估用户的信贷分群结果,相比传统固定规则的计算评估,评估效果更好,输出的信贷分群结果参考性很强。
[0034]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
附图说明
[0035]图1为本专利技术的系统架构图。
具体实施方式
[0036]如图1所示,一种信贷客户自动分群系统,包括采集端100和服务端 200,
[0037]所述采集端100,用于采集目标用户画像数据;
[0038]所述服务端200,用于将所述用户画像数据输入预置的信贷分群模型中,预测目标用户的信贷分群结果;
[0039]所述信贷分群模型为经过训练的模糊K近邻算法模型;
[0040]所述信贷分群模型在训练过程中,采用改进的斑点鬣狗算法优化模糊 K近邻算法模型的参数组合(k,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信贷客户自动分群系统,其特征在于,包括采集端和服务端,所述采集端,用于采集目标用户画像数据;所述服务端,用于将所述用户画像数据输入预置的信贷分群模型中,预测目标用户的信贷分群结果;所述信贷分群模型为经过训练的模糊K近邻算法模型;所述信贷分群模型在训练过程中,采用改进的斑点鬣狗算法优化模糊K近邻算法模型的参数组合(k,m),其中k为权值参数,m为阈值参数;采用改进的斑点鬣狗算法执行优化时,所述斑点鬣狗算法的控制因子h的递减方式,具体所示:其中,t为当前迭代次数,T表示最大迭代次数;Q表示衰减系数,Q取值范围为[0,10]的整数值。2.按照权利要求1所述的一种信贷客户自动分群系统,其特征在于,采用改进的斑点鬣狗算法执行优化时,斑点鬣狗算法基于混沌Tent映射理论产生鬣狗种群的初始位置。3.按照权利要求1所述的一种信贷客户自动分群系统,其特征在于,所述目标用户画像数据包括用户个人信息、贷款信息和用户行为数据;用户个人信息包括:个人基本信息、职业信息、信用信息、消费特征信息、兴趣爱好信息;贷款信息包括:贷款申请次数、申请金额、放款金额、还款历史、逾期历史、催收历史、逾期次数、逾期天数;用户行为数据通过信贷软件的用户端的操作埋点数据获取,对用户行为的每一个事件对应的位置进行开发埋点,事件对应的行为包括:打开、注册、点击、申请、提现,采集整个行为链路的数据信息以及用户个人属性,并通过信贷软件的用户端开发工具包SDK上传的埋点数据至信贷软件的服务端,信贷软件的服务端将埋点数据记录并汇总后生成用户行为数据,生成时序化特征发送至所述采集端,时序化特征包括:登录采集端的次数、最近一次登录时间、最近网页点击次数、点击频率、页面停留时间。4.按照权利要求1所述的一种信贷客户自动分群系统,其特征在于,所述采集端采集目标用户画像数据时,还包括对采集到的目标用户画像数据进行异常值判定、缺失值处理和标准化处理;异常值判定:根据描述性统计画出目标用户画像数据对应的变量的箱线图,大于或小于箱型图设定的上下界的数值即为异常值,将异常值视为缺失值,执行缺失值处理;缺失值处理:根据描述性统计,查看缺失值的缺失数量以及比例,当目标用户画像数据对应的特征的缺失率低于指定阈值并且所述缺失值在样本中随机出现,采用均值、中位数或众数填充,当该特征的缺失率大于...

【专利技术属性】
技术研发人员:江远强韩逸李兰
申请(专利权)人:百维金科上海信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1