基于特征熵的客户利率敏感度预测方法技术

技术编号:32648966 阅读:15 留言:0更新日期:2022-03-12 18:36
本申请公开了一种基于特征熵的客户利率敏感度预测方法,该方法包括:选取与利率敏感度相关的多个特征数据作为评价指标;根据熵值法计算各评价指标的权重及评分值;完成指标分箱计算各指标对应的woe值,根据woe值构建线性回归模型并计算回归系数;创建评分公式,计算客户总得分;基于该总得分确定客户利率敏感度。本发明专利技术基于成熟的熵值信息论理论和机器学习方法,模型评分区分度高,减少了基于专家经验评判所需繁杂评估过程,使得评分过程更加简单,效果更好且技术易于实现。效果更好且技术易于实现。效果更好且技术易于实现。

【技术实现步骤摘要】
基于特征熵的客户利率敏感度预测方法


[0001]本专利技术属于人工智能与机器学习领域,尤其涉及一种基于特征熵的客户利率敏感度预测方法。

技术介绍

[0002]信息熵通常用来描述整个随机分布所带来的信息量平均值,具统计特性。信息熵也叫香农熵,在机器学习中,由于熵的计算是依据样本数据而来,故也叫经验熵。其公式定义如下:
[0003][0004]从公式可以看出,信息熵的公式,其中对概率取负对数表示了一种可能事件发生时候携带出的信息量。把各种可能表示出的信息量乘以其发生的概率之后求和,就表示了整个系统所有信息量的一种期望值,事件发生的概率越低,其发生时所能给出的信息量越大。从这个角度来说信息熵还可以作为一个系统复杂程度的度量,如果系统越复杂,出现不同情况的种类越多,那么他的信息熵是比较大的。如果一个系统越简单,出现情况种类很少(极端情况为1种情况,那么对应概率为1,那么对应的信息熵为0),此时的信息熵较小。故而随机变量取值个数越多,状态数也就越多,累加次数就越多,信息熵就越大,混乱程度就越大,纯度越小。
[0005]层次分析法(AHP)和美国个人信用评分方法(FICO),是目前对个人消费信用评估的一种常见的方法,金融机构根据个人信用评级来决定是否给借款人发放贷款,但是,上述两种评分方法比较复杂,通常还需要结合专家经验评判,评估过程繁杂。

技术实现思路

[0006]基于现有技术中的缺陷,本专利技术的目的是,提供一种基于特征熵的客户利率敏感度预测方法,基于成熟的信息论理论和机器学习方法,在客户利率敏感度评价中对于高利率敏感度和低利率敏感度区分度要高于现有方法,模型评分区分度高,减少了基于专家经验评判所需繁杂评估过程,使得评分过程更加简单,效果更好且技术易于实现。
[0007]本专利技术的第一方面,提供了一种基于特征熵的客户利率敏感度预测方法,包括:
[0008]选取与利率敏感度相关的多个特征数据作为评价指标;
[0009]根据熵值法计算各评价指标的权重及评分值;
[0010]完成指标分箱计算各指标对应的woe值,根据woe值构建线性回归模型并计算回归系数;
[0011]创建评分公式,计算客户总得分;
[0012]基于该总得分确定客户利率敏感度。
[0013]进一步地,基于确定的所述客户利率敏感度对用户进行敏感度分级,并基于不同分级的用户采用不同的服务策略。
[0014]进一步地,创建的所述评分公式如下:
[0015][0016]其中,BaseScore是客户利率敏感度基准分,每个客户初始分值相同,Factor是调节因子,用以使评分区间处于规定区间,W为每个特征基于信息熵计算出来的权重,β为特征系数。
[0017]进一步地,调节因子Factor和基准分BaseScor分别采用如下公式计算出:
[0018][0019]MaxScore和MinScore分别为最大评分和最小评分,MaxScore和MinScore由如下公式计算出:
[0020][0021]进一步地,根据熵值法计算各评价指标的权重及评分值包括:
[0022]第一步,抽取数据矩阵:其中,X
ij
为第i个方案第j个指标的数值,i=1,2,

,n,j=1,2,

,m;
[0023]第二步,计算第j个指标中第i个值的权重:
[0024]第三步,计算第j项指标的熵值:其中,k为大于0的常数,k=l/ln(n)>0,ln为自然对数,e
j
≥0;
[0025]第四步,计算第j项指标的差异系数:g
j
=1

e
j

[0026]第五步,计算各指标的权重值:
[0027]第六步,计算各方案的评分:
[0028]进一步地,所述WOE值通过如下公式计算:WOE=ln(正向类别占比/负向类别占比)
×
100%。
[0029]进一步地,对选取的特征数据还进行如下的预处理过程:对特征数据中出现的空
值或异常值进行相应的处理,并对处理后的数据再进行数据标准化处理。
[0030]进一步地,所述数据标准化处理包括:
[0031]对特征数据进行正向指标和负向指标的分类,其中,
[0032]正向指标:
[0033]负向指标:
[0034]X
ij
为第i个方案第j个指标的数值,i=1,2,

,n,j=1,2,

,m。
[0035]进一步地,所述的特征数据包括:客户历史借贷利率相关的数据、客户消费行为相关的数据、客户资产相关的数据。
[0036]本专利技术的另一方面还提供了一种计算机程序,用于当所述计算机程序在计算机、处理器或可编程硬件组件上运行时执行根据本专利技术的第一方面所述的方法之一或全部。
[0037]与现有技术相比,本专利技术所提供的一种基于特征熵的客户利率敏感度预测方法,具有如下技术效果:
[0038]1、通过创建新的客户利率敏感度评分模型,通过引入调节因子Factor和熵值W,既可以使评分区间控制在合理范围内又能实现指标分值动态调整,并可按照一定周期更新,同时能够输出评分卡,更直观看出评分过程。
[0039]2、对比现有的评估方法,存在特征信息丢失和过度依赖专家经验的问题,采用本申请的方法通过信息论和机器学习相结合方法,综合考虑了特征与目标变量的相关性和特征本身包含的信息量,通过引入特征权重因子,防止信息丢失,通过KS检验效果优于现有评分方法,提升3PP。
[0040]3、相比现有的通过业务经验模型修正、“专家打分”等评估方法,费时耗力,本申请的方法基于数据特征挖掘信息,输出评分过程无需基于专家经验,易于实现且防止人工干预。
附图说明
[0041]图1是本专利技术实施例中的基于特征熵的客户利率敏感度预测方法的流程示意图。
[0042]图2(a)是采用本申请的熵值法计算的KS曲线图。
[0043]图2(b)是采用FICO方法计算的KS曲线图。
[0044]图2(c)是采用AHP方法计算的KS曲线图。
具体实施方式
[0045]以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。如在说明书及权利要求当中使用了某些词汇来指称特定部件。本领域技术人员应可理解,硬件或软件制造商可能会用不同名词来称呼同一个部件。本说明书及权利要求并不以名称的差异来作为区分部件的方式,而是以部件在功能上的差异来作为区分的准则。说明书后续描述为实施本专利技术的较佳实施方式,然所述描述乃以说明本专利技术的一般原则为目的,并非用以限定本专利技术的范围。本专利技术的保护范围当视所附权利要求所界定者为
准。
[0046]下面结合附图和具体实施例对本专利技术做进一步详细说明。
[0047]消费金融行业离不开精准营销,消费金本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征熵的客户利率敏感度预测方法,其特征在于,该方法包括:选取与利率敏感度相关的多个特征数据作为评价指标;根据熵值法计算各评价指标的权重及评分值;完成指标分箱计算各指标对应的woe值,根据woe值构建线性回归模型并计算回归系数;创建评分公式,计算客户总得分;基于该总得分确定客户利率敏感度。2.如权利要求1所述的预测方法,其特征在于,基于确定的所述客户利率敏感度对用户进行敏感度分级,并基于不同分级的用户采用不同的服务策略。3.如权利要求1所述的预测方法,其特征在于,创建的所述评分公式如下:其中,BaseScore是客户利率敏感度基准分,每个客户初始的基准分相同,Factor是调节因子,用以使评分区间处于规定区间,W为每个特征基于熵值法计算出来的权重,β为特征系数。4.如权利要求3所述的预测方法,其特征在于,调节因子Factor和基准分BaseScor分别采用如下公式计算出:采用如下公式计算出:MaxScore和MinScore分别为最大评分和最小评分,MaxScore和MinScore由如下公式联合计算出:合计算出:5.如权利要求1所述的预测方法,其特征在于,根据熵值法计算各评价指标的权重及评分值包括:第一步,抽取数据矩阵:其中,X
ij
为第i个方案第j个指标的数值,i=1,2,

,n,j=1,2,

,m;第二步,计算第j个指标中第i个值的权重P
...

【专利技术属性】
技术研发人员:曹文彬
申请(专利权)人:南京星云数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1