一种基于联合卷积神经网络的催收风险评级方法及系统技术方案

技术编号:27688001 阅读:22 留言:0更新日期:2021-03-17 04:13
本发明专利技术提供了一种基于联合卷积神经网络的催收风险评级方法及系统,通过获得第一历史催收数据信息;对第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息;对第一训练样本数据信息进行预处理,获得第一待输入数据,其中,第一待输入数据为尺寸归一化为相同记录数量的数据;按照预设要求,构建卷积神经网络模型;将第一训练样本数据信息输入至卷积神经网络模型中,完成对卷积神经网络模型的训练;将第一待测数据信息输入至训练完成后的卷积神经网络模型中;获得卷积神经网络模型的第一输出结果,第一输出结果为第一行为风险归类结果,达到了降低了催收风险评级成本,提高了催收风险评级准确率的技术效果。

【技术实现步骤摘要】
一种基于联合卷积神经网络的催收风险评级方法及系统
本专利技术涉及催收风险评级
,尤其涉及一种基于联合卷积神经网络的催收风险评级方法及系统。
技术介绍
目前,很多银行贷款、信用卡等逾期后的催收业务大多交由第三方债务催收公司进行催缴。通过这种金融服务外包的方式催收主要有以下几种形式:电话催收、家访催收、暴力催收和法律催收。通过每笔逾期贷款的逾期天数来决定使用哪种形式的催收方式,并未对逾期还款的客户种类进行区分,从而不能达到精准催收的效果。若能在催收的早期阶段就能对逾期还款的客户进行精细化分类,也就是把将要变为不良客户的高风险客户和可以主动还款的低风险客户区分开来,对前者尽快采取强硬的催收手段,而对后者仅做提醒,不仅提高了催收效率,还能降低催收成本。应用技术手段可以让客户分类的实现更加合理和高效,为国内商业银行优化资源配置、增强个人业务贷后催收管理能力提供借鉴与参考。传统催收对于客户的评级,大多采用人工分析或简单模型的方式。对于人工评级的方法,既耗时耗力,结果又与评级业务员的经验与主观判断强关联,容易造成结果误判;而对于简单模型的方法,如决策树或者逻辑回归等,一般只基于少量指标或客户的最近一条记录进行分析,无法综合客户的全部历史记录,使得模型的泛化能力弱,导致模型对新数据欠佳的分类结果,具有局限性。而卷积神经网络替代了以上特征提取方法,其深层结构使其能够自动提取数据的深度鲁棒信息,利于分类器的训练和最终的目标检测。但本专利技术申请人发现现有技术至少存在如下技术问题:现有技术中的卷积神经网络在提取特征时,未使用到浅层特征信息,会导致网络出现梯度消失的问题,使得网络训练困难。同时普通的卷积网络对不同排序数据的输入,会得到不同的输出结果,会对风险分类结果造成影响。
技术实现思路
本专利技术实施例提供了一种基于联合卷积神经网络的催收风险评级方法及系统,解决了现有技术中的卷积神经网络在提取特征时,未使用到浅层特征信息,导致网络出现梯度消失,使得网络训练困难,同时还存在风险分类结果准确度差的技术问题,达到了降低催收风险评级成本,提高催收风险评级准确率,能够提高客户的风险评分精度,可行性和鲁棒性高的技术效果。鉴于上述问题,提出了本申请实施例以便提供一种基于联合卷积神经网络的催收风险评级方法及系统。第一方面,本专利技术提供了一种基于联合卷积神经网络的催收风险评级方法,所述方法包括:步骤1:获得第一历史催收数据信息;步骤2:对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;步骤3:对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,且所述第一待输入数据为单人历史行为数据Fl0;步骤4:按照预设要求,构建卷积神经网络模型;步骤5:将所述第一训练样本数据信息输入至所述卷积神经网络模型中,采用交叉熵损失函数、反向传播算法对所述卷积神经网络模型参数进行调整之后,将softmax回归作为分类算法,完成对所述卷积神经网络模型的训练;步骤6:将所述第一待测数据信息输入至训练完成后的所述卷积神经网络模型中;步骤7:获得所述卷积神经网络模型的第一输出结果,其中,所述第一输出结果为第一行为风险归类结果。第二方面,本专利技术提供了一种基于联合卷积神经网络的催收风险评级系统,所述系统包括:第一获得单元,所述第一获得单元用于获得第一历史催收数据信息;第二获得单元,所述第二获得单元用于对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;第一执行单元,所述第一执行单元用于对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,其中,所述第一待输入数据为单人历史行为数据Fl0;第一构建单元,所述第一构建单元用于按照预设要求,构建卷积神经网络模型;第二执行单元,所述第二执行单元用于将所述第一训练样本数据信息输入至所述卷积神经网络模型中,采用交叉熵损失函数、反向传播算法对所述卷积神经网络模型参数进行调整之后,将softmax回归作为分类算法,完成对所述卷积神经网络模型的训练;第一输入单元,所述第一输入单元用于将所述第一待测数据信息输入至训练完成后的所述卷积神经网络模型中;第三获得单元,所述第三获得单元用于获得所述卷积神经网络模型的第一输出结果,其中,所述第一输出结果为第一行为风险归类结果。第三方面,本专利技术提供了一种基于联合卷积神经网络的催收风险评级系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述第一方面的方法的步骤。本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:本专利技术实施例提供的一种基于联合卷积神经网络的催收风险评级方法及系统,通过设计并实现联合卷积层用于局部特征提取,其中,联合卷积层首先联合所有浅层的特征图,将所有数据记录对应的浅层特征向量拼接后,再经过MLP进行特征提取得到该记录的输出特征向量,然后将所有记录的输出特征向量组合得到客户数据的特征图;使用预处理后的客户数据作为样本集训练网络,并将训练后的卷积神经网络处理待测数据,根据卷积神经网络的输出向量判断当前客户的风险评分,从而解决了现有技术中的卷积神经网络在提取特征时,未使用到浅层特征信息,导致网络出现梯度消失,使得网络训练困难,同时还存在风险分类结果准确度差的技术问题,达到了降低了催收风险评级成本,提高了催收风险评级准确率,能够提高客户的风险评分精度,可行性和鲁棒性高的技术效果。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明图1为本专利技术实施例中一种基于联合卷积神经网络的催收风险评级方法的流程示意图;图2为本专利技术实施例中一种基于联合卷积神经网络的催收风险评级方法的另一流程示意图;图3为本专利技术实施例中一种基于联合卷积神经网络的催收风险评级方法的基于联合卷积的深度神经网络示意图;图4为本专利技术实施例中一种基于联合卷积神经网络的催收风险评级方法的联合卷积层UConv结构图;图5为本专利技术实施例中一种基于联合卷积神经网络的催收风险评级方法的客户单条记录指标示意图;图6为本专利技术实施例中一种基于联合卷积神经网络的催收风险评级系统的结构示意图;图7为本专利技术实施例中另一种示例性电子设备的结构示意图。附图标记说明:第一获得单元11,第二获得单元12,第一执行单元13,第一构建单元14,第二执行单元15,第一输入单元16,第三获得单元17,本文档来自技高网
...

【技术保护点】
1.一种基于联合卷积神经网络的催收风险评级方法,其中,所述方法包括:/n步骤1:获得第一历史催收数据信息;/n步骤2:对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;/n步骤3:对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,且所述第一待输入数据为单人历史行为数据F

【技术特征摘要】
1.一种基于联合卷积神经网络的催收风险评级方法,其中,所述方法包括:
步骤1:获得第一历史催收数据信息;
步骤2:对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;
步骤3:对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,且所述第一待输入数据为单人历史行为数据Fl0;
步骤4:按照预设要求,构建卷积神经网络模型;
步骤5:将所述第一训练样本数据信息输入至所述卷积神经网络模型中,采用交叉熵损失函数、反向传播算法对所述卷积神经网络模型参数进行调整之后,将softmax回归作为分类算法,完成对所述卷积神经网络模型的训练;
步骤6:将所述第一待测数据信息输入至训练完成后的所述卷积神经网络模型中;
步骤7:获得所述卷积神经网络模型的第一输出结果,其中,所述第一输出结果为第一行为风险归类结果。


2.如权利要求1所述的方法,其中,在所述步骤3中,所述方法包括:
获得现存行为数据信息;
根据所述现存行为数据信息,确定所有客户记录数量的中位数,并根据所述所有客户记录数量的中位数,获得输入的单个客户数据的条数n;
分别判断所述所有客户的客户数据的条数是否满足n条记录;
如果所述客户数据的条数少于所述n条记录,则从所述现存行为数据信息中按照随机抽样的方式,复制并扩充为n×d大小的客户数据,其中,d为每条历史记录的维度;
如果所述客户数据的条数多于所述n条记录,则从所述现存行为数据信息中按照时间降采样为所述n×d大小的客户数据。


3.如权利要求1所述的方法,其中,在所述步骤4中,所述方法包括:
获得所述卷积神经网络模型的基础信息,其中,所述卷积神经网络模型的包括10层,具体包括:四个联合卷积层、其中,所述四个联合卷积层分别为第一联合卷积层u_conv1、第二联合卷积层u_conv2、第三联合卷积层u_conv3、第四联合卷积层u_conv4,全局特征提取的MLP层m_1、最大池化MaxPooing层和一个由三层的MLP与一个softmax回归层组成的分类器,其中,所述卷积神经网络模型的输入数据为大小为n×d的单人历史行为记录数据Fl0;
根据所述基础信息,将所述单人历史行为记录数据Fl0依次通过所述第一联合卷积层u_conv1输出大小为n×64的特征图Fl1、通过所述第二联合卷积层u_conv2得到大小为n×64的特征图Fl2、通过所述第三联合卷积层u_conv3得到大小为n×64特征图Fl3、通过所述第四联合卷积层u_conv4得到大小为n×128的特征图Fl4;
将所述Fl0、所述Fl1、所述Fl2、所述Fl3、所述Fl4进行拼接,获得大小为n×323的局部特征图Fl;
将所述Fl输入至所述全局特征提取的MLP层m_1中,获得大小为n×1024的全局特征图FG;
将所述FG输入至所述最大池化MaxPooing层中,获得大小为1×1024的全局特征向量VG;
将所述VG输入至所述分类器中,其中,所述分类器中三层的MLP的第一层包括512个1×1的卷积核、第二层包括256个1×1的卷积核、第三层包括s个1×1的卷积核,其中,s为样本中风险等级数目;
将所述分类器的输出结果输入至所述softmax回归层中,获得大小为1×s的输出向量。


4.如权利要求3所述的方法,其中,所述联合卷积层具体包括:
根据第L+1层(L∈{0,1,2,3})联合卷积层u_conv(L+1),将所有浅层Fl0,...,FlL中每条记录i的特征向量(xi0,...,xiL)进行拼接之后,经过组合后输入组成所述联合卷积层的单层MLP中,进...

【专利技术属性】
技术研发人员:邹英华许世伟彭戈董希伟马刚甘厚勇
申请(专利权)人:中信银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1