不良资产的借款对象人群分类方法及装置、介质、设备制造方法及图纸

技术编号:32116750 阅读:18 留言:0更新日期:2022-01-29 19:01
本发明专利技术提供了一种不良资产的借款对象人群分类方法及装置、介质、设备,通过获取待处理的不良资产包中的多个借款对象的资产特征数据;根据预设的目标特征分类模型对资产特征数据进行分类,得到分类后的目标资产特征数据;对预设特征类别进行归类,得到综合特征类别;将综合分类类别中的预设特征类别对应的目标资产特征数据作为综合特征数据,对借款对象的综合特征数据进行特征标准化计算,得到借款对象的资产特征标准值;根据资产特征标准值对不良资产包进行借款对象人群分类,得到不良资产包的借款对象人群分类结果。本发明专利技术能够实现流程化、自动化、高效化的批量不良资产借款对象人群分类,大大减少了人力及时间成本。大大减少了人力及时间成本。大大减少了人力及时间成本。

【技术实现步骤摘要】
不良资产的借款对象人群分类方法及装置、介质、设备


[0001]本专利技术涉及数据处理
,特别是一种不良资产的借款对象人群分类方法及装置、介质、设备。

技术介绍

[0002]不良资产是指在金融信贷领域中借款对象不能按期、按量归还本息或信贷企业无法处置的资产,例如无法处置的抵押房产等。为了减少不良资产带来的经济损失,信贷企业利用大数据方法会对不良资产包中的不良资产人群进行分类,以便根据人群分类有目的、准确地定制催收方案。
[0003]目前的不良资产的个人借款对象人群分类方案中,人群分类通常需要通过提取大量的不良资产人信息来判断人群类别。但由于不良资产包中的数据为非结构化的,且结构化后的特征存在多种不适于直接使用的情况,如数据缺失值超过阈值、数据异常值超过阈值、数据为是否类等。在这些不适于直接使用情况下,如果由人工对特征数据情况进行逐个计算选择,会非常耗时耗力,且每当有新增的不良资产人群时,则需要人工重新整理信息进行人群分类,增加了分类工作的重复性和繁杂度。

技术实现思路

[0004]鉴于上述问题,本专利技术提出了一种不良资产的借款对象人群分类方法及装置、介质、设备,能够实现流程化、自动化、高效化的批量不良资产借款对象人群分类,大大减少了人力及时间成本。
[0005]依据本专利技术第一方面,提供了一种不良资产的借款对象人群分类方法,包括:
[0006]获取待处理的不良资产包中的多个借款对象的资产特征数据;
[0007]根据预设的目标特征分类模型对所述资产特征数据进行分类,得到分类后的目标资产特征数据;其中,所述目标资产特征数据为与预设特征类别对应的资产特征数据;
[0008]对所述预设特征类别进行归类,得到综合特征类别;其中,所述综合特征类别包括基础类特征、是否类特征以及其他类特征中至少之一;
[0009]将所述综合分类类别中的预设特征类别对应的目标资产特征数据作为综合特征数据,对所述借款对象的综合特征数据进行特征标准化计算,得到所述借款对象的资产特征标准值;
[0010]根据所述资产特征标准值对所述不良资产包进行借款对象人群分类,得到所述不良资产包的借款对象人群分类结果。
[0011]可选地,所述综合特征数据包括基础类特征数据、是否类特征数据以及其他类特征数据中至少之一;
[0012]所述对所述借款对象的综合特征数据进行特征标准化计算,包括:
[0013]基于所述基础类特征数据评估所述借款对象的基础类特征加权值,以及基于所述是否类特征数据评估所述借款对象的是否类特征综合值;
[0014]利用预设的特征评估规则对所述基础类特征加权值、所述是否类特征综合值以及所述其他类特征数据进行特征标准化计算。
[0015]可选地,所述根据预设的目标特征分类模型对所述资产特征数据进行分类之前,所述方法还包括:
[0016]构建基于正则表达式提取和聚类算法的特征分类模型;
[0017]任选部分所述资产特征数据作为模型训练样本数据,利用所述特征分类模型对所述模型训练样本数据进行分类,得到所述模型训练样本数据的模型分类结果;
[0018]根据所述模型训练样本数据的人工标准结果计算所述模型分类结果的准确率,若所述准确率达到预设值,将所述特征分类模型作为目标特征分类模型;
[0019]若所述准确率未达到预设值,利用所述模型分类结果中与所述人工标准结果不同的反例特征数据训练所述特征分类模型,直到得到模型分类结果的准确率达到预设值的目标特征分类模型。
[0020]可选地,所述基础类特征数据为与所述借款对象受教育水平、家庭因素以及个人资产相关的特征数据,包括受教育程度、婚否、有子或无子、有房或无房、有车或无车中至少之一;
[0021]所述基于所述基础类特征数据评估所述借款对象的基础类特征加权值,包括:
[0022]判断所述基础类特征数据中是否存在缺失特征,若存在,基于与所述缺失特征相关的其他目标资产特征数据对所述缺失特征进行特征补充;
[0023]利用预设的特征预测模型对所述基础类特征数据进行特征预测,得到所述借款对象的受教育水平估值、家庭因素估值以及资产估值;
[0024]通过XGboost的get_fscore算法对所述借款对象的受教育水平估值、家庭因素估值以及个人资产估值进行重要度加权,得到所述借款对象的基础类特征加权值。
[0025]可选地,所述是否类特征数据为所述目标资产特征数据中除所述基础类特征数据外的是否类的特征数据;
[0026]所述基于所述是否类特征数据评估所述借款对象的是否类特征综合值,包括:
[0027]判断所述是否类特征数据中是否存在缺失特征,若存在,基于与所述缺失特征相关的目标资产特征数据对所述缺失特征进行特征补充;
[0028]若所述目标资产特征数据中不存在与所述缺失特征相关的特征数据,利用高维映射算法对所述缺失特征进行与所述缺失特征的同特征类别对应的其他目标资产特征数据类似的特征补充;
[0029]利用二叉树算法对所述是否类特征数据的重要度进行计算,得到所述借款对象的是否类特征综合值。
[0030]可选地,所述利用预设的特征评估规则对所述基础类特征加权值、所述是否类特征综合值以及所述其他类特征数据进行特征标准化计算,包括:
[0031]采用嵌入式算法对所述基础类特征加权值、所述是否类特征综合值以及所述其他类特征数据进行特征选择,得到目标特征数据;
[0032]对所述目标特征数据进行缺失和/或异常处理,包括:判断所述目标特征数据中是否存在缺失特征,若存在,利用回归填补法对所述目标特征数据进行缺失特征填充;和/或,利用四分位数展布法检测并填充所述目标特征数据中的异常特征;
[0033]对处理后的所述目标特征数据进行特征标准化计算,得到所述借款对象的资产特征标准值,所述资产特征标准值取值范围为[0,1]。
[0034]可选地,所述根据所述资产特征标准值对所述不良资产包进行借款对象人群分类,包括:
[0035]将所述借款对象的资产特征标准值作为特征向量;
[0036]利用基于欧式距离的聚类算法对所述不良资产包进行借款对象人群分类,具体包括:在所有特征向量中随机选择k个特征向量作为簇中心,通过计算其他每个特征向量到各所述簇中心的距离对所述特征向量进行划分,形成多个簇,并重新计算每个簇的平均特征向量值作为新的簇中心,基于新的簇中心不断重复特征向量划分操作,直到得到固定的簇,作为所述不良资产包的借款对象人群分类结果。
[0037]依据本专利技术第二方面,提出了一种不良资产的借款对象人群分类装置,包括:
[0038]数据获取模块,用于获取待处理的不良资产包中的多个借款对象的资产特征数据;
[0039]特征分类模块,用于根据预设的目标特征分类模型对所述资产特征数据进行分类,得到分类后的目标资产特征数据;其中,所述目标资产特征数据为与预设特征类别对应的资产特征数据;
[0040]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种不良资产的借款对象人群分类方法,其特征在于,包括:获取待处理的不良资产包中的多个借款对象的资产特征数据;根据预设的目标特征分类模型对所述资产特征数据进行分类,得到分类后的目标资产特征数据;其中,所述目标资产特征数据为与预设特征类别对应的资产特征数据;对所述预设特征类别进行归类,得到综合特征类别;其中,所述综合特征类别包括基础类特征、是否类特征以及其他类特征中至少之一;将所述综合分类类别中的预设特征类别对应的目标资产特征数据作为综合特征数据,对所述借款对象的综合特征数据进行特征标准化计算,得到所述借款对象的资产特征标准值;根据所述资产特征标准值对所述不良资产包进行借款对象人群分类,得到所述不良资产包的借款对象人群分类结果。2.根据权利要求1所述的方法,其特征在于,所述综合特征数据包括基础类特征数据、是否类特征数据以及其他类特征数据中至少之一;所述对所述借款对象的综合特征数据进行特征标准化计算,包括:基于所述基础类特征数据评估所述借款对象的基础类特征加权值,以及基于所述是否类特征数据评估所述借款对象的是否类特征综合值;利用预设的特征评估规则对所述基础类特征加权值、所述是否类特征综合值以及所述其他类特征数据进行特征标准化计算。3.根据权利要求1所述的方法,其特征在于,所述根据预设的目标特征分类模型对所述资产特征数据进行分类之前,所述方法还包括:构建基于正则表达式提取和聚类算法的特征分类模型;任选部分所述资产特征数据作为模型训练样本数据,利用所述特征分类模型对所述模型训练样本数据进行分类,得到所述模型训练样本数据的模型分类结果;根据所述模型训练样本数据的人工标准结果计算所述模型分类结果的准确率,若所述准确率达到预设值,将所述特征分类模型作为目标特征分类模型;若所述准确率未达到预设值,利用所述模型分类结果中与所述人工标准结果不同的反例特征数据训练所述特征分类模型,直到得到模型分类结果的准确率达到预设值的目标特征分类模型。4.根据权利要求2所述的方法,其特征在于,所述基础类特征数据为与所述借款对象受教育水平、家庭因素以及个人资产相关的特征数据,包括受教育程度、婚否、有子或无子、有房或无房、有车或无车中至少之一;所述基于所述基础类特征数据评估所述借款对象的基础类特征加权值,包括:判断所述基础类特征数据中是否存在缺失特征,若存在,基于与所述缺失特征相关的其他目标资产特征数据对所述缺失特征进行特征补充;利用预设的特征预测模型对所述基础类特征数据进行特征预测,得到所述借款对象的受教育水平估值、家庭因素估值以及资产估值;通过XGboost的get_fscore算法对所述借款对象的受教育水平估值、家庭因素估值以及个人资产估值进行重要度加权,得到所述借款对象的基础类特征加权值。5.根据权利要求2所述的方法,其特征在于,所述是否类特征数据为所述目标资产特征
数据中除所述基础类特征数据外的是否类的特征数据;所述基于所述是否类特征数据评估所述借款对象的是否类特征综合值,包括:判断所述是否类特征数据中是否存在缺失特征,若存在,若所述是否类特征数据中存在缺失特...

【专利技术属性】
技术研发人员:王婷婷
申请(专利权)人:大箴杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1