一种解决小微企业信贷授信风险控制和管理方法及装置制造方法及图纸

技术编号:31379542 阅读:25 留言:0更新日期:2021-12-15 11:23
本发明专利技术涉及信息技术领域,提供了一种解决小微企业信贷授信风险控制和管理方法及装置。主旨在于以解决金融机构小微企业信贷业务中面临的数据稀缺、不全面、历史信息沉淀不足等问题,获取小微企业信贷申请请求,形成信贷申请数据集Hive;请求征信机构数据,与信贷申请数据集进行交叉验证,并依据核验信息将客户分类,得到分类客户数据;抽取分类客户数据,提取客户申请特征信息后生成训练集和测试集的Hive;利用主动学习技术对训练集Hive进行信用评级,得到信用评级;得到信用评级后,通过不对称偏差分析方法对训练集Hive进行校验;校验通过的小微企业信贷信用评级结果进行授信额度的发放。的发放。的发放。

【技术实现步骤摘要】
一种解决小微企业信贷授信风险控制和管理方法及装置


[0001]本专利技术涉及信息
,提供了一种解决小微企业信贷授信风险控制和管理方法及装置。

技术介绍

[0002]近年来,国家层面关于金融支持小微企业发展提出了众多政策和扶持方案,但在以银行为主导的金融体系中,抵押通常是贷款的前提条件,小微企业一般没有像样的抵押品,这类客户财务管理一般不规范或者没有相关资料,且目前小微企业数量庞大、贷款期限短、周转频率快,导致银行对此顾虑较多,因此难以贷到款。
[0003]随着业务的快速迭代,合作平台不断的引入,针对小微企业信贷风险控制的传统模式凸显其弊端,以至于授信流程人工介入率较高。因此,一种能支撑互联网银行和小微企业信贷业务模式的风险控制技术亟待出现。

技术实现思路

[0004]本专利技术的目的在:针对现有技术的缺陷和不足,提供一种基于主动学习不对称偏差分析的小微企业授信校验方法、装置、设备及存储介质,解决金融机构小微企业信贷业务中面临的数据稀缺、不全面、历史信息沉淀不足等问题,提升小微企业信贷风控模型效果,从而改善金融机构服务实体经济水平。
[0005]为了解决上述技术问题,本专利技术采用以下技术手段:
[0006]一种解决小微企业信贷授信风险控制和管理方法,包括以下步骤:
[0007]步骤1、获取小微企业信贷申请请求,形成信贷申请数据集Hive;
[0008]步骤2、请求征信机构数据,与信贷申请数据集进行交叉验证,并依据核验信息将客户分类,得到分类客户数据;/>[0009]步骤3、抽取分类客户数据,提取客户申请特征信息后生成训练集和测试集的Hive;
[0010]步骤4、利用主动学习技术对步骤3所述训练集Hive进行评级训练,得到信用评级;
[0011]步骤5、得到步骤4所述信用评级后,通过不对称偏差分析方法对训练集Hive进行校验(可根据校验结果选择增量主动学习或重新主动学习步骤4);
[0012]步骤6、综合步骤5中校验通过的小微企业信贷信用评级结果进行授信额度的发放。
[0013]可选的,所涉及步骤1中小微企业信贷申请数据集包括四部分。第一部分是实名认证数据;第二部分是个人资料数据;第三部分是额度任务数据,包含企业基础资料、企业财税信息及其他证明材料数据;第四部分是申请人在信贷申请各阶段中操作所记录的埋点数据。
[0014]可选的,所涉及步骤2中第三方机构提供的征信数据包括个人类及企业类,个人类如有人行征信、黑灰产等数据,企业类包括企业基本信息、信贷信息、公共信息和声明信息
等。将信贷申请数据集与第三方机构提供的征信数据进行交叉验证,根据核验信息将客户分为三类,标记黑、白、灰户;
[0015]可选的,执行步骤3,提取分类客户信贷申请中特征信息前,需要对申请数据集包含的数据进行需要对数据集含的数据进行结构化与非结构化数据处理,具体操作内容包括:
[0016]步骤3.1、使用SQL查询语句获取所需的全部数据,并使用Python进行数据的加载;
[0017]步骤3.2、对数据进行EDA探索,包含变量的统计值分析,结合变量的业务特征对变量进行缺失值填充,删除重复数据;
[0018]步骤3.3、按灰白户3:7的比例提取数据并构造模型所需特征,包括对分类变量的数值化处理,和连续变量的离散化处理,以及通过变量交叉、合成衍生新的符合业务逻辑的变量;
[0019]步骤3.4、对数据进行无量纲化处理,可选方法包括有实际意义的量纲处理和数理化的量纲处理,处理完成后按8:2的比例划分为训练集和测试集的Hive。
[0020]可选的,执行步骤4,提取训练集的Hive数据,利用主动学习技术进行训练,具体操作内容包括:
[0021]步骤4.1、提取步骤3.4处理完成后的训练集的Hive数据;
[0022]步骤4.2、采用批查询策略,挑选出需标注样本,并更改列特征标注样本状态(训练、测试、未打标、待标注),通过前端展示给专家进行标注;
[0023]步骤4.3、通过人工标注的专家经验或者业务经验的提炼获得候选集的标注数据,然后将标注结果回传至训练集的Hive中;
[0024]步骤4.4、利用评分卡模型来训练步骤4.3所述训练集的Hive,得到小微企业信贷信用评级。
[0025]可选的,执行步骤5,得到步骤4.4所述信用评级后,通过不对称偏差分析方法进行验证,依据验证结果并持续提升改进模型效果,具体操作内容包括:
[0026]步骤5.1、提取步骤4所述完成训练的Hive信用评级数据;
[0027]步骤5.2、通过不对称偏差分析方法对步骤4.3所述训练集Hive进行校验判别,与步骤5.1信用评级数据相互印证、相互补充、为信用评价结果提供充分和必要的依据;
[0028]步骤5.3、根据验证结果,若误差大于设置阈值,可选择进行增量学习或者重新学习的方式更新模型,从而将迭代数据融入主动学习模型中,达到提升模型效果。
[0029]本专利技术还提供了一种解决小微企业信贷授信风险控制和管理装置,包括:
[0030]数据获取模块、获取小微企业信贷申请请求,形成信贷申请数据集Hive;
[0031]分类模块、请求征信机构数据,与信贷申请数据集进行交叉验证,并依据核验信息将客户分类,得到分类客户数据;
[0032]训练集和测试集模块、抽取分类客户数据,提取客户申请特征信息后生成训练集和测试集的Hive;
[0033]评级模块、利用主动学习技术对步骤3所述训练集Hive进行信用评级,得到信用评级;
[0034]校验模块、得到步骤4所述信用评级后,通过不对称偏差分析方法对训练集Hive进行校验;
[0035]授信模块、综合步骤5中校验通过的小微企业信贷信用评级结果进行授信额度的发放。
[0036]上述技术方案中,包括以下步骤:所涉及步骤1中小微企业信贷申请数据集包括四部分:
[0037]第一部分是实名认证数据;
[0038]第二部分是个人资料数据;
[0039]第三部分是额度任务数据,包含企业基础资料、企业财税信息及其他证明材料数据;
[0040]第四部分是申请人在信贷申请各阶段中操作所记录的埋点数据;
[0041]所涉及步骤2中第三方机构提供的征信数据包括个人类及企业类,个人类如有人行征信、黑产、灰产数据,企业类包括企业基本信息、信贷信息、公共信息和声明信息,将信贷申请数据集与第三方机构提供的征信数据进行交叉验证,根据核验信息将客户分为三类,标记黑户、白户、灰户;
[0042]上述技术方案中,提取分类客户信贷申请中特征信息前,需要对申请数据集包含的数据进行需要对数据集含的数据进行结构化与非结构化数据处理,具体操作内容包括:
[0043]步骤3.1、使用SQL查询语句获取所需的全部数据,并使用Python进行数据的加载;
[0044]步骤3.2、对数据进行EDA探索,包含变量本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种解决小微企业信贷授信风险控制和管理方法,该其特征在于,包括以下步骤:步骤1、获取小微企业信贷申请请求,形成信贷申请数据集Hive;步骤2、请求征信机构数据,与信贷申请数据集进行交叉验证,并依据核验信息将客户分类,得到分类客户数据;步骤3、抽取分类客户数据,提取客户申请特征信息后生成训练集和测试集的Hive;步骤4、利用主动学习技术对步骤3所述训练集Hive进行信用评级,得到信用评级;步骤5、得到步骤4所述信用评级后,通过不对称偏差分析方法对训练集Hive进行校验;步骤6、综合步骤5中校验通过的小微企业信贷信用评级结果进行授信额度的发放。2.根据权利要求1所述的一种解决小微企业信贷授信风险控制和管理方法,其特征在于,包括以下步骤:所涉及步骤1中小微企业信贷申请数据集包括四部分:第一部分是实名认证数据;第二部分是个人资料数据;第三部分是额度任务数据,包含企业基础资料、企业财税信息及其他证明材料数据;第四部分是申请人在信贷申请各阶段中操作所记录的埋点数据;所涉及步骤2中第三方机构提供的征信数据包括个人类及企业类,个人类如有人行征信、黑产、灰产数据,企业类包括企业基本信息、信贷信息、公共信息和声明信息,将信贷申请数据集与第三方机构提供的征信数据进行交叉验证,根据核验信息将客户分为三类,标记黑户、白户、灰户。3.根据权利要求2所述的一种解决小微企业信贷授信风险控制和管理方法,其特征在于,包括以下步骤:可选的,执行步骤3,提取分类客户信贷申请中特征信息前,需要对申请数据集包含的数据进行需要对数据集含的数据进行结构化与非结构化数据处理,具体操作内容包括:步骤3.1、使用SQL查询语句获取所需的全部数据,并使用Python进行数据的加载;步骤3.2、对数据进行EDA探索,包含变量的统计值分析,结合变量的业务特征对变量进行缺失值填充,删除重复数据;步骤3.3、按灰户与白户3:7的比例提取数据并构造模型所需特征,包括对分类变量的数值化处理,和连续变量的离散化处理,以及通过变量交叉、合成衍生新的符合业务逻辑的变量;步骤3.4、对数据进行无量纲化处理,可选方法包括有实际意义的量纲处理和数理化的量纲处理,处理完成后按8:2的比例划分为训练集和测试集得到Hive数据。4.根据权利要求3所述的一种解决小微企业信贷授信风险控制和管理方法,其特征在于,包括以下步骤:执行步骤4,提取训练集的Hive数据,利用主动学习技术进行训练,具体操作内容包括:步骤4.1、提取步骤3.4处理完成后的训练集的Hive数据;步骤4.2、采用批查询策略,挑选出需标注样本,并更改列特征标注样本状态,样本状态包括训练、测试、未打标、待标注,通过前端展示给专家进行标注;步骤4.3、通过人工标注的专家经验或者业务经验的提炼获得候选集的标注数据,然后将标注结果回传至训练集的Hive数据中;步骤4.4、利用评分卡模型来训练步骤4.3所述训练集的Hive数据,得到小微企业信贷
信用评级。5.根据权利要求4所述的一种解决小微企业信贷授信风险控制和管理方法,其特征在于,包括以下步骤:可选的,执行步骤5,得到步骤4.4所述信用评级后,通过不对称偏差分析方法进行验证,依据验证结果并持续提升改进模型效果,具体操作内容包括:步骤5.1、提取步骤4所述完成训练的小微企业信贷信用评级数据;步骤5.2、通过不对称偏差分析方法对步骤4.3所述训练集Hive进行校验判别,与步骤5.1信用评级数据相互印证、相互补充、为信用评价结果提供充分和必要的依据;步骤5.3、根据验证结果,若误差大于设置阈值,可选择进行增量学习或者重新学习的方...

【专利技术属性】
技术研发人员:田羽兰翔陈刚刘甜甜汪大磊
申请(专利权)人:武汉众邦银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1