System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 风险预测方法、装置、设备及存储介质制造方法及图纸_技高网

风险预测方法、装置、设备及存储介质制造方法及图纸

技术编号:42966371 阅读:10 留言:0更新日期:2024-10-15 13:11
本公开涉及一种风险预测方法、装置、设备及存储介质。将多个第一筛选规则分别作用于多个测试账户,得到与各个第一筛选规则对应的留存测试账户;确定与各个第一筛选规则对应的至少部分留存测试账户的准确率,准确率用于表征第一风险预测模型对至少部分留存测试账户进行风险预测的准确性;至少基于准确率从多个第一筛选规则中选择第一筛选规则;利用第一风险预测模型对目标账户进行风险预测,目标账户为使用所选择的第一筛选规则对全量账户进行筛选得到的账户。由此,通过从全量账户中选出一批具有预测必要性的目标账户让模型进行风险预测,可以为模型上线时能够在预警量和准确率上符合实际业务需求提供支持。

【技术实现步骤摘要】

本公开涉及信息管理,特别是涉及一种风险预测方法、装置、设备及存储介质


技术介绍

1、经济的繁荣发展离不开金融的深度支持。

2、在普惠金融大背景下,力图让普罗大众都能享受到可持续的金融服务。

3、然而,金融的普及面越广意味着其风险敞口越大,普及程度越深意味着风险越高。

4、中低收入人群是占社会绝大多数,其信用等级低于高收入人群,其风险等级高于高收入人群。那么随着金融服务的向下延伸,银行面临是风险敞口的增加和逾期风险的增加。

5、因此,需要一种风险预测方案,以便在风险敞口和逾期风险之间做平衡。


技术实现思路

1、本公开要解决的一个技术问题是,如何提供一种更为合理的风险预测方案。

2、根据本公开的第一个方面,提供了一种风险预测方法,包括:将多个第一筛选规则分别作用于多个测试账户,得到与各个所述第一筛选规则对应的留存测试账户;确定与各个所述第一筛选规则对应的至少部分留存测试账户的准确率,所述准确率用于表征第一风险预测模型对所述至少部分留存测试账户进行风险预测的准确性;至少基于所述准确率从所述多个第一筛选规则中选择第一筛选规则;利用所述第一风险预测模型对目标账户进行风险预测,所述目标账户为使用所选择的第一筛选规则对全量账户进行筛选得到的账户。

3、可选地,所述至少部分留存测试账户为使用所述第一风险预测模型对留存测试账户进行风险预测所得到的风险排名靠前的第一数量个留存测试账户,所述第一数量用于表征业务时效期间内能够核对的账户数量。

4、可选地,该方法还包括:将风险排名靠前的第一数量个目标账户作为预警账户;以及将所述预警账户提供给业务人员进行核对。

5、可选地,该方法还包括:针对全量样本中各个第一样本,获取多个变量的取值;将各个所述第一样本的所述多个变量的取值和对应的样本标签构建为第二样本;利用所述第二样本训练决策树模型;将所述决策树模型中出现次数排名靠前的第二数量个变量作为候选规则;根据所述决策树模型中与所述候选规则对应的变量的分支阈值确定规则阈值;基于所述候选规则和所述规则阈值,确定所述多个第一筛选规则。

6、可选地,基于所述候选规则和所述规则阈值,确定所述多个第一筛选规则,包括:将所有候选规则对应的变量合并为规则链;将所述规则链中各个变量和对应的规则阈值进行笛卡尔乘积,得到所述多个第一筛选规则。

7、可选地,该方法还包括:将所述多个第一筛选规则分别作用于所述全量样本,得到与各个所述第一筛选规则对应的负样本比例和样本留存率;基于所述负样本比例和所述样本留存率,选择第一筛选规则;基于选择的第一筛选规则对所述全量样本进行筛选;对筛选得到的第一样本进行随机抽样,得到训练样本。

8、可选地,该方法还包括:基于第二筛选规则对训练样本的样本特征进行筛选;利用卡方分箱的方式对筛选后的样本特征进行特征分箱;基于分箱后的样本特征训练第二风险预测模型;剔除所述第二风险预测模型中系数与大多数样本特征的系数的正负不同的样本特征;通过假设检验的方式剔除与风险预测无关的样本特征;利用调整后的卡方分箱方式重新对保留的样本特征进行分箱,以确保对应同一特征维度的分箱特征与负样本比例保持单调性;基于分箱后的样本特征,计算证据权重;将所述证据权重作为训练数据,训练所述第一风险预测模型。

9、可选地,所述第一风险预测模型为评分卡模型。

10、可选地,所述第二筛选规则包括以下至少一种:剔除空值率大于第二阈值的样本特征;剔除方差小于第三阈值的样本特征;剔除信息价值小于第四阈值的样本特征。

11、可选地,该方法还包括:基于所述全量样本中至少部分第一样本的账户逾期行为数据,确定多个逾期阶段中各个逾期阶段进入下一个逾期阶段的转化比例,并将转化比例超过第六阈值的逾期阶段作为目标逾期阶段;基于贷款数据确定与所述目标逾期阶段对应的表现期;基于所述目标逾期阶段和所述表现期,确定所述全量样本中各个第一样本的样本标签。

12、可选地,该方法还包括:获取样本所对应的账户在多个周期内多个维度下的账户信息;对各个周期内各个维度下的账户信息进行特征提取,得到所述样本的样本特征。

13、可选地,所述多个周期包括最近3个月、最近6个月以及最近24个月;并且/或者所述多个维度包括:账户还款行为、账户交易行为、账户逾期行为、客户属性以及客户资产。

14、根据本公开的第二个方面,提供了一种风险预测装置,包括:第一筛选模块,用于将多个第一筛选规则分别作用于多个测试账户,得到与各个所述第一筛选规则对应的留存测试账户;第一确定模块,用于确定与各个所述第一筛选规则对应的至少部分留存测试账户的准确率,所述准确率用于表征第一风险预测模型对所述至少部分留存测试账户进行风险预测的准确性;选择模块,用于至少基于所述准确率从所述多个第一筛选规则中选择第一筛选规则;预测模块,用于利用所述第一风险预测模型对目标账户进行风险预测,所述目标账户为使用所选择的第一筛选规则对全量账户进行筛选得到的账户。

15、可选地,所述至少部分留存测试账户为使用所述第一风险预测模型对留存测试账户进行风险预测所得到的风险排名靠前的第一数量个留存测试账户,所述第一数量用于表征业务时效期间内能够核对的账户数量。

16、可选地,该装置还包括:第二确定模块,用于将风险排名靠前的第一数量个目标账户作为预警账户;以及提供模块,用于将所述预警账户提供给业务人员进行核对。

17、可选地,该装置还包括:第一获取模块,用于针对全量样本中各个第一样本,获取多个变量的取值;构建模块,用于将各个所述第一样本的所述多个变量的取值和对应的样本标签构建为第二样本;第一训练模块,用于利用所述第二样本训练决策树模型;第三确定模块,用于将所述决策树模型中出现次数排名靠前的第二数量个变量作为候选规则;第四确定模块,用于根据所述决策树模型中与所述候选规则对应的变量的分支阈值确定规则阈值;第五确定模块,用于基于所述候选规则和所述规则阈值,确定所述多个第一筛选规则。

18、可选地,所述第五确定模块将所有候选规则对应的变量合并为规则链,并将所述规则链中各个变量和对应的规则阈值进行笛卡尔乘积,得到所述多个第一筛选规则。

19、可选地,该装置还包括:训练样本选择模块,所述训练样本选择模块将所述多个第一筛选规则分别作用于所述全量样本,得到与各个所述第一筛选规则对应的负样本比例和样本留存率;所述训练样本选择模块基于所述负样本比例和所述样本留存率,选择第一筛选规则;所述训练样本选择模块基于选择的第一筛选规则对所述全量样本进行筛选;所述训练样本选择模块对筛选得到的第一样本进行随机抽样,得到训练样本。

20、可选地,该装置还包括:第二筛选模块,用于基于第二筛选规则对训练样本的样本特征进行筛选;第一分箱模块,用于利用卡方分箱的方式对筛选后的样本特征进行特征分箱;第二训练模块,用于基于分箱后的样本特征训练第二风险预测模型;第一剔除模块,本文档来自技高网...

【技术保护点】

1.一种风险预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述至少部分留存测试账户为使用所述第一风险预测模型对留存测试账户进行风险预测所得到的风险排名靠前的第一数量个留存测试账户,所述第一数量用于表征业务时效期间内能够核对的账户数量。

3.根据权利要求1所述的方法,其特征在于,还包括:

4.根据权利要求3所述的方法,其特征在于,基于所述候选规则和所述规则阈值,确定所述多个第一筛选规则,包括:

5.根据权利要求3所述的方法,其特征在于,还包括:

6.根据权利要求1所述的方法,其特征在于,还包括:

7.根据权利要求1所述的方法,其特征在于,还包括:

8.一种风险预测装置,其特征在于,包括:

9.一种计算设备,包括:

10.一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1至7中任何一项所述的方法。

【技术特征摘要】

1.一种风险预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述至少部分留存测试账户为使用所述第一风险预测模型对留存测试账户进行风险预测所得到的风险排名靠前的第一数量个留存测试账户,所述第一数量用于表征业务时效期间内能够核对的账户数量。

3.根据权利要求1所述的方法,其特征在于,还包括:

4.根据权利要求3所述的方法,其特征在于,基于所述候选规则和所述规则阈值,确定所述多个第一筛选规则,包括...

【专利技术属性】
技术研发人员:李旭
申请(专利权)人:第四范式北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1