一种用于信用预测评估的信用评分卡自动化分箱方法技术

技术编号：20329713 阅读：53 留言：0更新日期：2019-02-13 06:06

本发明专利技术涉及一种用于信用预测评估的信用评分卡自动化分箱方法，包括如下步骤：收集数据，并对数据进行预处理；特征选择，筛选出对逾期状态影响最显著的数据字段；针对特征变量，进行自动化分箱；根据分箱后的特征变量，进行评分卡评估。本发明专利技术能够有效提高用户预测评估的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于信用预测评估的信用评分卡自动化分箱方法
本专利技术涉及一种用于信用预测评估的信用评分卡自动化分箱方法。
技术介绍
随着大数据和机器学习技术在金融业的应用，普惠金融获得了较快的发展。传统的金融机构，大多青睐国有企业、大型企业和高净值人群，主要服务“三高”群体，即高学历、高收入、高稳定性。数量更多的“蓝领”人群难以享受银行的金融服务，而这一群体有着巨大的需求和消费潜力。导致这一现象的主要原因在于，银行难以评估这部分客户的风险，客户成本过高，收益难以覆盖成本。银行对小额信贷进行逐一审批的成本与大额贷款相差无几，而收益悬殊，因此不得不放弃这部分业务。大数据和机器学习带来的技术突破，使客户分类和批量化处理成为可能，从而产生规模效应，降低单个客户的平均成本，使得大规模的小额收益能够覆盖成本，从而推动了普惠金融的发展。对普惠金融来说，主要的风险类型是信用风险，又称违约风险，是指借款人不能履约所造成的损失，主要有两方面的原因，一是借款人没有足够的还款能力，一是借款人无还款意愿。对信用风险进行提前识别和预警，是风险控制的目标。普惠金融业务面对的客户数量庞大，需要处理的业务请求非常巨大，无法依靠人工进行逐一辨别，标准化和自动化是必然选择。大数据、云计算、机器学习等前沿技术的发展、通过构建风控模型，对申请者的信用进行自动化评估，对普惠金融的发展有着重要的意义。当前金融机构的信用评估模型，主要采用评分卡的方式，涉及到数据分箱，数据分箱通常采用等频分箱、等距分箱方式。等频分箱：区间的边界值要经过选择，使得每个区间包含大致相等的实例数量。如果分箱数量为10，每个区间应该包含大...

【技术保护点】
1.一种用于信用预测评估的信用评分卡自动化分箱方法，其特征在于,包括如下步骤：步骤1：收集数据，并对数据进行预处理；步骤2：特征选择，筛选出对逾期状态影响最显著的数据字段；步骤3：针对特征变量，进行自动化分箱；步骤4：根据分箱后的特征变量，进行评分卡评估。

【技术特征摘要】
1.一种用于信用预测评估的信用评分卡自动化分箱方法，其特征在于,包括如下步骤：步骤1：收集数据，并对数据进行预处理；步骤2：特征选择，筛选出对逾期状态影响最显著的数据字段；步骤3：针对特征变量，进行自动化分箱；步骤4：根据分箱后的特征变量，进行评分卡评估。2.根据权利要求1所述的用于信用预测评估的信用评分卡自动化分箱方法，其特征在于，步骤3中，自动化分箱通过如下方法实现：步骤3.1：将数据等频切分为p个区间，设定最大的分箱个数n，n<p，步骤3.2：计算每一相邻区间的卡方值，公式如下：其中，Aij是第i区间第j类实例的数量，Eij是Aij的期望值；步骤3.3：将卡方值最小的一对区间合并；步骤3.4：统计现存的数据区间数量q，如果q>n，重复步骤3.2至步骤3.3，直至q≤n。3.根据权利要求2所述的用于信用预测评估的信用评分卡自动化分箱方法，其特征在于，步骤3中还包括以下步骤：步骤3.5：统计每个分箱的坏样本率，计算坏...

【专利技术属性】
技术研发人员：饶翔，高云亮，晏新宇，周哲，
申请(专利权)人：南京安讯科技有限责任公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人