一种数据评分方法及装置制造方法及图纸

技术编号:34775177 阅读:17 留言:0更新日期:2022-08-31 19:45
本发明专利技术公开了一种数据评分方法及装置,涉及信贷评分技术领域。本发明专利技术主要的技术方案为:将接收到的由客户端发出的目标样本输入至第一模型中;判断所述第一模型的输出结果是否异常;若异常,则将所述目标样本输入至第二模型中,以获得所述第二模型对应的第二评分结果,所述第二模型为与所述第一模型的入模特征变量存在差异且整体特征缺失率相同的灾备模型;基于分位数映射关系将所述第二评分结果转换为所述第一模型对应的第一评分结果,所述分位数映射关系是基于相同样本的所述第一评分结果与所述第二评分结果确定的映射关系;将所述第一评分结果发送至所述客户端。本发明专利技术用于数据的评分。数据的评分。数据的评分。

【技术实现步骤摘要】
一种数据评分方法及装置


[0001]本专利技术涉及信贷评分
,尤其涉及一种数据评分方法及装置。

技术介绍

[0002]在个人信贷风控与营销领域中,常用的一种评估进件(申请人或营销目标)资质的方式是建立数据评分模型。此类模型需要先基于特定的数据和算法进行构建工作,将构建的模型部署后,可由客户进行使用。一般来说,建立模型所涉及的特征(入模变量)可以来自于多个数据源,而由于数据源可能来自于多个组织,受硬件或网络环境影响,存在数据源在一定时间内失联或失效的可能性。而数据评分模型需要全部入模变量共同进行评估,如果部分或全部变量缺失(未获得响应值或响应值为空值),将导致模型失效(无输出值)或效果衰减(对产生的量化评估分数造成较大波动),并致使客户方相关业务流程中断受阻,损害实际效益。
[0003]现有技术中通过部署双模型作为上述情况的灾备方案,即在主模型构建的同时,使用其他数据源(与主模型不同,以免同时失效)构建一个辅助模型,并将二者同时部署,以此来维持相关业务的持续性。然而,由于辅助模型的区分能力与分数分布等相关指标同主模型存在差异,因此就需要针对辅助模型另外设置一套业务阈值,而由于两个模型设置的业务阈值对应评分分布差异化,相关业务监控指标会发生较大波动,导致辅助模型生成的评分与主模型生成的评分差异较大,从而影响相关业务简便、稳定、准确的进行。

技术实现思路

[0004]鉴于上述问题,本专利技术提供一种数据评分方法及装置,主要目的是为了减小辅助模型生成的评分与主模型生成的评分差异,以保证相关业务简便、稳定、准确的进行。
[0005]为解决上述技术问题,本专利技术提出以下方案:
[0006]第一方面,本专利技术提供了一种数据评分方法,所述方法包括:
[0007]将接收到的由客户端发出的目标样本输入至第一模型中;
[0008]判断第一模型的输出结果是否异常;
[0009]若异常,则将目标样本输入至第二模型中,以获得第二模型对应的第二评分结果,其中,第二模型为与第一模型的入模特征变量存在差异且整体特征缺失率相同的灾备模型;
[0010]基于分位数映射关系将第二评分结果转换为第一模型对应的第一评分结果,分位数映射关系是基于相同样本的第一评分结果与第二评分结果确定的映射关系;
[0011]将第一评分结果发送至客户端。
[0012]第二方面,本专利技术提供了一种数据评分装置,所述装置包括:
[0013]第一输入单元,用于将接收到的由客户端发出的目标样本输入至第一模型中;
[0014]判断单元,用于判断第一输入单元获得的第一模型的输出结果是否异常;
[0015]第二输入单元,用于若判断单元判断第一模型的输出结果异常,则将目标样本输
入至第二模型中,以获得第二模型对应的第二评分结果,其中,第二模型为与第一模型的入模特征变量存在差异且整体特征缺失率相同的灾备模型;
[0016]转换单元,用于基于分位数映射关系将第二输入单元获得的第二评分结果转换为第一模型对应的第一评分结果,分位数映射关系是基于相同样本的第一评分结果与第二评分结果确定的映射关系;
[0017]发送单元,用于将转换单元获得的第一评分结果发送至客户端。
[0018]为了实现上述目的,根据本专利技术的第三方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述第一方面的数据评分方法。
[0019]为了实现上述目的,根据本专利技术的第四方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述第一方面的数据评分方法。
[0020]借由上述技术方案,本专利技术提供的一种数据评分方法及装置,是在需要基于数据进行评分时,先将接收到的由客户端发出的目标样本输入至第一模型中,以获得第一模型的输出结果,再判断第一模型的输出结果是否异常,以确定第一模型是否可用,若异常,则说明第一模型不可用,因此可将目标样本输入至第二模型中,以获得第二模型对应的第二评分结果,其中,第二模型为与第一模型的入模特征变量存在差异且整体特征缺失率相同的灾备模型,接着基于分位数映射关系将第二评分结果转换为第一模型对应的第一评分结果,分位数映射关系是基于相同样本的第一评分结果与第二评分结果确定的映射关系,通过分位数映射关系可以确定与第二评分结果对应的第一评分结果,最后将第一评分结果发送至客户端,以便于客户方根据客户端接收的第一评分结果,并进行相关后续业务流程。通过本专利技术提供的数据评分方案,可以在第一模型输出结果异常时,应用第二模型对目标样本的第二评分结果进行计算,再通过分位数映射关系找到与第二评分结果对应的第一模型下的第一评分结果,最后将第一评分结果发送至客户端,使得无论是基于第一模型下获得的第一评分结果或基于第二模型下获得的第二评分结果转化而成的第一评分结果,均可通过第一模型对应的业务阈值进行处理,无需额外设置与第二模型对应的业务阈值,从而避免因由于两个模型设置的业务阈值对应评分分布差异化的情况,降低相关业务监控指标的波动,使得辅助模型生成的评分与主模型生成的评分差异减小,从而保证相关业务简便、稳定、准确的进行。
[0021]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0022]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0023]图1示出了本专利技术实施例提供的一种数据评分方法流程图;
[0024]图2示出了本专利技术实施例提供的另一种数据评分方法流程图;
[0025]图3示出了本专利技术实施例提供的一种数据评分装置的组成框图;
[0026]图4示出了本专利技术实施例提供的另一种数据评分装置的组成框图。
具体实施方式
[0027]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0028]在个人信贷风控与营销领域中,常用的一种评估进件(申请人或营销目标)资质的方式是建立数据评分模型。此类模型需要先基于特定的数据和算法进行构建工作(建模流程),将构建的模型部署后,可由客户进行使用(调用流程)。构建模型的标准流程为:提取带标签样本、数据清洗、特征匹配、模型构建、模型调优、模型部署。此外,由于一个模型可涉及多种特征,而不同特征的获取成本不同(如学历核验信息需从教育部采买),因此,通常情况下,构建的模型需要考虑成本收益比,评估某特征带来的增益(模型区分能力的提升)是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据评分方法,其特征在于,包括:将接收到的由客户端发出的目标样本输入至第一模型中;判断所述第一模型的输出结果是否异常;若异常,则将所述目标样本输入至第二模型中,以获得所述第二模型对应的第二评分结果,所述第二模型为与所述第一模型的入模特征变量存在差异且整体特征缺失率相同的灾备模型;基于分位数映射关系将所述第二评分结果转换为所述第一模型对应的第一评分结果,所述分位数映射关系是基于相同样本的所述第一评分结果与所述第二评分结果确定的映射关系;将所述第一评分结果发送至所述客户端。2.根据权利要求1所述的方法,其特征在于,在将目标样本输入至第二模型中之前,所述方法还包括:从所述第一模型的建模样本集中获取所述第一评分结果为缺失的建模样本,并构成分析样本子集,所述分析样本子集是由样本特征相对于所述第一模型对应的指定数据源的固有特征为缺失的所述建模样本构成的集合;抽取所述分析样本子集中的所述样本特征相对于其他数据源的固有特征为完全缺失的特征,并构成基本特征集,所述其他数据源为除了所述指定数据源之外的数据来源;将剩余待选特征按其各自在所述分析样本子集中的特征缺失率进行降序排列,所述剩余待选特征为所述分析样本子集中的所述样本特征相对于其他数据源的固有特征为部分缺失的特征;按照所述第一模型对应的所述整体特征缺失率依次将在所述分析样本子集中所述特征缺失率最高的所述剩余待选特征添加至所述基本特征集中,以使得所述第一模型对应的整体特征缺失率与所述基本特征集的整体特征缺失率相同;基于所述基本特征集与所述建模样本集创建所述第二模型。3.根据权利要求1所述的方法,其特征在于,在基于分位数映射关系将所述第二评分结果转换为所述第一模型对应的第一评分结果之前,所述方法还包括:获取所述第一模型的历史样本;将所述历史样本分别输入所述第一模型和所述第二模型中,以获得第一评分结果数组和第二评分结果数组;基于所述第一评分结果数组和所述第二评分结果数组构建所述分位数映射关系。4.根据权利要求3所述的方法,其特征在于,基于所述第一评分结果数组和所述第二评分结果数组构建所述分位数映射关系,包括:分别对所述第一评分结果数组和所述第二评分结果数组中的评分结果进行升序排列;判断所述第一评分数组和所述第二评分数组中的评分结果数量是否相同;若不同,则对所述第一评分结果数组和所述第二评分结果数组进行缩放转化,以保证所述第一评分结果数组和所述第二评分结果数组中的评分结果的整体字段长度相同;对处于相同位置所述第一评分结果数组和所述第二评分结果数组中的评分结果构建所述分位数映射关系。5.根据权利要求1

4中任一项所述的方法,其...

【专利技术属性】
技术研发人员:白鹤来白婧怡杜雅秀李松原
申请(专利权)人:北京荣达天下信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1