评分卡模型的更新方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34786172 阅读:28 留言:0更新日期:2022-09-03 19:47
本申请提供了一种评分卡模型的更新方法、装置、电子设备及存储介质,所述方法包括:对输入样本进行特征编码和数据分桶,获得第一编码特征和对应的分桶ID;对所述分桶ID进行embedding向量化处理,获得分桶向量;对所述分桶向量进行MLP转换,获得第二编码特征;根据所述第一编码特征和所述第二编码特征进行相似度比较,确定相似度损失值;根据所述第二编码特征进行逻辑回归预测,确定分类损失值;对所述相似度损失值和所述分类损失值进行整合,获得多任务学习损失值;通过多任务损失值对评分卡模型进行更新,获得更新后的评分卡模型,应用本方法,能够提升基于逻辑回归的评分卡模型在分类问题预测上的准确性。在分类问题预测上的准确性。在分类问题预测上的准确性。

【技术实现步骤摘要】
评分卡模型的更新方法、装置、电子设备及存储介质


[0001]本申请涉及数据处理
,尤其涉及一种评分卡模型的更新方法、装置、电子设备及存储介质。

技术介绍

[0002]评分卡模型的原理是基于逻辑回归机器学习算法转换来的,而逻辑回归机器学习算法本质上作为一个线性模型,在呈现线性关系的数据上会有更好的表现。为了使逻辑回归机器学习算法产生不错的效果,评分卡模型对输入样本做线性变换让经过转换的输入样本与目标值之间尽可能呈现线性关系。然而在实际应用中,仍然有一些特征经过线性变换之后存在非线性,对逻辑回归机器学习算法的学习带来负面影响。

技术实现思路

[0003]本申请提供了一种评分卡模型的更新方法、装置、电子设备及存储介质,以至少解决现有技术中存在的以上技术问题。
[0004]根据本申请实施例的第一方面,提供了一种评分卡模型的更新方法,所述方法包括:对输入样本进行特征编码和数据分桶,获得第一编码特征和对应的分桶ID;对所述分桶ID进行embedding向量化处理,获得分桶向量;对所述分桶向量进行MLP转换,获得第二编码特征;根据所述第二编码特征进行逻辑回归预测,确定分类损失值;根据所述第一编码特征和所述第二编码特征进行相似度比较,确定相似度损失值;对所述相似度损失值和所述分类损失值进行整合,获得多任务学习损失值;通过多任务损失值对模型进行更新,获得更新后的评分卡模型。
[0005]在一可实施方式中,所述对输入样本进行特征编码和数据分桶,获得第一编码特征和对应的分桶ID,包括:对所述输入样本进行WOE编码,获得所述第一编码特征;根据所述输入样本对所述第一编码特征进行分桶,获得分桶ID。
[0006]在一可实施方式中,根据所述第二编码特征进行逻辑回归预测,确定分类损失值,包括:根据所述第二编码特征进行逻辑回归预测,获得预测分类信息;根据所述预测分类信息和真实分类信息确定所述分类损失值。
[0007]在一可实施方式中,根据所述第一编码特征和所述第二编码特征进行相似度比较,确定相似度损失值,包括:对所述第一编码特征和所述第二编码特征进行比较,确定特征比较值;根据所述预测分类信息与所述真实分类信息进行比较,确定相似度权重;根据所述相似度权重和所述特征比较值确定相似度损失值。
[0008]在一可实施方式中,根据所述预测分类信息与真实分类信息进行比较,确定相似度权重,包括:根据所述预测分类信息与真实分类信息确定预测偏差值;根据所述预测偏差值确定所述相似度权重,其中,所述预测偏差值与所述相似度权重呈正比。
[0009]根据本申请实施例的第二方面,提供了一种评分卡模型的更新装置,所述装置包括:编码分桶模块,用于对输入样本进行特征编码和数据分桶,获得第一编码特征和对应的
分桶ID;向量化模块,用于对所述分桶ID进行embedding向量化处理,获得分桶向量;转换模块,用于对所述分桶向量进行MLP转换,获得第二编码特征;预测模块,用于根据所述第二编码特征进行逻辑回归预测,确定分类损失值;比较模块,用于根据所述第一编码特征和所述第二编码特征进行相似度比较,确定相似度损失值;整合模块,用于对所述相似度损失值和所述分类损失值进行整合,获得多任务学习损失值;更新模块,用于通过多任务损失值对模型进行更新,获得更新后的评分卡模型。
[0010]在一可实施方式中,所述编码分桶模块,包括:编码子模块,用于对所述输入样本进行WOE编码,获得所述第一编码特征;分桶子模块,用于根据所述输入样本对所述第一编码特征进行分桶,获得分桶ID。
[0011]在一可实施方式中,所述预测模块,包括:预测子模块,用于根据所述第二编码特征进行逻辑回归预测,获得预测分类信息;第一确定子模块,用于根据所述预测分类信息和真实分类信息确定所述分类损失值。
[0012]在一可实施方式中,所述比较模块,包括:比较子模块,用于对所述第一编码特征和所述第二编码特征进行比较,确定特征比较值;所述比较子模块,还用于根据所述预测分类信息与所述真实分类信息进行比较,确定相似度权重;第二确定子模块,用于根据所述相似度权重和所述特征比较值确定相似度损失值;所述比较子模块,包括:根据所述预测分类信息与真实分类信息确定预测偏差值;根据所述预测偏差值确定所述相似度权重,其中,所述预测偏差值与所述相似度权重呈正比。
[0013]根据本申请实施例的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请所述的方法。
[0014]根据本申请实施例的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请所述的方法。
[0015]本申请实施例提供的一种评分卡模型的更新方法、装置、设备及存储介质,通过特征编码挖掘线性特征,并通过对分桶ID做embedding向量化,利用相似度损失值在保留已有的线性特征的同时,可以挖掘非线性特征中的线性关系,并引入多任务学习机制整合多任务损失值对模型进行更新,不仅提高模型对每个任务的学习效果还提升每个任务的健壮性和泛化能力。
[0016]应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0017]通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,其中:在附图中,相同或对应的标号表示相同或对应的部分。
[0018]图1示出了本申请实施例一种评分卡模型的更新方法的整体流程示意图;图2示出了本申请实施例一种评分卡模型的更新方法的实施流程示意图;
图3示出了本申请实施例评分卡模型的更新装置的实现模块示意图;图4示出了本申请实施例一种电子设备的组成结构示意图。
具体实施方式
[0019]为使本申请的目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020]图1示出了本申请实施例一种评分卡模型的更新方法的整体流程示意图;图2示出了本申请实施例一种评分卡模型的更新方法的实施流程示意图;参见图1和图2,根据本申请实施例的第一方面,提供了一种评分卡模型的更新方法,方法包括:操作101,对输入样本进行特征编码和数据分桶,获得第一编码特征和对应的分桶ID;操作102,对分桶ID进行embedding向量化处理,获得分桶向量;操作103,对分桶向量进行MLP转换,获得第二编码特征;操作104,根据第二编本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种评分卡模型的更新方法,其特征在于,所述方法包括:对输入样本进行特征编码和数据分桶,获得第一编码特征和对应的分桶ID;对所述分桶ID进行embedding向量化处理,获得分桶向量;对所述分桶向量进行MLP转换,获得第二编码特征;根据所述第二编码特征进行逻辑回归预测,确定分类损失值;根据所述第一编码特征和所述第二编码特征进行相似度比较,确定相似度损失值;对所述相似度损失值和所述分类损失值进行整合,获得多任务学习损失值;通过多任务损失值对评分卡模型进行更新,获得更新后的评分卡模型。2.根据权利要求1所述的方法,其特征在于,所述对输入样本进行特征编码和数据分桶,获得第一编码特征和对应的分桶ID,包括:对所述输入样本进行WOE编码,获得所述第一编码特征;根据所述输入样本对所述第一编码特征进行分桶,获得分桶ID。3.根据权利要求1所述的方法,其特征在于,根据所述第二编码特征进行逻辑回归预测,确定分类损失值,包括:根据所述第二编码特征进行逻辑回归预测,获得预测分类信息;根据所述预测分类信息和真实分类信息确定所述分类损失值。4.根据权利要求3所述的方法,其特征在于,根据所述第一编码特征和所述第二编码特征进行相似度比较,确定相似度损失值,包括:对所述第一编码特征和所述第二编码特征进行比较,确定特征比较值;根据所述预测分类信息与所述真实分类信息进行比较,确定相似度权重;根据所述相似度权重和所述特征比较值确定相似度损失值。5.根据权利要求4所述的方法,其特征在于,根据所述预测分类信息与真实分类信息进行比较,确定相似度权重,包括:根据所述预测分类信息与真实分类信息确定预测偏差值;根据所述预测偏差值确定所述相似度权重...

【专利技术属性】
技术研发人员:王茸茸孙悦蔡准郭晓鹏
申请(专利权)人:北京芯盾时代科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1