评分卡模型的更新方法、装置、电子设备及存储介质制造方法及图纸

技术编号：34786172 阅读：41 留言：0更新日期：2022-09-03 19:47

本申请提供了一种评分卡模型的更新方法、装置、电子设备及存储介质，所述方法包括：对输入样本进行特征编码和数据分桶，获得第一编码特征和对应的分桶ID；对所述分桶ID进行embedding向量化处理，获得分桶向量；对所述分桶向量进行MLP转换，获得第二编码特征；根据所述第一编码特征和所述第二编码特征进行相似度比较，确定相似度损失值；根据所述第二编码特征进行逻辑回归预测，确定分类损失值；对所述相似度损失值和所述分类损失值进行整合，获得多任务学习损失值；通过多任务损失值对评分卡模型进行更新，获得更新后的评分卡模型，应用本方法，能够提升基于逻辑回归的评分卡模型在分类问题预测上的准确性。在分类问题预测上的准确性。在分类问题预测上的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
评分卡模型的更新方法、装置、电子设备及存储介质

[0001]本申请涉及数据处理
，尤其涉及一种评分卡模型的更新方法、装置、电子设备及存储介质。

技术介绍

[0002]评分卡模型的原理是基于逻辑回归机器学习算法转换来的，而逻辑回归机器学习算法本质上作为一个线性模型，在呈现线性关系的数据上会有更好的表现。为了使逻辑回归机器学习算法产生不错的效果，评分卡模型对输入样本做线性变换让经过转换的输入样本与目标值之间尽可能呈现线性关系。然而在实际应用中，仍然有一些特征经过线性变换之后存在非线性，对逻辑回归机器学习算法的学习带来负面影响。

技术实现思路

[0003]本申请提供了一种评分卡模型的更新方法、装置、电子设备及存储介质，以至少解决现有技术中存在的以上技术问题。
[0004]根据本申请实施例的第一方面，提供了一种评分卡模型的更新方法，所述方法包括：对输入样本进行特征编码和数据分桶，获得第一编码特征和对应的分桶ID；对所述分桶ID进行embedding向量化处理，获得分桶向量；对所述分桶向量进行MLP转换，获得第二编码特征；根据所述第二编码特征进行逻辑回归预测，确定分类损失值；根据所述第一编码特征和所述第二编码特征进行相似度比较，确定相似度损失值；对所述相似度损失值和所述分类损失值进行整合，获得多任务学习损失值；通过多任务损失值对模型进行更新，获得更新后的评分卡模型。
[0005]在一可实施方式中，所述对输入样本进行特征编码和数据分桶，获得第一编码特征和对应的分桶ID，包括：对所述输入样本进...

【技术保护点】

【技术特征摘要】
1.一种评分卡模型的更新方法，其特征在于，所述方法包括：对输入样本进行特征编码和数据分桶，获得第一编码特征和对应的分桶ID；对所述分桶ID进行embedding向量化处理，获得分桶向量；对所述分桶向量进行MLP转换，获得第二编码特征；根据所述第二编码特征进行逻辑回归预测，确定分类损失值；根据所述第一编码特征和所述第二编码特征进行相似度比较，确定相似度损失值；对所述相似度损失值和所述分类损失值进行整合，获得多任务学习损失值；通过多任务损失值对评分卡模型进行更新，获得更新后的评分卡模型。2.根据权利要求1所述的方法，其特征在于，所述对输入样本进行特征编码和数据分桶，获得第一编码特征和对应的分桶ID，包括：对所述输入样本进行WOE编码，获得所述第一编码特征；根据所述输入样本对所述第一编码特征进行分桶，获得分桶ID。3.根据权利要求1所述的方法，其特征在于，根据所述第二编码特征进行逻辑回归预测，确定分类损失值，包括：根据所述第二编码特征进行逻辑回归预测，获得预测分类信息；根据所述预测分类信息和真实分类信息确定所述分类损失值。4.根据权利要求3所述的方法，其特征在于，根据所述第一编码特征和所述第二编码特征进行相似度比较，确定相似度损失值，包括：对所述第一编码特征和所述第二编码特征进行比较，确定特征比较值；根据所述预测分类信息与所述真实分类信息进行比较，确定相似度权重；根据所述相似度权重和所述特征比较值确定相似度损失值。5.根据权利要求4所述的方法，其特征在于，根据所述预测分类信息与真实分类信息进行比较，确定相似度权重，包括：根据所述预测分类信息与真实分类信息确定预测偏差值；根据所述预测偏差值确定所述相似度权重...

【专利技术属性】
技术研发人员：王茸茸，孙悦，蔡准，郭晓鹏，
申请(专利权)人：北京芯盾时代科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人