数据处理方法、装置及电子设备制造方法及图纸

技术编号：34898564 阅读：26 留言：0更新日期：2022-09-10 13:58

本公开提供了数据处理方法、装置、电子设备及存储介质，涉及人工智能技术领域中的深度学习技术领域，可用于金融风控、营销等场景。其中方法为：获取待处理模型对应的第一数据集，第一数据集中包括样本和样本标签；根据样本的特征，获取特征在不同时期的特征数据，以生成多个第二数据集；根据多个第二数据集和样本标签，获取模型的指标的数值；以及根据指标的数值，生成待处理模型的数据处理结果。本公开获取已知的第一数据集中的特征在不同时期的特征数据，根据不同时期的特征数据和已知的样本标签对待处理模型进行性能相关的指标的计算，完成对待处理模型的数据处理过程，在难以及时获取模型调用方的反馈数据的情况下，完成对模型性能的查验。型性能的查验。型性能的查验。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置及电子设备

[0001]本公开涉及人工智能
中的深度学习
，尤其涉及一种数据处理方法、装置及电子设备。

技术介绍

[0002]目前，为了确保模型的性能满足调用方的要求，在模型训练阶段、模型上线前以及模型上线后需要对模型进行打分等数据处理过程。通常根据已有的带标签的数据集对模型进行数据处理，例如在模型上线后可以根据调用方反馈的数据构建上述带有标签的数据集，以此完成上述数据处理过程。然而如何在难以及时获取反馈数据的情况下，通过对模型进行相关的数据处理，完成对模型性能的查验已经成为亟待解决的问题。

技术实现思路

[0003]提供了一种数据处理方法、装置及电子设备。
[0004]根据第一方面，提供了一种数据处理方法，包括：获取待处理模型对应的第一数据集，所述第一数据集中包括样本和样本标签；根据所述样本的特征，获取所述特征在不同时期的特征数据，以生成多个第二数据集；根据所述多个第二数据集和所述样本标签，获取所述待处理模型的指标的数值，所述指标用于表征所述待处理模型的性能；以及根据所述指标的数值，生成所述待处理模型的数据处理结果。
[0005]根据第二方面，提供了一种数据处理装置，包括：第一获取模块，用于获取待处理模型对应的第一数据集，所述第一数据集中包括样本和样本标签；第二获取模块，用于根据所述样本的特征，获取所述特征在不同时期的特征数据，以生成多个第二数据集；第三获取模块，用于根据所述多个第二数据集和所述样本标签，获取所述待处理模型的指标的数值，所述指标用于表征所...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，包括：获取待处理模型对应的第一数据集，所述第一数据集中包括样本和样本标签；根据所述样本的特征，获取所述特征在不同时期的特征数据，以生成多个第二数据集；根据所述多个第二数据集和所述样本标签，获取所述待处理模型的指标的数值，所述指标用于表征所述待处理模型的性能；以及根据所述指标的数值，生成所述待处理模型的数据处理结果。2.根据权利要求1所述的方法，其中，所述待处理模型的所述指标包括以下至少一种：接收者操作特征曲线对应的曲线下面积、模型区分度指标和模型稳定度指标。3.根据权利要求2所述的方法，其中，所述根据所述多个第二数据集和所述样本标签，获取所述待处理模型的指标的数值，包括：从所述多个第二数据集中确定两个目标数据集；以及根据所述两个目标数据集和所述样本标签，获取所述模型区分度指标对应的两个数值、所述曲线下面积对应的两个数值以及所述模型稳定度指标对应的数值。4.根据权利要求3所述的方法，其中，所述根据所述指标的数值，生成所述待处理模型的数据处理结果，包括：计算所述模型区分度指标对应的两个数值之间的第一差值和所述曲线下面积对应的两个数值之间的第二差值；响应于所述待处理模型的所述指标的数值满足以下任一条件：所述第一差值大于第一阈值、所述第二差值大于第二阈值和所述模型稳定度指标对应的数值大于第三阈值，则确定所述待处理模型的数据处理结果为模型异常；以及响应于所述第一差值小于或等于所述第一阈值，且所述第二差值小于或等于所述第二阈值，且所述稳定度指标对应的数值小于或等于所述第三阈值，则确定所述待处理模型的数据处理结果为模型正常。5.根据权利要求4所述的方法，还包括：响应于所述待处理模型的数据处理结果为模型异常，则根据所述多个第二数据集，检测所述特征的分布；以及根据对所述特征的分布的检测结果，分析所述待处理模型的数据处理结果为模型异常的原因。6.一种数据处理装置，包括：第一获取模块，用于获取待处理模型对应的第一数据集，所述第一数据集中包括样本和样本标签；第二获取模块，用于根据所述样本的特征，获取所述特征在不同时期的特征数据，以生成多个第二数据集；第三获取模块，用于根据所述多个第二数据集和所述样本标签，获取所述待处理模型的指标的数值，所述指标用于表征所述待处理模型的性能；以及...

【专利技术属性】
技术研发人员：孙倩，刘昊骋，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人