用户数据识别模型更新方法、用户数据识别方法及装置制造方法及图纸

技术编号：39255339 阅读：26 留言：0更新日期：2023-10-30 12:06

本申请公开了一种用户数据识别模型更新方法、用户数据识别方法及装置。用户数据识别模型更新方法，包括：获取第一训练数据和待更新的第一识别模型，第一识别模型包括标签识别输出层；根据第一训练数据对第一识别模型进行训练，得到第二识别模型和第二识别模型识别能力的评估值；当评估值大于或等于预设阈值时，根据预设权重调整规则，对第一识别模型进行迭代训练，直到评估值小于预设阈值，将第二识别模型的包括标签识别输出层的第一迁移权重作为目标迁移权重，评估值小于预设阈值对应的第二识别模型作为目标识别模型。根据本申请实施例，能够提高更新后的识别模型的对用户数据识别的准确率。别的准确率。别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
用户数据识别模型更新方法、用户数据识别方法及装置

[0001]本申请属于数据处理领域，尤其涉及一种用户数据识别模型更新方法、用户数据识别方法及装置。

技术介绍

[0002]在大数据技术日趋成熟、人工智能日渐普遍、市场竞争日益激烈的环境下，充分利用数据挖掘和机器学习技术，有利于运营商提供精细化、智能化的服务。
[0003]识别模型作为数据挖掘的产物，在实现目标客户细分、潜在客户识别、客户行为预测等领域发挥着重要作用。由于重新建立识别模型耗时长，且耗费大量计算资源和人力资源。目前常采用应用模型迁移技术，利用旧账期数据的识别模型参数辅助新账期的模型建设。但是，在对用户数据识别过程中，识别模型迁移技术通过训练数据进行识别模型更新，随着新账期内的用户数据与旧账期内用户数据的时间差越来越大，两个账期的数据间分布差异就越来越大，这就导致更新后的识别模型的预测准确率逐渐降低。

技术实现思路

[0004]本申请实施例提供一种用户数据识别模型更新方法、用户数据识别方法及装置，能够提高更新后的识别模型的对用户数据识别的准确率。
[0005]第一方面，本申请实施例提供一种用户数据识别模型更新方法，包括：
[0006]获取第一训练数据和待更新的第一识别模型，第一训练数据包括多个第一样本数据和每个第一样本数据对应的预设标签，其中，预设标签的类别为多个，第一识别模型包括标签识别输出层，标签识别输出层用于输出对预设标签的类别的识别结果；
[0007]根据第一训练数据对第一识别模型进行训练，得到第二识别...

【技术保护点】

【技术特征摘要】
1.一种用户数据识别模型更新方法，其特征在于，包括：获取第一训练数据和待更新的第一识别模型，所述第一训练数据包括多个第一样本数据和每个第一样本数据对应的预设标签，其中，所述预设标签的类别为多个，所述第一识别模型包括标签识别输出层，所述标签识别输出层用于输出对所述预设标签的类别的识别结果；根据所述第一训练数据对所述第一识别模型进行训练，得到第二识别模型和所述第二识别模型识别能力的评估值，其中，所述第二识别模型包括标签识别输出层的第一迁移权重；当所述评估值大于或等于预设阈值时，根据预设权重调整规则，对所述第二识别模型中的标签识别输出层的第一迁移权重和所述第一训练数据分别进行调整，并返回步骤“根据所述第一训练数据对所述第一识别模型进行训练，得到第二识别模型”，对所述第一识别模型进行迭代训练，直到所述评估值小于预设阈值，将所述第二识别模型的包括标签识别输出层的第一迁移权重作为目标迁移权重，所述评估值小于预设阈值对应的第二识别模型作为目标识别模型。2.根据权利要求1所述的方法，其特征在于，所述多个第一样本数据包括第一样本集和第二样本集，其中，所述第一样本集包括在第一时间段获得的第一样本数据，所述第二样本集包括在第二时间段内获得的第一样本数据，所述第二时间段为所述第一时间段之后的时间，所述根据所述第一训练数据对所述第一识别模型进行训练，得到第二识别模型和所述第二识别模型识别能力的评估值，包括：根据所述第一样本集对所述第一识别模型进行训练，得到第三识别模型，并根据所述第二样本集对所述第一识别模型进行训练，得到第四识别模型；获取所述第三识别模型中标签识别输出层的第二迁移权重和所述第四识别模型中标签识别输出层的第三迁移权重；根据预设权重迁移函数、所述第二迁移权重和所述第三迁移权重，确定所述标签识别输出层的第一迁移权重；根据所述第一迁移权重配置所述第一识别模型，得到所述第二识别模型；根据所述第二识别模型对所述第一训练数据包括多个第一样本数据分别进行识别，得到第一识别结果集；根据所述第一识别结果集和所述每个第一样本数据对应的预设标签，确定所述第二识别模型识别能力的评估值。3.根据权利要求2所述的方法，其特征在于，所述根据预设权重调整规则，对所述第二识别模型中的标签识别输出层的第一迁移权重和所述第一训练数据分别进行调整，包括：根据所述第一识别结果集中对每个所述第一样本数据的识别结果和所述每个第一样本数据对应的预设标签，将所述识别结果与预设标签不同的第一样本数据作为第二样本数据，得到第二训练数据集；所述根据预设权重调整规则，分别调整每个所述第二样本数据的第一学习权重和所述第二样本数据对应预设标签的第二学习权重。4.一种用户数据识别方法，其特征在于，包括：获取待识别的用户数据；
将所述用户数据输入识别模型，得到对所述用户数据的识别结果，其中，所述识别模型的标签识别输出层的权重为目标迁移权重，其...

【专利技术属性】
技术研发人员：刘希玉，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人