用户数据识别模型更新方法、用户数据识别方法及装置制造方法及图纸

技术编号:39255339 阅读:26 留言:0更新日期:2023-10-30 12:06
本申请公开了一种用户数据识别模型更新方法、用户数据识别方法及装置。用户数据识别模型更新方法,包括:获取第一训练数据和待更新的第一识别模型,第一识别模型包括标签识别输出层;根据第一训练数据对第一识别模型进行训练,得到第二识别模型和第二识别模型识别能力的评估值;当评估值大于或等于预设阈值时,根据预设权重调整规则,对第一识别模型进行迭代训练,直到评估值小于预设阈值,将第二识别模型的包括标签识别输出层的第一迁移权重作为目标迁移权重,评估值小于预设阈值对应的第二识别模型作为目标识别模型。根据本申请实施例,能够提高更新后的识别模型的对用户数据识别的准确率。别的准确率。别的准确率。

【技术实现步骤摘要】
用户数据识别模型更新方法、用户数据识别方法及装置


[0001]本申请属于数据处理领域,尤其涉及一种用户数据识别模型更新方法、用户数据识别方法及装置。

技术介绍

[0002]在大数据技术日趋成熟、人工智能日渐普遍、市场竞争日益激烈的环境下,充分利用数据挖掘和机器学习技术,有利于运营商提供精细化、智能化的服务。
[0003]识别模型作为数据挖掘的产物,在实现目标客户细分、潜在客户识别、客户行为预测等领域发挥着重要作用。由于重新建立识别模型耗时长,且耗费大量计算资源和人力资源。目前常采用应用模型迁移技术,利用旧账期数据的识别模型参数辅助新账期的模型建设。但是,在对用户数据识别过程中,识别模型迁移技术通过训练数据进行识别模型更新,随着新账期内的用户数据与旧账期内用户数据的时间差越来越大,两个账期的数据间分布差异就越来越大,这就导致更新后的识别模型的预测准确率逐渐降低。

技术实现思路

[0004]本申请实施例提供一种用户数据识别模型更新方法、用户数据识别方法及装置,能够提高更新后的识别模型的对用户数据识别的准确率。
[0005]第一方面,本申请实施例提供一种用户数据识别模型更新方法,包括:
[0006]获取第一训练数据和待更新的第一识别模型,第一训练数据包括多个第一样本数据和每个第一样本数据对应的预设标签,其中,预设标签的类别为多个,第一识别模型包括标签识别输出层,标签识别输出层用于输出对预设标签的类别的识别结果;
[0007]根据第一训练数据对第一识别模型进行训练,得到第二识别模型和第二识别模型识别能力的评估值,其中,第二识别模型包括标签识别输出层的第一迁移权重;
[0008]当评估值大于或等于预设阈值时,根据预设权重调整规则,对第二识别模型中的标签识别输出层的第一迁移权重和第一训练数据分别进行调整,并返回步骤“根据第一训练数据对第一识别模型进行训练,得到第二识别模型”,对第一识别模型进行迭代训练,直到评估值小于预设阈值,将第二识别模型的包括标签识别输出层的第一迁移权重作为目标迁移权重,评估值小于预设阈值对应的第二识别模型作为目标识别模型。
[0009]在第一方面的一些可实现方式中,多个第一样本数据包括第一样本集和第二样本集,其中,第一样本集包括在第一时间段获得的第一样本数据,第二样本集包括在第二时间段内获得的第一样本数据,第二时间段为第一时间段之后的时间,根据第一训练数据对第一识别模型进行训练,得到第二识别模型和第二识别模型识别能力的评估值,包括:
[0010]根据第一样本集对第一识别模型进行训练,得到第三识别模型,并根据第二样本集对第一识别模型进行训练,得到第四识别模型;
[0011]获取第三识别模型中标签识别输出层的第二迁移权重和第四识别模型中标签识别输出层的第三迁移权重;
[0012]根据预设权重迁移函数、第二迁移权重和第三迁移权重,确定标签识别输出层的第一迁移权重;
[0013]根据第一迁移权重配置第一识别模型,得到第二识别模型;
[0014]根据第二识别模型对第一训练数据包括多个第一样本数据分别进行识别,得到第一识别结果集;
[0015]根据第一识别结果集和每个第一样本数据对应的预设标签,确定第二识别模型识别能力的评估值。
[0016]在第一方面的一些可实现方式中,根据预设权重调整规则,对第二识别模型中的标签识别输出层的第一迁移权重和第一训练数据分别进行调整,包括:
[0017]根据第一识别结果集中对每个第一样本数据的识别结果和每个第一样本数据对应的预设标签,将识别结果与预设标签不同的第一样本数据作为第二样本数据,得到第二训练数据集;
[0018]根据预设权重调整规则,分别调整每个第二样本数据的第一学习权重和第二样本数据对应预设标签的第二学习权重。
[0019]第二方面,本申请实施例提供一种用户数据识别方法,包括:
[0020]获取待识别的用户数据;
[0021]将用户数据输入识别模型,得到对用户数据的识别结果,其中,识别模型的标签识别输出层的权重为目标迁移权重,其中,目标迁移权重根据第一方面或者第一方面任一可实现方式中所述的用户数据识别模型更新方法得到。
[0022]在第二方面的一些可实现方式中,保存对用户数据的识别结果至预设数据库,以用于在预设时间段后,根据预设数据库中在预设时间段内的用户数据和用户数据的识别结果,更新训练用户数据识别模型。
[0023]第三方面,本申请实施例提供一种用户数据识别模型更新装置,装置包括:
[0024]获取模块,用于获取第一训练数据和待更新的第一识别模型,所述第一训练数据包括多个第一样本数据和每个第一样本数据对应的预设标签,其中,所述预设标签的类别为多个,所述第一识别模型包括标签识别输出层,所述标签识别输出层用于输出对所述预设标签的类别的识别结果;
[0025]处理模块,用于根据所述第一训练数据对所述第一识别模型进行训练,得到第二识别模型和所述第二识别模型识别能力的评估值,其中,所述第二识别模型包括标签识别输出层的第一迁移权重;
[0026]所述处理模块,还用于当所述评估值大于或等于预设阈值时,根据预设权重调整规则,对所述第二识别模型中的标签识别输出层的第一迁移权重和所述第一训练数据分别进行调整,并返回步骤“根据所述第一训练数据对所述第一识别模型进行训练,得到第二识别模型”,对所述第一识别模型进行迭代训练,直到所述评估值小于预设阈值,将所述第二识别模型的包括标签识别输出层的第一迁移权重作为目标迁移权重,所述评估值小于预设阈值对应的第二识别模型作为目标识别模型。
[0027]第四方面,本申请实施例提供一种用户数据识别装置,装置包括:
[0028]获取模块,用于获取待识别的用户数据;
[0029]处理模块,用于将用户数据输入识别模型,得到对用户数据的识别结果,其中,识
别模型的标签识别输出层的权重为目标迁移权重,其中,目标迁移权重根据第一方面或者第一方面任一可实现方式中所述的用户数据识别模型更新方法得到。
[0030]第五方面,本申请提供一种用户数据识别设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面或者第一方面任一可实现方式中所述的用户数据识别模型更新方法,或执行如第二方面或者第二方面任一可实现方式中所述的用户数据识别方法。
[0031]第六方面,本申请提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面或者第一方面任一可实现方式中所述的用户数据识别模型更新方法,或执行如第二方面或者第二方面任一可实现方式中所述的用户数据识别方法。
[0032]第七方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如第一方面或者第一方面任一可实现方式中所述的用户数据识别模型更新方法,或执行如第二方面或者第二方面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户数据识别模型更新方法,其特征在于,包括:获取第一训练数据和待更新的第一识别模型,所述第一训练数据包括多个第一样本数据和每个第一样本数据对应的预设标签,其中,所述预设标签的类别为多个,所述第一识别模型包括标签识别输出层,所述标签识别输出层用于输出对所述预设标签的类别的识别结果;根据所述第一训练数据对所述第一识别模型进行训练,得到第二识别模型和所述第二识别模型识别能力的评估值,其中,所述第二识别模型包括标签识别输出层的第一迁移权重;当所述评估值大于或等于预设阈值时,根据预设权重调整规则,对所述第二识别模型中的标签识别输出层的第一迁移权重和所述第一训练数据分别进行调整,并返回步骤“根据所述第一训练数据对所述第一识别模型进行训练,得到第二识别模型”,对所述第一识别模型进行迭代训练,直到所述评估值小于预设阈值,将所述第二识别模型的包括标签识别输出层的第一迁移权重作为目标迁移权重,所述评估值小于预设阈值对应的第二识别模型作为目标识别模型。2.根据权利要求1所述的方法,其特征在于,所述多个第一样本数据包括第一样本集和第二样本集,其中,所述第一样本集包括在第一时间段获得的第一样本数据,所述第二样本集包括在第二时间段内获得的第一样本数据,所述第二时间段为所述第一时间段之后的时间,所述根据所述第一训练数据对所述第一识别模型进行训练,得到第二识别模型和所述第二识别模型识别能力的评估值,包括:根据所述第一样本集对所述第一识别模型进行训练,得到第三识别模型,并根据所述第二样本集对所述第一识别模型进行训练,得到第四识别模型;获取所述第三识别模型中标签识别输出层的第二迁移权重和所述第四识别模型中标签识别输出层的第三迁移权重;根据预设权重迁移函数、所述第二迁移权重和所述第三迁移权重,确定所述标签识别输出层的第一迁移权重;根据所述第一迁移权重配置所述第一识别模型,得到所述第二识别模型;根据所述第二识别模型对所述第一训练数据包括多个第一样本数据分别进行识别,得到第一识别结果集;根据所述第一识别结果集和所述每个第一样本数据对应的预设标签,确定所述第二识别模型识别能力的评估值。3.根据权利要求2所述的方法,其特征在于,所述根据预设权重调整规则,对所述第二识别模型中的标签识别输出层的第一迁移权重和所述第一训练数据分别进行调整,包括:根据所述第一识别结果集中对每个所述第一样本数据的识别结果和所述每个第一样本数据对应的预设标签,将所述识别结果与预设标签不同的第一样本数据作为第二样本数据,得到第二训练数据集;所述根据预设权重调整规则,分别调整每个所述第二样本数据的第一学习权重和所述第二样本数据对应预设标签的第二学习权重。4.一种用户数据识别方法,其特征在于,包括:获取待识别的用户数据;
将所述用户数据输入识别模型,得到对所述用户数据的识别结果,其中,所述识别模型的标签识别输出层的权重为目标迁移权重,其...

【专利技术属性】
技术研发人员:刘希玉
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1