迁移方法及装置、数据分类方法及装置、电子设备制造方法及图纸

技术编号:35190992 阅读:26 留言:0更新日期:2022-10-12 18:10
本公开涉及迁移方法及装置、数据分类方法及装置、电子设备、计算机可存储介质。迁移方法包括:根据属于源域的第一数据,利用数据分类模型,确定第一数据的第一特征信息和第一数据类别信息,第一特征信息中添加有扰动;根据属于目标域的第二数据,利用数据分类模型,确定第二数据的第二特征信息和第二数据类别信息;分别根据第一特征信息和第二特征信息,利用域分类模型,确定第一数据的第一域类别信息和第二数据的第二域类别信息;根据第一数据类别信息和第一域类别信息、第二数据类别信息和第二域类别信息,对数据分类模型和域分类模型进行对抗训练,训练目标包括减小扰动。根据本公开,可以提高数据分类模型在目标域的数据分类准确性。确性。确性。

【技术实现步骤摘要】
迁移方法及装置、数据分类方法及装置、电子设备


[0001]本公开涉及人工智能
,特别涉及用于数据分类的迁移方法及装置、数据分类方法及装置、电子设备、计算机可存储介质。

技术介绍

[0002]迁移学习通过从已学习的相关任务中转移知识来改进学习的新任务,其研究如何把源域的知识迁移到目标域上。
[0003]相关技术中,利用属于源域的数据和属于目标域的数据,对数据分类模型和域分类模型进行对抗训练,训练后的数据分类模型用于对属于目标域的数据进行数据分类。

技术实现思路

[0004]相关技术中,在对抗训练过程中,未充分考虑源域和目标域的对齐,而源域和目标域存在域不一致性,这使得数据分类模型在目标域的数据分类准确性欠佳。
[0005]针对上述技术问题,本公开提出了一种解决方案,可以提高数据分类模型在目标域的数据分类准确性。
[0006]根据本公开的第一方面,提供了一种用于数据分类的迁移方法,包括:根据属于源域的第一数据,利用数据分类模型,确定所述第一数据的第一特征信息和第一数据类别信息,其中,所述第一特征信息中添加有扰动;根据属于目标域的第二数据,利用所述数据分类模型,确定所述第二数据的第二特征信息和第二数据类别信息;分别根据所述第一特征信息和所述第二特征信息,利用域分类模型,确定所述第一数据的第一域类别信息和所述第二数据的第二域类别信息;根据所述第一数据类别信息和所述第一域类别信息、所述第二数据类别信息和所述第二域类别信息,对所述数据分类模型和所述域分类模型进行对抗训练,其中,训练目标包括减小所述扰动。
[0007]在一些实施例中,对所述数据分类模型和所述域分类模型进行对抗训练包括:根据所述第一域类别信息和所述第二域类别信息,确定第一损失值,其中,所述第一损失值与所述域分类模型的域分类相关;根据所述第一类别信息和所述第二类别信息,确定第二损失值,其中,所述第二损失值与所述数据分类模型针对所述源域和所述目标域的数据分类相关;根据所述第一损失值和所述第二损失值,对所述数据分类模型和所述域分类模型进行对抗训练,其中,所述第一损失值用于训练所述域分类模型和减小所述扰动,所述第二损失值用于训练所述数据分类模型。
[0008]在一些实施例中,所述第一域类别信息包括作为第一概率的所述域分类模型确定的所述第一数据属于源域的概率,所述第二域类别信息包括作为第二概率的所述域分类模型确定的所述第二数据属于目标域的概率,确定第一损失值包括:根据所述第一概率和所述第二概率,确定所述第一损失值。
[0009]在一些实施例中,在属于源域的概率小于属于目标域的概率、所述第一损失值与所述第一概率成负相关且与所述第二概率成正相关情况下,所述训练目标还包括增大所述
第一损失值。
[0010]在一些实施例中,所述第一数据对应有预先标注的第一标签,所述第二数据存在多条,确定第二损失值包括:获取所述第二数据在所述数据分类模型中的隐藏层特征信息;根据所述隐藏层特征信息和所述第二数据类别信息,从多条第二数据中确定目标样本及其第二标签;根据所述第一数据类别信息和所述第一标签、所述目标样本的第二数据类别信息和所述目标样本的第二标签,确定所述第二损失值,其中,第二损失值表征所述第一数据类别信息与所述第一标签信息之间的差异程度、以及所述第二数据类别信息与所述第二标签信息之间的差异程度。
[0011]在一些实施例中,每条第二数据的第二数据类别信息包括第二数据类别,从多条第二数据中确定目标样本及其第二标签包括:根据所述多条第二数据的隐藏层特征信息,对所述多条第二数据进行聚类,得到多个数据组;确定每个数据组中数量最多的第二数据类别为所述每个数据组的聚类标签;筛选每个数据组中第二数据类别与所述每个数据组的聚类标签相同的第二数据,作为目标样本;确定所述目标样本的第二数据类别为所述目标样本的第二标签。
[0012]在一些实施例中,确定所述第二损失值包括:根据所述第一数据类别信息和所述第一标签,确定源域损失值,其中,所述源域损失值与所述数据分类模型针对所述源域的数据分类相关;根据所述目标样本的第二数据类别信息和所述目标样本的第二标签,确定目标域损失值,其中,所述目标域损失值表征所述数据分类模型针对所述目标域的数据分类相关;根据所述源域损失值和所述目标域损失值,确定所述第二损失值。
[0013]在一些实施例中,对所述数据分类模型和所述域分类模型进行对抗训练包括:固定所述数据分类模型的模型参数,根据所述第一损失值,训练所述域分类模型并利用梯度下降算法更新表征所述扰动的扰动参数的值;固定所述域分类模型的模型参数和所述扰动参数的值,根据所述第二损失值,训练所述数据分类模型。
[0014]在一些实施例中,所述扰动包括第一扰动和第二扰动中的一种,所述第一扰动用于在所述第一数据中添加扰动,所述第二扰动用于在所述第一数据或添加第一扰动后的第一数据在所述数据分类模型中的隐藏层特征信息中添加扰动,所述第一特征信息基于所述隐藏层特征信息确定。
[0015]在一些实施例中,分别根据所述第一特征信息和所述第二特征信息,利用域分类模型,确定所述第一数据的第一域类别信息和所述第二数据的第二域类别信息包括:根据所述第一特征信息和所述第一数据类别信息,利用域分类模型,确定所述第一域类别信息;根据所述第二特征信息和所述第二数据类别信息,利用域分类模型,确定所述第二域类别信息。
[0016]在一些实施例中,所述数据分类模型包括编码模块和数据分类模块,根据属于源域的第一数据,利用数据分类模型,确定所述第一数据的第一特征信息和第一数据类别信息包括:根据所述第一数据,利用所述编码模块,获取所述第一特征信息;根据所述第一特征信息,利用所述数据分类模块,确定所述第一数据类别信息;根据属于目标域的第二数据,利用所述数据分类模型,确定所述第二数据的第二特征信息和第二数据类别信息包括:根据所述第二数据,利用所述编码模块,获取所述第二特征信息;根据所述第二特征信息,利用所述数据分类模块,确定所述第二数据类别信息。
[0017]在一些实施例中,所述第一数据和所述第二数据为图,所述数据分类模型用于图分类。
[0018]在一些实施例中,所述图分类包括物品集合分类。
[0019]根据本公开第二方面,提供了一种数据分类方法,包括:获取属于目标域的待分类数据;根据所述待分类数据,利用数据分类模型,确定所述待分类数据的数据类别,其中,所述数据分类模型利用上述任一实施例所述的迁移方法得到。
[0020]根据本公开第三方面,提供了一种用于数据分类的迁移装置,包括:第一确定模块,被配置为根据属于源域的第一数据,利用数据分类模型,确定所述第一数据的第一特征信息和第一数据类别信息,其中,所述第一特征信息中添加有扰动;第二确定模块,被配置为根据属于目标域的第二数据,利用所述数据分类模型,确定所述第二数据的第二特征信息和第二数据类别信息;第三确定模块,被配置为分别根据所述第一特征信息和所述第二特征信息,利用域分类模型,确定所述第一数据的第一域类别信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于数据分类的迁移方法,包括:根据属于源域的第一数据,利用数据分类模型,确定所述第一数据的第一特征信息和第一数据类别信息,其中,所述第一特征信息中添加有扰动;根据属于目标域的第二数据,利用所述数据分类模型,确定所述第二数据的第二特征信息和第二数据类别信息;分别根据所述第一特征信息和所述第二特征信息,利用域分类模型,确定所述第一数据的第一域类别信息和所述第二数据的第二域类别信息;根据所述第一数据类别信息和所述第一域类别信息、所述第二数据类别信息和所述第二域类别信息,对所述数据分类模型和所述域分类模型进行对抗训练,其中,训练目标包括减小所述扰动。2.根据权利要求1所述的迁移方法,其中,对所述数据分类模型和所述域分类模型进行对抗训练包括:根据所述第一域类别信息和所述第二域类别信息,确定第一损失值,其中,所述第一损失值与所述域分类模型的域分类相关;根据所述第一类别信息和所述第二类别信息,确定第二损失值,其中,所述第二损失值与所述数据分类模型针对所述源域和所述目标域的数据分类相关;根据所述第一损失值和所述第二损失值,对所述数据分类模型和所述域分类模型进行对抗训练,其中,所述第一损失值用于训练所述域分类模型和减小所述扰动,所述第二损失值用于训练所述数据分类模型。3.根据权利要求2所述的迁移方法,其中,所述第一域类别信息包括作为第一概率的所述域分类模型确定的所述第一数据属于源域的概率,所述第二域类别信息包括作为第二概率的所述域分类模型确定的所述第二数据属于目标域的概率,确定第一损失值包括:根据所述第一概率和所述第二概率,确定所述第一损失值。4.根据权利要求3所述的迁移方法,其中,在属于源域的概率小于属于目标域的概率、所述第一损失值与所述第一概率成负相关且与所述第二概率成正相关情况下,所述训练目标还包括增大所述第一损失值。5.根据权利要求2所述的迁移方法,其中,所述第一数据对应有预先标注的第一标签,所述第二数据存在多条,确定第二损失值包括:获取所述第二数据在所述数据分类模型中的隐藏层特征信息;根据所述隐藏层特征信息和所述第二数据类别信息,从多条第二数据中确定目标样本及其第二标签;根据所述第一数据类别信息和所述第一标签、所述目标样本的第二数据类别信息和所述目标样本的第二标签,确定所述第二损失值,其中,第二损失值表征所述第一数据类别信息与所述第一标签信息之间的差异程度、以及所述第二数据类别信息与所述第二标签信息之间的差异程度。6.根据权利要求5所述的迁移方法,其中,每条第二数据的第二数据类别信息包括第二数据类别,从多条第二数据中确定目标样本及其第二标签包括:根据所述多条第二数据的隐藏层特征信息,对所述多条第二数据进行聚类,得到多个数据组;
确定每个数据组中数量最多的第二数据类别为所述每个数据组的聚类标签;筛选每个数据组中第二数据类别与所述每个数据组的聚类标签相同的第二数据,作为目标样本;确定所述目标样本的第二数据类别为所述目标样本的第二标签。7.根据权利要求5所述的迁移方法,其中,确定所述第二损失值包括:根据所述第一数据类别信息和所述第一标签,确定源域损失值,其中,所述源域损失值与所述数据分类模型针对所述源域的数据分类相关;根据所述目标样本的第二数据类别信息和所述目标样本的第二标签,确定目标域损失值,其中,所述目标域损失值表征所述数据分类模型针对所述目标域的数据分类相关;根据所述源域损失值和所述目标域损失值,确定所述第二损失值。8.根据权利要求2

7任一项所述的迁移方法,其中,对所述数据分类模型和所述域分类模型进行对抗训练包括:固定所述数据分类模型的模型参数,根据所述第一损失值,训练所述域分类模型并利用梯度下降算...

【专利技术属性】
技术研发人员:沈力尹楠
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1