System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,特别是涉及一种数据分类方法、分类模型训练方法及相关装置。
技术介绍
1、小样本学习是机器学习一种方法,专注于在样本量有限的情况下进行有效学习,从而完成所给的目标任务要求。然而,现有的小样本分类学习的准确率低。因此,如何提高小样本数据的分类结果的准确度成为需解决的问题之一。
技术实现思路
1、本申请主要解决的技术问题是提供一种数据分类方法、分类模型训练方法及相关装置,能够提高小样本数据的分类结果的准确度。
2、为解决上述技术问题,本申请第一方面提供了一种数据分类方法,该方法包括:获取待分类数据;利用参与端的本地模型对待分类数据进行处理,以得到全局分类模型对待分类数据的分类结果;其中,参与端的本地模型为全局分类模型或者为全局分类模型的一部分,全局分类模型是采用联邦学习进行训练,且全局分类模型至少利用设有伪标签的样本数据训练得到。
3、为解决上述技术问题,本申请第二方面提供了一种分类模型训练方法,该方法包括:利用参与端的本地模型对位于参与端的样本数据进行处理,得到参与端的样本处理结果;接收中间端发送的关于参与端的本地模型的第一本地参数信息,其中,中间端用于得到全局分类模型当前的第一全局参数信息,参与端的本地模型包含全局分类模型的各部分或者为全局分类模型的一部分,第一全局参数信息包括第一本地参数信息,且第一全局参数信息的确定与各参与端的样本处理结果以及对应的伪标签有关;按照第一本地参数信息对参与端的本地模型进行参数调整,并重复执行上述训练过程,直
4、为解决上述技术问题,本申请第三方面提供了一种分类模型训练方法,该方法包括:接收各参与端发送的本地训练信息;基于本地训练信息,确定全局分类模型当前的全局参数信息;基于全局分类模型当前的全局参数信息,确定关于各参与端的本地模型的第一本地参数信息,并将各参与端的第一本地参数信息发送给各参与端;重复执行上述训练过程,直至达到预设条件,以得到训练完成的全局分类模型,各参与端的本地模型的参数均基于训练完成的全局分类模型的参数进行更新;其中,在各参与端的本地模型包含全局分类模型的各部分的情况下,各参与端的第一本地参数信息均为全局参数信息,参与端的本地训练信息为参与端基于第一样本分类结果与样本数据的伪标签确定的本地模型的第二本地参数信息,第一样本分类结果是参与端利用参与端的本地模型对样本数据进行处理得到,全局参数信息是聚合各参与端的第二本地参数信息得到;在各参与端的本地模型为全局分类模型一部分的情况下,各参与端的第一本地参数信息为全局参数信息中关于参与端的本地模型的部分参数信息,参与端的本地训练信息为参与端利用参与端的本地模型对样本数据进行处理得到的样本处理结果,全局参数信息是利用第二样本分类结果与样本数据的伪标签确定的全局分类模型的参数信息,第二样本分类结果是全局分类模型的后处理模块基于各参与端的样本处理结果进行后处理得到的。
5、为解决上述技术问题,本申请第四方面提供了一种数据分类装置,该装置包括:获取模块、分类模块,获取模块用于获取待分类数据;分类模块用于利用参与端的本地模型对待分类数据进行处理,以得到全局分类模型对待分类数据的分类结果;其中,参与端的本地模型为全局分类模型或者为全局分类模型的一部分,全局分类模型是采用联邦学习进行训练,且全局分类模型至少利用设有伪标签的样本数据训练得到。
6、为解决上述技术问题,本申请第五方面提供了一种分类模型训练装置,该装置包括处理模块、第一接收模块、参数调整模块和第一重复模块,处理模块用于利用参与端的本地模型对位于参与端的样本数据进行处理,得到参与端的样本处理结果;第一接收模块接收中间端发送的关于参与端的本地模型的第一本地参数信息,其中,中间端用于得到全局分类模型当前的第一全局参数信息,参与端的本地模型包含全局分类模型的各部分或者为全局分类模型的一部分,第一全局参数信息包括第一本地参数信息,且第一全局参数信息的确定与各参与端的样本处理结果以及对应的伪标签有关;参数调整模块用于按照第一本地参数信息对参与端的本地模型进行参数调整;第一重复模块用于重复执行上述训练过程,直至达到预设条件,以得到训练完成的全局分类模型,各参与端的本地模型的参数均基于训练完成的全局分类模型的参数进行更新。
7、为解决上述技术问题,本申请第六方面提供了一种分类模型训练装置,该装置包括第二接收模块、全局参数模块、本地参数模块和第二重复模块,第二接收模块用于接收各参与端发送的本地训练信息;全局参数模块用于基于本地训练信息,确定全局分类模型当前的全局参数信息;本地参数模块用于基于全局分类模型当前的全局参数信息,确定关于各参与端的本地模型的第一本地参数信息,并将各参与端的第一本地参数信息发送给各参与端,以使各参与端按照第一本地参数信息对参与端的本地模型进行参数调整;第二重复模块用于重复执行上述训练过程,直至达到预设条件,以得到训练完成的全局分类模型,各参与端的本地模型的参数均基于训练完成的全局分类模型的参数进行更新;其中,在各参与端的本地模型包含全局分类模型的各部分的情况下,各参与端的第一本地参数信息均为全局参数信息,参与端的本地训练信息为参与端基于第一样本分类结果与样本数据的伪标签确定的本地模型的第二本地参数信息,第一样本分类结果是参与端利用参与端的本地模型对样本数据进行处理得到,全局参数信息是聚合各参与端的第二本地参数信息得到;在各参与端的本地模型为全局分类模型一部分的情况下,各参与端的第一本地参数信息为全局参数信息中关于参与端的本地模型的部分参数信息,参与端的本地训练信息为参与端利用参与端的本地模型对样本数据进行处理得到的样本处理结果,全局参数信息是利用第二样本分类结果与样本数据的伪标签确定的全局分类模型的参数信息,第二样本分类结果是全局分类模型的后处理模块基于各参与端的样本处理结果进行后处理得到的。
8、为解决上述技术问题,本申请第七方面提供了一种电子设备,该电子设备包括存储器和处理器,存储器存储有程序指令,处理器用于执行程序指令以实现如上述第一方面、第二方面和第三方面提供的方法。
9、为解决上述技术问题,本申请第八方面提供了一种计算机可读存储介质,该计算机可读存储介质用于存储程序指令,程序指令能够被执行以实现如上述第一方面、第二方面和第三方面的方法。
10、本申请的有益效果是:区别于现有技术的情况,本申请获取待分类数据;利用参与端的本地模型对待分类数据进行处理,以得到全局分类模型对待分类数据的分类结果;其中,参与端的本地模型为全局分类模型或者为全局分类模型的一部分,全局分类模型是采用联邦学习进行训练,且全局分类模型至少利用设有伪标签的样本数据训练得到。通过采用联邦学习训练全局分类模型可以解决样本数量较少的问题,在训练过程中利用设有伪标签的样本数据进行训练,能够提高小样本数据的分类结果的准确度;且相对于利用样本数据的真实标签进行有监督本文档来自技高网...
【技术保护点】
1.一种数据分类方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述联邦学习的参与端有多个,各所述参与端均具有本地模型,各所述参与端的本地模型均为所述全局分类模型或者为所述全局分类模型的一部分;
3.根据权利要求2所述的方法,其特征在于,各所述参与端的所述本地模型使用的特征一致,且均为所述全局分类模型,所述样本处理结果为所述样本数据的第一样本分类结果;
4.根据权利要求3所述的方法,其特征在于,所述样本数据包括多任务的样本数据,每个任务的所述样本数据包括查询数据和支持数据;所述全局分类模型的训练包括分别针对各任务的阶段训练,在每个所述任务的阶段训练,各所述参与端和所述中间端利用所述任务的样本数据进行迭代训练,得到完成所述任务的阶段训练的全局分类模型;
5.根据权利要求2所述的方法,其特征在于,各所述参与端的所述本地模型使用的特征不一致,且均为所述全局分类模型的一部分,所述中间端设有所述全局分类模型中的后处理模块;所述第一全局参数信息是所述中间端基于所述样本数据的第二样本分类结果与对应的伪标签得到的,所述第二样本分
6.根据权利要求2至5任一项所述的方法,其特征在于,所述样本数据包括多任务的样本数据;所述全局分类模型的训练包括分别针对各任务的多阶段训练,在每所述任务的阶段训练,各所述参与端和所述中间端利用所述任务的样本数据进行迭代训练,得到完成所述任务的阶段训练的全局分类模型;
7.根据权利要求6所述的方法,其特征在于,所述第二全局参数信息为各任务的统计参数信息之和与各参与端的各任务的数据量之和的比值,所述任务的统计参数信息为所述任务对应的全局分类模型最后的第一全局参数信息与各所述参与端关于所述任务的数据量之和的乘积。
8.根据权利要求2至5任一项所述的方法,其特征在于,所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,所述基于各所述样本数据的特征提取结果,确定任意两个所述样本数据在特征空间中的相似度,包括:
10.根据权利要求2至5任一项所述的方法,其特征在于,在每次或者部分次数执行所述按照所述第一本地参数信息对所述参与端的本地模型进行参数调整之后,还包括:
11.一种分类模型训练方法,其特征在于,包括:
12.一种分类模型训练方法,其特征在于,包括:
13.一种数据分类装置,其特征在于,包括:
14.一种分类模型训练装置,其特征在于,包括:
15.一种分类模型训练装置,其特征在于,包括:
16.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有程序指令,所述处理器用于执行所述程序指令以实现如权利要求1-12任一项所述的方法。
17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序指令,所述程序指令能够被执行以实现如权利要求1-12任一项所述的方法。
...【技术特征摘要】
1.一种数据分类方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述联邦学习的参与端有多个,各所述参与端均具有本地模型,各所述参与端的本地模型均为所述全局分类模型或者为所述全局分类模型的一部分;
3.根据权利要求2所述的方法,其特征在于,各所述参与端的所述本地模型使用的特征一致,且均为所述全局分类模型,所述样本处理结果为所述样本数据的第一样本分类结果;
4.根据权利要求3所述的方法,其特征在于,所述样本数据包括多任务的样本数据,每个任务的所述样本数据包括查询数据和支持数据;所述全局分类模型的训练包括分别针对各任务的阶段训练,在每个所述任务的阶段训练,各所述参与端和所述中间端利用所述任务的样本数据进行迭代训练,得到完成所述任务的阶段训练的全局分类模型;
5.根据权利要求2所述的方法,其特征在于,各所述参与端的所述本地模型使用的特征不一致,且均为所述全局分类模型的一部分,所述中间端设有所述全局分类模型中的后处理模块;所述第一全局参数信息是所述中间端基于所述样本数据的第二样本分类结果与对应的伪标签得到的,所述第二样本分类结果是所述中间端利用所述后处理模块基于各所述参与端的样本处理结果进行后处理得到的,所述第一本地参数信息为所述第一全局参数信息中关于所述本地模型的参数信息。
6.根据权利要求2至5任一项所述的方法,其特征在于,所述样本数据包括多任务的样本数据;所述全局分类模型的训练包括分别针对各任务的多阶段训练,在每所述任务的阶段训练,各所述参与端和所述中间端利用所...
【专利技术属性】
技术研发人员:高婷,储双双,张金辉,陈巍,石亚飞,黄建贵,刘磊,汪晶,贺茂华,王宇轩,庞天阳,
申请(专利权)人:讯飞华中武汉有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。