System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请实施例涉及人工智能,特别涉及一种任务模型的合并方法、媒体数据的处理方法和装置。
技术介绍
1、在人工智能
中,可以通过任务模型对应用场景涉及的媒体数据进行如分类、翻译、分割等的任务处理。在一些情况下,由于应用场景或任务处理等方面的差异,导致需要不同的任务模型来对媒体数据进行处理。例如,通过一个任务模型对剧本文本进行多情绪标签和多情绪等级的情绪识别,通过另一个任务模型对小说文本进行情绪分类,通过又一个任务模型对影视剧台词进行多情绪识别。
2、在实际应用时,任务模型的功能、应用场景等较为单一,且维护多个任务模型需要较高的维护成本。基于此,可以将多个任务模型合并成一个多任务模型,而如何进行任务模型的合并成为一个亟需解决的问题。
技术实现思路
1、本申请提供了一种任务模型的合并方法、媒体数据的处理方法和装置,可以提高多任务模型的准确性,丰富应用场景,降低维护成本。所述技术方案包括如下内容。
2、第一方面,提供了一种任务模型的合并方法,所述方法包括:
3、获取至少两个第一任务模型,任一个第一任务模型用于对目标媒体数据进行一种任务处理,各个第一任务模型包括结构相同的第一网络块,所述任一个第一任务模型还包括除所述第一网络块之外的第一部分;
4、对所述各个第一任务模型包括的第一网络块进行合并,得到第一合并块;
5、将所述第一合并块和所述各个第一任务模型包括的第一部分进行拼接,得到第一合并模型;
6、对所述第一合并模
7、在所述第一目标模型满足合并结束条件的情况下,将所述第一目标模型作为多任务模型,所述多任务模型用于对所述目标媒体数据进行所述各个第一任务模型对应的任务处理中的至少一个目标任务处理。
8、第二方面,提供了一种媒体数据的处理方法,所述方法包括:
9、获取目标媒体数据;
10、通过多任务模型对所述目标媒体数据进行至少一项目标任务处理,得到各个目标任务处理结果,所述多任务模型根据第一方面所述的任务模型的合并方法确定。
11、第三方面,提供了一种任务模型的合并装置,所述装置包括:
12、获取模块,用于获取至少两个第一任务模型,任一个第一任务模型用于对目标媒体数据进行一种任务处理,各个第一任务模型包括结构相同的第一网络块,所述任一个第一任务模型还包括除所述第一网络块之外的第一部分;
13、合并模块,用于对所述各个第一任务模型包括的第一网络块进行合并,得到第一合并块;
14、拼接模块,用于将所述第一合并块和所述各个第一任务模型包括的第一部分进行拼接,得到第一合并模型;
15、训练模块,用于对所述第一合并模型进行训练,得到第一目标模型;
16、确定模块,用于在所述第一目标模型满足合并结束条件的情况下,将所述第一目标模型作为多任务模型,所述多任务模型用于对所述目标媒体数据进行所述各个第一任务模型对应的任务处理中的至少一个目标任务处理。
17、在一种可能的实现方式中,所述训练模块,用于获取各个第一任务模型的样本媒体数据,任一个第一任务模型的样本媒体数据用于训练得到所述任一个第一任务模型;对于所述任一个第一任务模型的样本媒体数据,通过所述第一合并模型对所述任一个第一任务模型的样本媒体数据进行对应的任务处理,得到所述任一个第一任务模型对应的第一预测结果;根据各个第一任务模型对应的第一预测结果,对所述第一合并模型进行训练,得到第一目标模型。
18、在一种可能的实现方式中,所述训练模块,用于通过所述第一合并块对所述任一个第一任务模型的样本媒体数据进行特征提取,得到第一样本特征;通过所述任一个第一任务模型包括的第一部分,基于所述第一样本特征确定所述任一个第一任务模型对应的第一预测结果。
19、在一种可能的实现方式中,所述第一合并块包括至少一个特征提取网络;
20、所述训练模块,用于对于首个特征提取网络,通过所述首个特征提取网络对所述任一个第一任务模型的样本媒体数据进行特征提取,得到所述首个特征提取网络的输出数据;对于非首个特征提取网络,通过所述非首个特征提取网络对所述非首个特征提取网络的上一个特征提取网络的输出数据进行特征提取,得到所述非首个特征提取网络的输出数据,最后一个特征提取网络的输出数据为第一样本特征。
21、在一种可能的实现方式中,所述首个特征提取网络包括至少一层子网络,任一层子网络包括注意力层和前馈层;
22、所述训练模块,用于对于首层子网络,通过所述首层子网络中的注意力层对所述任一个第一任务模型的样本媒体数据进行注意力处理,得到第一处理结果,通过所述首层子网络中的前馈层基于所述第一处理结果确定所述首层子网络的输出数据;对于非首层子网络,通过所述非首层子网络中的注意力层对所述非首层子网络的上一层子网络的输出数据进行注意力处理,得到第二处理结果,通过所述非首层子网络中的前馈层基于所述第二处理结果确定所述非首层子网络的输出数据,最后一层子网络的输出数据为所述首个特征提取网络的输出数据。
23、在一种可能的实现方式中,所述训练模块,用于通过所述任一个第一任务模型包括的第一部分,对所述第一样本特征进行特征提取,得到第二样本特征;通过所述任一个第一任务模型包括的第一部分,将所述第二样本特征映射为所述任一个第一任务模型对应的第一预测结果。
24、在一种可能的实现方式中,所述训练模块,用于对于任一个第一任务模型,根据所述任一个第一任务模型对应的第一损失或第二损失中的至少一项,确定所述任一个第一任务模型对应的目标损失;根据各个第一任务模型对应的目标损失,对所述第一合并模型进行训练,得到第一目标模型;
25、其中,所述任一个第一任务模型对应的第一损失根据所述任一个第一任务模型对应的第一预测结果和第二预测结果确定,所述任一个第一任务模型对应的第二预测结果通过所述任一个第一任务模型对所述任一个第一任务模型的样本媒体数据进行任务处理得到;
26、所述任一个第一任务模型对应的第二损失根据所述任一个第一任务模型对应的第一预测结果和标注结果确定,所述任一个第一任务模型对应的标注结果用于标注对所述任一个第一任务模型的样本媒体数据进行对应的任务处理得到的处理结果。
27、在一种可能的实现方式中,所述训练模块,用于根据各个第一任务模型对应的目标损失,对所述第一合并块进行训练,得到第一目标块;对所述第一目标块和所述各个第一任务模型包括的第一部分进行拼接,得到第一目标模型。
28、在一种可能的实现方式中,所述获取模块,还用于获取所述第一目标模型在所述各个第一任务模型对应的任务处理上的第一精度指标;
29、所述确定模块,还用于如果各个第一精度指标均大于对应的精度指标阈值,确定所述第一目标模型不满足所述合并结束条件;
30、所述确定模块,还用于如果存在第一精度指标不大于对应的精本文档来自技高网...
【技术保护点】
1.一种任务模型的合并方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述第一合并模型进行训练,得到第一目标模型,包括:
3.根据权利要求2所述的方法,其特征在于,所述通过所述第一合并模型对所述任一个第一任务模型的样本媒体数据进行对应的任务处理,得到所述任一个第一任务模型对应的第一预测结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述第一合并块包括至少一个特征提取网络;所述通过所述第一合并块对所述任一个第一任务模型的样本媒体数据进行特征提取,得到第一样本特征,包括:
5.根据权利要求4所述的方法,其特征在于,所述首个特征提取网络包括至少一层子网络,任一层子网络包括注意力层和前馈层;所述通过所述首个特征提取网络对所述任一个第一任务模型的样本媒体数据进行特征提取,得到所述首个特征提取网络的输出数据,包括:
6.根据权利要求3所述的方法,其特征在于,所述通过所述任一个第一任务模型包括的第一部分,基于所述第一样本特征确定所述任一个第一任务模型对应的第一预测结果,包括:
7.
8.根据权利要求7所述的方法,其特征在于,所述根据各个第一任务模型对应的目标损失,对所述第一合并模型进行训练,得到第一目标模型,包括:
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
10.根据权利要求9所述的方法,其特征在于,任一个第一精度指标对应的精度指标阈值基于所述任一个第一精度指标对应的第一任务模型的精度指标确定。
11.根据权利要求1所述的方法,其特征在于,所述第一合并块和所述第一网络块的结构相同,所述第一合并块的参数是通过所述各个第一任务模型包括的第一网络块的参数计算得到。
12.根据权利要求1至11任一项所述的方法,其特征在于,所述第一目标模型包括第一目标块,各个第一部分包括结构相同的第二网络块,所述第一部分还包括除所述第二网络块之外的第二部分;所述方法还包括:
13.一种媒体数据的处理方法,其特征在于,所述方法包括:
14.根据权利要求13所述的方法,其特征在于,所述通过多任务模型对所述目标媒体数据进行至少一个目标任务处理,得到各个目标任务处理结果,包括:
15.根据权利要求14所述的方法,其特征在于,所述多任务模型包括第一目标块和各个候选任务处理对应的第一部分;所述基于从所述至少两个候选任务处理中选择至少一个目标任务处理的操作,通过多任务模型对所述目标媒体数据进行各个目标任务处理,得到各个目标任务处理结果,包括:
16.一种任务模型的合并装置,其特征在于,所述装置包括:
17.一种媒体数据的处理装置,其特征在于,所述装置包括:
18.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述电子设备实现如权利要求1至15任一所述的方法。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使电子设备实现如权利要求1至15任一所述的方法。
20.一种计算机程序产品,其特征在于,所述计算机程序产品中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使电子设备实现如权利要求1至15任一所述的方法。
...【技术特征摘要】
1.一种任务模型的合并方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述第一合并模型进行训练,得到第一目标模型,包括:
3.根据权利要求2所述的方法,其特征在于,所述通过所述第一合并模型对所述任一个第一任务模型的样本媒体数据进行对应的任务处理,得到所述任一个第一任务模型对应的第一预测结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述第一合并块包括至少一个特征提取网络;所述通过所述第一合并块对所述任一个第一任务模型的样本媒体数据进行特征提取,得到第一样本特征,包括:
5.根据权利要求4所述的方法,其特征在于,所述首个特征提取网络包括至少一层子网络,任一层子网络包括注意力层和前馈层;所述通过所述首个特征提取网络对所述任一个第一任务模型的样本媒体数据进行特征提取,得到所述首个特征提取网络的输出数据,包括:
6.根据权利要求3所述的方法,其特征在于,所述通过所述任一个第一任务模型包括的第一部分,基于所述第一样本特征确定所述任一个第一任务模型对应的第一预测结果,包括:
7.根据权利要求2所述的方法,其特征在于,所述根据各个第一任务模型对应的第一预测结果,对所述第一合并模型进行训练,得到第一目标模型,包括:
8.根据权利要求7所述的方法,其特征在于,所述根据各个第一任务模型对应的目标损失,对所述第一合并模型进行训练,得到第一目标模型,包括:
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
10.根据权利要求9所述的方法,其特征在于,任一个第一精度指标对应的精度指标阈值基于所述任一个第一精度指标对应的第一任务模型的精度指标确定。
11.根据权利要求1所述的方法,其特征在于,所述第...
【专利技术属性】
技术研发人员:郭卉,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。