System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及人工智能,特别涉及一种任务处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
1、随着神经网络模型的快速发展,其参数量也急剧增加,部分模型(例如大语言模型)具有超过千亿规模的巨量参数,为部署与应用带来了巨大挑战。同时,随着对隐私保护、时效性等需求的增长,在手机、笔记本电脑等终端设备上本地部署模型逐渐变得必要,这对进一步降低模型的存储空间、运算时的传输带宽等提出了更高要求。
技术实现思路
1、本公开提供一种任务处理方法、装置、电子设备及计算机可读存储介质。
2、第一方面,本公开提供了一种任务处理方法,该任务处理方法包括:在接收到待处理任务的情况下,调用目标模型的多个子模型分别执行所述待处理任务,得到多个所述子模型输出的子处理结果;对多个所述子模型的子处理结果进行融合处理,得到所述待处理任务的处理结果;其中,所述子模型是以预设调整方式对初始模型调整得到的,所述预设调整方式包括调整所述初始模型的参数稀疏度、调整所述初始模型的参数数量及调整所述初始模型的参数的数值精度中的至少一种,且多个所述子模型的预设调整方式不同。
3、第二方面,本公开提供了一种任务处理装置,该任务处理装置包括:执行模块,用于在接收到待处理任务的情况下,调用目标模型的多个子模型分别执行所述待处理任务,得到多个所述子模型输出的子处理结果;融合模块,用于对多个所述子模型的子处理结果进行融合处理,得到所述待处理任务的处理结果;其中,所述子模型是以预设调整方式对初始模型调整得到的,所述预设
4、第三方面,本公开提供了一种电子设备,该电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的任务处理方法。
5、第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序在被处理器执行时实现上述任务处理方法。
6、本公开所提供的实施例,能够将以不同的参数调整方式对初始模型进行调整得到的多个子模型作为目标模型,并在接收到待处理任务的情况下,调用目标模型的多个子模型分别执行待处理任务,得到多个子模型输出的子处理结果,然后对多个子模型的子处理结果进行融合处理,得到待处理任务的处理结果,从而能够缓解不同的参数调整方式之间的精度损失的相互影响,提高了目标模型的综合精度,进而提高了任务处理的准确性。
7、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种任务处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述目标模型的多个子模型包括第一子模型及第二子模型,所述第一子模型的预设调整方式包括调整所述初始模型的参数的数值精度,所述第二子模型的预设调整方式包括调整所述初始模型的参数数量;并且,
3.根据权利要求1所述的方法,其特征在于,所述目标模型的多个子模型包括第三子模型及第四子模型,所述第三子模型的预设调整方式包括调整所述初始模型的参数稀疏度,所述第四子模型的预设调整方式包括调整所述初始模型的参数数量;并且,
4.根据权利要求1所述的方法,其特征在于,所述目标模型的多个子模型包括第五子模型、第六子模型及第七子模型,所述第五子模型的预设调整方式包括调整所述初始模型的参数的数值精度,所述第六子模型的预设调整方式包括调整所述初始模型的参数稀疏度,所述第七子模型的预设调整方式包括调整所述初始模型的参数数量;并且,
5.根据权利要求4所述的方法,其特征在于,所述调用目标模型的多个子模型分别执行所述待处理任务,得到多个所述子模型输出的子处理结果,包括:
7.根据权利要求1所述的方法,其特征在于,所述目标模型的多个子模型包括第八子模型,所述第八子模型是将所述初始模型的输入作为第三样本任务、将所述初始模型的输出作为第三样本任务的处理结果标签,对预设模型训练得到的;所述预设模型的参数数量小于所述初始模型的参数数量。
8.根据权利要求1所述的方法,其特征在于,存储所述目标模型所占用的存储空间小于存储所述初始模型的所占用的存储空间;和/或,
9.根据权利要求1-8中任意一项所述的方法,其特征在于,所述待处理任务包括图像处理任务、语音处理任务、文本处理任务、视频处理任务中的任意一种。
10.一种任务处理装置,其特征在于,包括:
11.一种电子设备,其特征在于,包括:
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1-9中任一项所述的任务处理方法。
...【技术特征摘要】
1.一种任务处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述目标模型的多个子模型包括第一子模型及第二子模型,所述第一子模型的预设调整方式包括调整所述初始模型的参数的数值精度,所述第二子模型的预设调整方式包括调整所述初始模型的参数数量;并且,
3.根据权利要求1所述的方法,其特征在于,所述目标模型的多个子模型包括第三子模型及第四子模型,所述第三子模型的预设调整方式包括调整所述初始模型的参数稀疏度,所述第四子模型的预设调整方式包括调整所述初始模型的参数数量;并且,
4.根据权利要求1所述的方法,其特征在于,所述目标模型的多个子模型包括第五子模型、第六子模型及第七子模型,所述第五子模型的预设调整方式包括调整所述初始模型的参数的数值精度,所述第六子模型的预设调整方式包括调整所述初始模型的参数稀疏度,所述第七子模型的预设调整方式包括调整所述初始模型的参数数量;并且,
5.根据权利要求4所述的方法,其特征在于,所述调用目标模型的多个子模型分别执行所述待处理任务,得到多个所述子模型输出的子处理结果,包括:
6.根据权利要求...
【专利技术属性】
技术研发人员:刘发强,祝夭龙,
申请(专利权)人:北京灵汐科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。