System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及人工智能,尤其涉及大模型和深度学习。更具体地,本公开提供了一种大模型微调方法、装置、电子设备和存储介质。
技术介绍
1、随着人工智能技术的发展,大模型的应用场景在不断增加。大模型可以是参数量较大的预训练模型,可以应对不同语义粒度下的任务,进行复杂的逻辑推理。
技术实现思路
1、本公开提供了一种大模型微调方法、装置、设备以及存储介质。
2、根据本公开的一方面,提供了一种大模型微调方法,该方法包括:根据模型应用场景,从多个不同类型的大模型中确定待部署大模型,其中,多个不同类型的大模型包括对话式大模型和基础大模型;将初始提示数据输入待部署大模型,得到第一输出结果;根据与模型应用场景对应的预设数据库和第一输出结果中至少之一,调整初始提示数据,得到经调整提示数据;根据与模型应用场景对应的训练样本数据,微调待部署大模型,得到目标大模型;根据经调整提示数据和目标大模型,确定目标大模型的第一性能评估值,其中,所述第一性能评估值用于表征所述目标大模型的性能。
3、根据本公开的另一方面,提供了一种大模型微调装置,该装置包括:第一确定模块,用于根据模型应用场景,从多个不同类型的大模型中确定待部署大模型,其中,多个不同类型的大模型包括对话式大模型和基础大模型;第一获得模块,用于将初始提示数据输入待部署大模型,得到第一输出结果;调整模块,用于根据与模型应用场景对应的预设数据库和第一输出结果中至少之一,调整初始提示数据,得到经调整提示数据;微调模块,用于根据与模型应用场景对应
4、根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。
5、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。
6、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据本公开提供的方法。
7、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种大模型微调方法,包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求1所述的方法,其中,所述根据模型应用场景,从多个不同类型的大模型中确定待部署大模型包括以下至少之一:
4.根据权利要求1所述的方法,其中,所述根据与所述模型应用场景对应的预设数据库和所述第一输出结果中至少之一,调整所述初始提示数据,得到经调整提示数据包括:
5.根据权利要求1所述的方法,其中,所述根据与所述模型应用场景对应的预设数据库和所述第一输出结果中至少之一,调整所述初始提示数据,得到经调整提示数据包括:
6.根据权利要求5所述的方法,其中,所述根据所述第一输出结果,基于所述初始提示数据进行N次迭代地调整,得到待增强提示数据包括:
7.根据权利要求1所述的方法,其中,所述根据与所述模型应用场景对应的训练样本数据,微调所述待部署大模型,得到目标大模型包括:
8.根据权利要求1所述的方法,还包括:
9.一种大模型微调装置,包括:
10.根据权利要求9所述的装置,还包括:
11
12.根据权利要求9所述的装置,其中,所述调整模块包括:
13.根据权利要求9所述的装置,其中,所述调整模块包括:
14.根据权利要求13所述的装置,其中,所述调整单元包括:
15.根据权利要求9所述的装置,其中,所述微调模块包括:
16.根据权利要求9所述的装置,还包括:
17.一种电子设备,包括:
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至8中任一项所述的方法。
19.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至8中任一项所述的方法。
...【技术特征摘要】
1.一种大模型微调方法,包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求1所述的方法,其中,所述根据模型应用场景,从多个不同类型的大模型中确定待部署大模型包括以下至少之一:
4.根据权利要求1所述的方法,其中,所述根据与所述模型应用场景对应的预设数据库和所述第一输出结果中至少之一,调整所述初始提示数据,得到经调整提示数据包括:
5.根据权利要求1所述的方法,其中,所述根据与所述模型应用场景对应的预设数据库和所述第一输出结果中至少之一,调整所述初始提示数据,得到经调整提示数据包括:
6.根据权利要求5所述的方法,其中,所述根据所述第一输出结果,基于所述初始提示数据进行n次迭代地调整,得到待增强提示数据包括:
7.根据权利要求1所述的方法,其中,所述根据与所述模型应用场景对应的训练样本数据,微调所述待部署大模型,得到目标大模型包括:
8.根据权利要求...
【专利技术属性】
技术研发人员:邢军华,代秀坤,罗航,欧阳剑,
申请(专利权)人:昆仑芯北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。