大模型调整方法、基于大模型技术的问答处理方法及装置制造方法及图纸

技术编号：44166601 阅读：25 留言：0更新日期：2025-01-29 10:40

本公开提供了一种大模型调整方法、基于大模型技术的问答处理方法及装置，涉及人工智能领域，尤其涉及大模型、自然语言处理、深度学习等技术领域，能够用于生成式搜索、智能助手、智能客服等应用领域。具体实现方案为：根据目标工具的描述信息，采用第一大模型生成参考问题，参考问题在问答对话中需调用目标工具生成对应的回复；根据参考问题，采用第二大模型生成目标工具的工具调用请求；在工具调用请求成功调用目标工具的情况下，根据工具调用请求和对应的参考问题，生成用于对第三大模型进行训练的训练样本。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能，具体为大模型、自然语言处理、深度学习等，能够用于生成式搜索、智能助手、智能客服等应用领域，尤其涉及一种大模型调整方法、基于大模型技术的问答处理方法及装置。

技术介绍

1、近年来，虽然大模型(large language model，llm)在各种应用场景下都展现出了卓越的性能，但大模型的工具调用能力仍有待提升。为了提升大模型的工具调用能力，相关技术提出获取训练样本对大模型进行针对性训练，然而，这些技术在获取训练样本时高度依赖于人工介入，获取训练样本的效率较低。

技术实现思路

1、本公开提供了一种大模型调整方法、基于大模型技术的问答处理方法及装置。

2、根据本公开的第一方面，提供了一种大模型的训练样本获取方法，包括：根据目标工具的描述信息，采用第一大模型生成参考问题，所述参考问题在问答对话中需调用所述目标工具生成对应的回复；根据所述参考问题，采用第二大模型生成所述目标工具的工具调用请求；在所述工具调用请求成功调用所述目标工具的情况下，根据所述工具调用请求和对应的所述参考问题，生成用于对第三大模型进行训练的训练样本。

3、根据本公开的第二方面，提供了一种大模型调整方法，包括：获取大模型的训练样本，所述训练样本是基于第一方面所述的大模型的训练样本获取方法得到；基于所述训练样本，对所述大模型进行模型参数调整。

4、根据本公开的第三方面，提供了一种基于大模型技术的问答处理方法，包括：获取待回复的问题；将所述问题输入大模型，得到所述大模型

5、根据本公开的第四方面，提供了一种大模型的训练样本获取装置，包括：第一生成模块，用于根据目标工具的描述信息，采用第一大模型生成参考问题，所述参考问题在问答对话中需调用所述目标工具生成对应的回复；第二生成模块，用于根据所述参考问题，采用第二大模型生成所述目标工具的工具调用请求；第三生成模块，用于在所述工具调用请求成功调用所述目标工具的情况下，根据所述工具调用请求和对应的所述参考问题，生成用于对第三大模型进行训练的训练样本。

6、根据本公开的第五方面，提供了一种大模型调整装置，包括：样本获取模块，用于获取大模型的训练样本，所述训练样本是基于第一方面所述的大模型的训练样本获取方法得到；调整模块，用于基于所述训练样本，对所述大模型进行模型参数调整。

7、根据本公开的第六方面，提供了一种基于大模型技术的问答处理装置，包括：问题获取模块，用于获取待回复的问题；回复模块，用于将所述问题输入大模型，得到所述大模型针对所述问题输出的回复，所述大模型是基于第二方面所述的大模型调整方法得到。

8、根据本公开的第七方面，提供了一种电子设备，包括：

9、至少一个处理器；以及

10、与所述至少一个处理器通信连接的存储器；其中，

11、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如第一方面所述的大模型的训练样本获取方法，或者，执行如第二方面所述的大模型调整方法，或者，执行如第三方面所述的基于大模型技术的问答处理方法。

12、根据本公开第八方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行如第一方面所述的大模型的训练样本获取方法，或者，执行如第二方面所述的大模型调整方法，或者，执行如第三方面所述的基于大模型技术的问答处理方法。

13、根据本公开的第九方面，提供了一种计算机程序产品，包括计算机指令，所述计算机指令在被处理器执行时实现如第一方面所述的大模型的训练样本获取方法，或者，实现如第二方面所述的大模型调整方法，或者，实现如第三方面所述的基于大模型技术的问答处理方法的步骤。

14、本公开提供的一种大模型调整方法、基于大模型技术的问答处理方法及装置，存在如下有益效果：

15、根据目标工具的描述信息，采用第一大模型生成参考问题，参考问题在问答对话中需调用目标工具生成对应的回复；根据参考问题，采用第二大模型生成目标工具的工具调用请求；在工具调用请求成功调用目标工具的情况下，根据工具调用请求和对应的参考问题，生成用于对第三大模型进行训练的训练样本。本公开采用第一大模型根据目标工具的描述信息自动生成参考问题，采用第二大模型根据参考问题自动生成工具调用请求，进而根据工具调用请求和对应的参考问题自动生成训练样本，整个过程无需人工介入，提高了训练样本的获取效率。

16、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种大模型的训练样本获取方法，包括：

2.根据权利要求1所述的方法，其中，所述根据所述参考问题，采用第二大模型生成所述目标工具的工具调用请求，包括：

3.根据权利要求1所述的方法，其中，所述方法还包括：

4.根据权利要求3所述的方法，其中，所述采用第四大模型对各所述目标工具对应的参考问题进行问题组合，得到复合问题，包括：

5.根据权利要求4所述的方法，其中，所述将各所述目标工具对应的参考问题填充至所述第二提示模板，得到第二提示词，包括：

6.根据权利要求1所述的方法，其中，所述根据目标工具的描述信息，采用第一大模型生成参考问题，包括：

7.根据权利要求1所述的方法，其中，在所述根据目标工具的描述信息，采用第一大模型生成参考问题之前，所述方法还包括：

8.根据权利要求7所述的方法，其中，所述基于所述目标语言类别，对所述初始信息进行语言转换，得到所述目标工具的描述信息，包括：

9.一种大模型调整方法，包括：

10.一种基于大模型技术的问答处理方法，包括：

11.

12.根据权利要求11所述的装置，其中，所述第二生成模块，用于：

13.根据权利要求11所述的装置，其中，所述装置还包括：

14.根据权利要求13所述的装置，其中，所述组合模块，用于：：

15.根据权利要求14所述的装置，其中，所述组合模块，用于：：

16.根据权利要求11所述的装置，其中，所述第一生成模块，用于：

17.根据权利要求11所述的装置，其中，所述装置还包括：

18.根据权利要求17所述的装置，其中，所述转换模块，用于基于所述目标语言类别，对所述初始信息进行语言转换，得到目标信息，所述目标信息中包括所述目标工具的初始功能描述信息；

19.一种大模型调整装置，包括：

20.一种基于大模型技术的问答处理装置，包括：

21.一种电子设备，包括：

22.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法，或者，执行权利要求9所述的方法，或者，执行权利要求10所述的方法。

23.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现权利要求1-8中任一项所述的方法，或者，实现权利要求9所述的方法，或者，实现权利要求10所述的方法。

...

【技术特征摘要】