System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大模型的提示词优化方法及相关设备技术_技高网

基于大模型的提示词优化方法及相关设备技术

技术编号:42971927 阅读:6 留言:0更新日期:2024-10-15 13:13
本申请公开了一种基于大模型的提示词优化方法,涉及人工智能技术领域,具体包括:获取待优化提示词和待优化提示词的字符长度;基于字符长度,计算待优化提示词的推理成本;将待优化提示词输入至目标大模型,得到目标大模型输出的预测任务回答,并基于预测任务回答,确定待优化提示词的推理性能;基于推理性能和所述推理成本,通过预设的多目标优化算法,从待优化提示词中选取最优提示词,并将最优提示词作为优化后的提示词。本申请通过推理性能和推理成本为优化目标的多目标优化算法,对待优化提示词进行优化处理,使得输出的优化后的提示词是同时兼顾大模型推理成本和推理性能的提示词,使其选取的提示词满足技术发展要求。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及基于大模型的提示词优化方法及相关设备


技术介绍

1、目前,随着人工智能的发展,文本问答类的大语言模型被普遍应用。其中,大模型提示词作为用户与大模型间的沟通纽带,对于引导大模型输出高质量内容具有重要作用。其中,大模型提示词,是指人与大型语言模型进行交互时,输入查询语句之后的单词或语句,用于引导大模型输出人所需求的响应内容。在用户与大模型的交互过程中,提示词的准确性至关重要,优质的提示词能够引导模型输出高质量的内容。

2、相关技术中通常是通过增加提示词的长度,使其包含更多的相关信息,从而提高模型的推理性能。但是该方法中随着提示词的长度增加,大模型需要处理的数据量越大,从而导致大模型的推理时间和推理费用的增加。因此,相关技术中对提示词的选取,难以满足技术发展要求。

3、上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。


技术实现思路

1、本申请的主要目的在于提供一种基于大模型的提示词优化方法,旨在解决相关技术中对提示词的选取,难以满足技术发展要求的问题。

2、为实现上述目的,本申请提出一种基于大模型的提示词优化方法,所述基于大模型的提示词优化的方法包括:

3、获取待优化提示词和所述待优化提示词的字符长度;

4、基于所述字符长度,计算所述待优化提示词的推理成本;

5、将所述待优化提示词输入至目标大模型,得到所述目标大模型输出的预测任务回答,并基于所述预测任务回答,确定所述待优化提示词的推理性能;

6、基于所述推理性能和所述推理成本,通过预设的多目标优化算法,从所述待优化提示词中选取最优提示词,并将所述最优提示词作为优化后的提示词,其中,所述多目标优化算法是以推理性能和推理成本为优化目标的优化算法。

7、在一实施例中,所述将所述待优化提示词输入至目标大模型,得到所述目标大模型输出的预测任务回答,并基于所述预测任务回答,确定所述待优化提示词的推理性能的步骤,包括:

8、获取所述待优化提示词对应的优化样本集以及所述优化样本集对应的任务回答标签;

9、将所述待优化提示词和所述优化样本集输入至目标大模型,得到所述目标大模型输出的预测任务回答;

10、计算所述预测任务回答和所述任务回答标签之间的差值,得到目标差值,并基于所述目标差值,计算所述待优化提示词的推理性能。

11、在一实施例中,所述基于所述推理性能和所述推理成本,通过预设的多目标优化算法,从所述待优化提示词中选取最优提示词,并将所述最优提示词作为优化后的提示词的步骤,包括:

12、基于所述推理性能和所述推理成本,对各所述待优化提示词进行非支配解排序,得到排序后的待优化提示词;

13、从所述排序后的待优化提示词中按照从大到小的顺序选取预设第一数量的提示词作为最优提示词。

14、在一实施例中,所述从所述排序后的待优化提示词中按照从大到小的顺序选取预设第一数量的提示词作为最优提示词的步骤,包括:

15、对所述排序后的待优化提示词进行拥挤度计算,得到拥挤度信息;

16、基于所述拥挤度信息,从所述排序后的待优化提示词中按照从大到小的顺序选取预设第一数量的提示词作为最优提示词。

17、在一实施例中,所述基于所述推理性能和所述推理成本,通过预设的多目标优化算法,从所述待优化提示词中选取最优提示词,并将所述最优提示词作为优化后的提示词的步骤,包括:

18、基于所述推理性能和所述推理成本,从所述待优化提示词中选取预设第一数量的最优提示词;

19、判断所述最优提示词是否满足预设的迭代停止条件;

20、若所述最优提示词不满足预设的迭代停止条件,则将所述最优提示词作为下一轮迭代的待优化提示词,返回所述确定所述待优化提示词对应的推理成本的步骤,直至所述最优提示词满足预设的迭代停止条件,则停止最优提示词的选取,并将该轮预设第一数量的最优提示词作为优化后的提示词。

21、在一实施例中,所述获取待优化提示词的步骤之后,所述方法包括:

22、从所述待优化提示词中任意选定一对提示词进行交叉替换处理,得到新增提示词;

23、重复所述从所述待优化提示词中任意选定一对提示词进行交叉处理,得到新增提示词的步骤,直至得到预设第二数量的新增提示词,并将所述待优化提示词和所述新增提示词进行合并,得到扩增后的待优化提示词;

24、基于预设的文本替换库,对所述扩增后的待优化提示词进行文本字符替换,得到替换后的待优化提示词。

25、此外,为实现上述目的,本申请还提出一种基于大模型的提示词优化装置,所述基于大模型的提示词优化装置包括:

26、获取模块,用于获取待优化提示词和所述待优化提示词的字符长度;

27、成本计算模块,用于基于所述字符长度,计算所述待优化提示词的推理成本;

28、输入模块,用于将所述待优化提示词输入至目标大模型,得到所述目标大模型输出的预测任务回答,并基于所述预测任务回答,确定所述待优化提示词的推理性能;

29、优化模块,用于基于所述推理性能和所述推理成本,通过预设的多目标优化算法,从所述待优化提示词中选取最优提示词,并将所述最优提示词作为优化后的提示词,其中,所述多目标优化算法是以推理性能和推理成本为优化目标的优化算法。

30、此外,为实现上述目的,本申请还提出一种基于大模型的提示词优化设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上文所述的基于大模型的提示词优化方法的步骤。

31、此外,为实现上述目的,本申请还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述的基于大模型的提示词优化方法的步骤。

32、此外,为实现上述目的,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上文所述的基于大模型的提示词优化方法的步骤。

33、本申请提出的一个或多个技术方案,至少具有以下技术效果:

34、本申请通过推理性能和推理成本为优化目标的多目标优化算法,对待优化提示词进行优化处理,使得输出的优化后的提示词是同时兼顾大模型推理成本和推理性能的最优的提示词,即在考虑大模型推理性能的基础上降低了推理成本,使其选取的提示词满足技术发展要求。

本文档来自技高网...

【技术保护点】

1.一种基于大模型的提示词优化方法,其特征在于,所述基于大模型的提示词优化的方法包括:

2.如权利要求1所述的基于大模型的提示词优化方法,其特征在于,所述将所述待优化提示词输入至目标大模型,得到所述目标大模型输出的预测任务回答,并基于所述预测任务回答,确定所述待优化提示词的推理性能的步骤,包括:

3.如权利要求2所述的基于大模型的提示词优化方法,其特征在于,所述基于所述推理性能和所述推理成本,通过预设的多目标优化算法,从所述待优化提示词中选取最优提示词,并将所述最优提示词作为优化后的提示词的步骤,包括:

4.如权利要求3所述的基于大模型的提示词优化方法,其特征在于,所述从所述排序后的待优化提示词中按照从大到小的顺序选取预设第一数量的提示词作为最优提示词的步骤,包括:

5.如权利要求2所述的基于大模型的提示词优化方法,其特征在于,所述基于所述推理性能和所述推理成本,通过预设的多目标优化算法,从所述待优化提示词中选取最优提示词,并将所述最优提示词作为优化后的提示词的步骤,包括:

6.如权利要求1所述的基于大模型的提示词优化方法,其特征在于,所述获取待优化提示词的步骤之后,所述方法包括:

7.一种基于大模型的提示词优化装置,其特征在于,所述装置包括:

8.一种基于大模型的提示词优化设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至6中任一项所述的基于大模型的提示词优化方法的步骤。

9.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的基于大模型的提示词优化方法的步骤。

10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的基于大模型的提示词优化方法的步骤。

...

【技术特征摘要】

1.一种基于大模型的提示词优化方法,其特征在于,所述基于大模型的提示词优化的方法包括:

2.如权利要求1所述的基于大模型的提示词优化方法,其特征在于,所述将所述待优化提示词输入至目标大模型,得到所述目标大模型输出的预测任务回答,并基于所述预测任务回答,确定所述待优化提示词的推理性能的步骤,包括:

3.如权利要求2所述的基于大模型的提示词优化方法,其特征在于,所述基于所述推理性能和所述推理成本,通过预设的多目标优化算法,从所述待优化提示词中选取最优提示词,并将所述最优提示词作为优化后的提示词的步骤,包括:

4.如权利要求3所述的基于大模型的提示词优化方法,其特征在于,所述从所述排序后的待优化提示词中按照从大到小的顺序选取预设第一数量的提示词作为最优提示词的步骤,包括:

5.如权利要求2所述的基于大模型的提示词优化方法,其特征在于,所述基于所述推理性能和所述推理成本,通过预设的多目标优化算法,从所述待优化提示词中选取最优提...

【专利技术属性】
技术研发人员:康焱
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1