一种大语言模型的使用方法及装置制造方法及图纸

技术编号:39714759 阅读:9 留言:0更新日期:2023-12-17 23:22
本发明专利技术涉及一种大语言模型的使用方法及装置,其中,该方法将构建的提示模板输入不同的大语言模型,得到每一个大语言模型对该提示模板的理解效果,该理解效果用于对提示模板进行修改,将修改后的提示模板和待解决问题所对应的迭代提问输入到对应的大语言模型,根据大语言模型的执行效果不断输入迭代提问,得到迭代优化后的提示内容

【技术实现步骤摘要】
一种大语言模型的使用方法及装置


[0001]本专利技术涉及人工智能
,尤其涉及一种大语言模型的使用方法及装置


技术介绍

[0002]现阶段的大语言模型并不能完全代替人类进行工作,在使用大语言模型的过程中使用者起主导作用,大语言模型根据使用者输入的内容输出符合条件或需求的结果,但使用者在使用大语言模型进行输入时,输入的内容完全依赖使用者的知识储备

语言表达能力

学习能力

结果鉴别能力等,当使用者在使用大语言模型解决不熟悉的问题时,往往存在输入的内容不够合理准确导致优选大语言模型输出的结果达不到使用者的需求,使用者体验感差


技术实现思路

[0003]本专利技术所要解决的技术问题是:本专利技术提供一种大语言模型的使用方法及装置,提高大语言模型的输出结果准确性,优化用户体验

[0004]为了解决上述技术问题,本专利技术采用的技术方案为:
[0005]第一方面,本专利技术提供一种大语言模型的使用方法,包括:
[0006]获取构建的提示模板;
[0007]将所述提示模板对应输入到不同的大语言模型,以得到每一个大语言模型对于所述提示模板的理解效果,所述理解效果用于对所述提示模板进行修改;
[0008]获取待解决问题所对应的迭代提问,将修改后的提示模板输入到对应的大语言模型中,并根据所述大语言模型的执行效果不断输入所述迭代提问,以获得迭代优化后的提示内容

[0009]本专利技术的有益效果在于:将预先构建的提示模板输入到不同的大语言模型中,得到每一个大语言模型对该提示模板的理解效果,使得技术人员了解不同的大语言模型的能力和局限性,从而对提示模板进行修改使得对应的大语言模型能准确的理解提示模板,将获取的待解决问题对应的迭代提问基于修改后的提示模拟输入到对应的大语言模型中,根据大语言模型的执行效果不断输入迭代提问,展开多轮对话,以获得迭代优化后的提示内容即解决待解决问题对应的提示内容,便于后续用户在进行相同问题的提问时,能直接复用该提示内容,避免由于用户不熟悉问题导致无法构建合理的提示内容解决对应问题的情况出现,从而提高大语言模型输出结果的准确性,优化用户体验

[0010]可选地,所述提示模板包括指令

上下文和输出指示,所述将所述提示模板对应输入到不同的大语言模型,以得到每一个大语言模型对于所述提示模板的理解效果包括:
[0011]将所述提示模板对应输入到不同的大语言模型,使得所述大语言模型根据所述指令明确自身扮演的角色和需要完成的任务;
[0012]将测试问题输入到不同的大语言模型,使得所述大语言模型基于自身扮演的角色,按照所述输出指示,对所述测试问题进行符合所述上下文的响应,以得到每一个大语言
模型对于所述提示模板的理解效果

[0013]根据上述描述可知,提示模板中的指令说明了大语言模型所要扮演的角色和需要完成的任务,即为大语言模型提供了清晰的角色描述,再将测试问题输入到大语言模型中,使得大语言模型根据自身扮演的角色按照提示模板中的输出指示对测试问题进行符合上下文的响应

[0014]可选地,所述以得到每一个大语言模型对于所述提示模板的理解效果包括:
[0015]以得到每一个大语言模型对于所述测试问题的响应信息,所述响应信息用于与所述提示模板中的上下文和输出指示进行比对来判断所述大语言模型是否理解所述提示模板,以生成理解效果

[0016]根据上述描述可知,将每一个大语言模型对测试问题的响应信息与提示模板中的上下文和输出指示进行比对能知道对应的大语言模型是否能理解提示模板,即只有大语言模型理解提示模板才能生成符合提示模板中的上下文和输出指示的测试问题的响应信息

[0017]可选地,所述执行效果包括实时的提示内容

评论和问题,所述并根据所述大语言模型的执行效果不断输入所述迭代提问,以获得迭代优化后的提示内容包括:
[0018]并根据所述大语言模型的评论和问题,不断输入所述迭代提问对实时的提示内容不断进行迭代优化,以获得迭代优化后的提示内容

[0019]根据上述描述可知,大语言模型的执行效果包括实时的提示内容

评论和问题,根据评论和问题不断输入迭代提问以迭代交互的方式实现对实时的提示内容进行迭代优化,从而得到迭代优化后的提示内容即符合待解决问题的提示内容

[0020]可选地,所述迭代提问为待解决问题对应的一组提问内容,且同一组内的提问内容彼此关联

层层递进

[0021]根据上述描述可知,迭代提问是待解决问题对应的一组提问内容且同一组内的提问内容彼此关联

层次递进,从而确保大语言模型的执行效果有效性,实现对实时的提示内容进行迭代优化,避免大语言模型出现胡言乱语的情况

[0022]可选地,所述以获得迭代优化后的提示内容包括:
[0023]将所述提示内容输入到对应的大语言模型中,以得到所述大语言模型对所述提示内容的响应结果,根据所述响应结果判断所述提示内容是否有效,当所述响应结果达到预期效果,则所述提示内容有效,将所述提示内容

对应的大语言模型和待解决问题进行关联保存至数据库;
[0024]当所述响应结果未达到预期效果,则所述提示内容无效,对所述提示内容进行修正,得到修正后的提示内容

[0025]根据上述描述可知,将提示内容输入到不同的大语言模型中能得到每一个大语言模型对该提示内容的响应结果,从而根据响应结果是否达到预期效果判断该提示内容是否有效,对于无效的提示内容会进行修正,而有效的提示内容会将其与对应的大语言模型和待解决问题进行关联保存到数据库,从而实现对解决特定问题的提示内容的存储和复用

[0026]可选地,所述将所述提示内容

对应的大语言模型和待解决问题进行关联保存至数据库包括:
[0027]将所述提示内容

对应的大语言模型和待解决问题进行关联保存至数据库的数据表中,其中所述数据表的字段包括:提示内容

对应的大语言模型

待解决问题

待解决问题
的类别和入库时间

[0028]根据上述描述可知,数据库的数据表的字段包括了提示内容

对应的大语言模型

待解决问题

待解决问题的类别和入库时间,便于后续从数据表对提示内容进行筛选,更好进行复用

[0029]可选地,所述当所述响应结果未达到预期效果,则所述提示内容无效,对所述提示内容进行修正包括:
[0030]判断所述响应结果中出现的错误问题是否为首次出现,若是,则通过语义检测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种大语言模型的使用方法,其特征在于,包括:获取构建的提示模板;将所述提示模板对应输入到不同的大语言模型,以得到每一个大语言模型对于所述提示模板的理解效果,所述理解效果用于对所述提示模板进行修改;获取待解决问题所对应的迭代提问,将修改后的提示模板输入到对应的大语言模型中,并根据所述大语言模型的执行效果不断输入所述迭代提问,以获得迭代优化后的提示内容
。2.
如权利要求1所述的一种大语言模型的使用方法,其特征在于,所述提示模板包括指令

上下文和输出指示,所述将所述提示模板对应输入到不同的大语言模型,以得到每一个大语言模型对于所述提示模板的理解效果包括:将所述提示模板对应输入到不同的大语言模型,使得所述大语言模型根据所述指令明确自身扮演的角色和需要完成的任务;将测试问题输入到不同的大语言模型,使得所述大语言模型基于自身扮演的角色,按照所述输出指示,对所述测试问题进行符合所述上下文的响应,以得到每一个大语言模型对于所述提示模板的理解效果
。3.
如权利要求2所述的一种大语言模型的使用方法,其特征在于,所述以得到每一个大语言模型对于所述提示模板的理解效果包括:以得到每一个大语言模型对于所述测试问题的响应信息,所述响应信息用于与所述提示模板中的上下文和输出指示进行比对来判断所述大语言模型是否理解所述提示模板,以生成理解效果
。4.
如权利要求1所述的一种大语言模型的使用方法,其特征在于,所述执行效果包括实时的提示内容

评论和问题,所述并根据所述大语言模型的执行效果不断输入所述迭代提问,以获得迭代优化后的提示内容包括:并根据所述大语言模型的评论和问题,不断输入所述迭代提问对实时的提示内容不断进行迭代优化,以获得迭代优化后的提示内容
。5.
如权利要求1所述的一种大语言模型的使用方法,其特征在于,所述迭代提问为待解决问题对应的一组提问内容,且同一组内的提问内容彼此关联

层层递进
。6.
如权利要求1所述的一种大语言模型的使用方法,其特征在于,所述以获得迭代优化后的提示内容包括:将所述提示内容...

【专利技术属性】
技术研发人员:于辉兰一杰张凯黄文敏张标金梁丽莉
申请(专利权)人:福建实达集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1