System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书涉及计算机和人工智能领域,尤其涉及一种业务执行方法、装置、存储介质及电子设备。
技术介绍
1、大语言模型作为人工智能
的重要分支,目前已经应用在诸多领域中,例如,可以在自然语言处理领域,用于处理各种文本数据,完成文本分类以及机器翻译等任务;再例如,可以在金融领域,通过向大语言模型输入经用户授权的个人信息,来对用户进行风险评估等任务。
2、对目前的诸多业务场景来说,需要大语言模型利用预先训练的先验知识,来解答用户输入的问题,而当出现新的业务场景时,为了使大语言模型可以应用在新的业务场景中,可使用大语言模型所具有的上下文学习能力(in-context learning,icl)学习新的业务场景对应的提示示例,即,提示示例用于给大语言模型新的业务场景示例的学习,以使大语言模型可以根据从提示示例中学习到的知识,来执行新的业务,而不采用对大语言模型进行训练的方式,来使大语言模型执行新的业务。
3、但是,学习提示示例后的大语言模型针对新的业务给出的输出结果,容易受到部分提示示例输出结果的影响,导致大语言模型性能的不稳定。
技术实现思路
1、本说明书实施例提供一种业务执行方法、装置、存储介质及电子设备,以部分解决上述现有技术存在的问题。
2、本说明书实施例采用下述技术方案:
3、本说明书提供的一种业务执行方法,包括:
4、获取至少一个提示示例以及待分析文本,针对每个提示示例,该提示示例中包含有待分析示例文本以及所述待分析示
5、确定所述待分析文本对应的自解释指令;
6、将所述至少一个提示示例、所述待分析文本以及所述自解释指令输入到预设的大语言模型中,以使所述大语言模型根据所述至少一个提示示例所包含的待分析示例文本与所述待分析示例文本对应的标准回复文本,预测所述待分析文本对应的初始回复文本,并通过所述自解释指令,生成得到所述初始回复文本的原因信息,以根据所述原因信息,调整所述初始回复文本,并将调整后的初始回复文本作为所述待分析文本对应的目标回复文本,所述原因信息用于表示所述大语言模型得到所述初始回复文本所基于的原因;
7、根据所述待分析文本对应的目标回复文本,执行业务。
8、可选地,所述方法还包括:
9、在确定所述大语言模型满足预设条件后,确定所述待分析文本所对应的业务类型;
10、将所述至少一个提示示例、所述待分析文本对应的自解释指令以及所述业务类型进行对应保存。
11、可选地,所述方法还包括:
12、获取用户输入的提问语句;
13、确定所述提问语句所对应的业务类型,作为目标类型;
14、查询出所述目标类型所对应的提示示例以及自解释指令;
15、将所述提问语句、所述目标类型所对应的提示示例以及所述自解释指令输入到预设的大语言模型中,以使所述大语言模型输出所述提问语句对应的目标回复文本。
16、可选地,确定所述提问语句所对应的业务类型,作为目标类型,具体包括:
17、确定用户在预设的操作界面中所选择的业务类型选项,所述操作界面中包含有多个业务类型选项;
18、根据所述用户选择的业务类型选项,确定所述提问语句所对应的业务类型,作为目标类型。
19、可选地,所述方法还包括:
20、确定待训练模型,所述待训练模型的模型规模小于所述大语言模型;
21、将所述待分析文本以及所述原因信息输入到所述待训练模型中,以使所述待训练模型根据所述原因信息以及所述待分析文本,输出所述待分析文本对应的回复文本;
22、根据所述待训练模型输出的所述待分析文本对应的回复文本与所述大语言模型生成的所述待分析文本对应的目标回复文本之间的偏差,确定损失值,其中,所述偏差与所述损失值呈正相关关系;
23、根据所述损失值,对所述待训练模型进行训练。
24、本说明书提供的一种业务执行装置,包括:
25、获取模块,用于获取至少一个提示示例以及待分析文本,针对每个提示示例,该提示示例中包含有待分析示例文本以及所述待分析示例文本对应的标准回复文本;
26、确定模块,用于确定所述待分析文本对应的自解释指令;
27、生成模块,用于将所述至少一个提示示例、所述待分析文本以及所述自解释指令输入到预设的大语言模型中,以使所述大语言模型根据所述至少一个提示示例所包含的待分析示例文本与所述待分析示例文本对应的标准回复文本,预测所述待分析文本对应的初始回复文本,并通过所述自解释指令,生成得到所述初始回复文本的原因信息,以根据所述原因信息,调整所述初始回复文本,并将调整后的初始回复文本作为所述待分析文本对应的目标回复文本,所述原因信息用于表示所述大语言模型得到所述初始回复文本所基于的原因;
28、执行模块,用于根据所述待分析文本对应的目标回复文本,执行业务。
29、可选地,所述装置还包括:
30、存储模块,用于在确定所述大语言模型满足预设条件后,确定所述待分析文本所对应的业务类型;将所述至少一个提示示例、所述待分析文本对应的自解释指令以及所述业务类型进行对应保存。
31、可选地,所述装置还包括:
32、使用模块,用于获取用户输入的提问语句;确定所述提问语句所对应的业务类型,作为目标类型;查询出所述目标类型所对应的提示示例以及自解释指令;将所述提问语句、所述目标类型所对应的提示示例以及所述自解释指令输入到预设的大语言模型中,以使所述大语言模型输出所述提问语句对应的目标回复文本。
33、本说明书提供的一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种业务执行方法。
34、本说明书提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的一种业务执行方法。
35、本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
36、本说明书实施例中,首先服务器会获取到至少一个提示示例以及待分析文本,进而,确定待分析文本对应的自解释指令,将至少一个提示示例、待分析文本以及自解释指令输入到预设的大语言模型中,以使大语言模型根据至少一个提示示例所包含的待分析示例文本与待分析示例文本对应的标准回复文本,来预测待分析文本对应的初始回复文本,并通过待分析文本对应的自解释指令,生成得到初始回复文本的原因信息,以根据原因信息,调整初始回复文本,并将调整后的初始回复文本作为待分析文本对应的目标回复文本,继而,根据待分析文本对应的目标回复文本,执行业务,其中,针对每个提示示例,该提示示例中包含有待分析示例文本以及待分析示例文本对应的标准回复文本,原因信息用于表示大语言模型得到初始回复文本所基于的原因。
37、在此方法中,通本文档来自技高网...
【技术保护点】
1.一种业务执行方法,包括:
2.如权利要求1所述的方法,所述方法还包括:
3.如权利要求2所述的方法,所述方法还包括:
4.如权利要求3所述的方法,确定所述提问语句所对应的业务类型,作为目标类型,具体包括:
5.如权利要求1所述的方法,所述方法还包括:
6.一种业务执行装置,包括:
7.如权利要求5所述的装置,所述装置还包括:
8.如权利要求5所述的装置,所述装置还包括:
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-5任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1-5任一项所述的方法。
【技术特征摘要】
1.一种业务执行方法,包括:
2.如权利要求1所述的方法,所述方法还包括:
3.如权利要求2所述的方法,所述方法还包括:
4.如权利要求3所述的方法,确定所述提问语句所对应的业务类型,作为目标类型,具体包括:
5.如权利要求1所述的方法,所述方法还包括:
6.一种业务执行装置,包括:
7.如权利要求5所述的装...
【专利技术属性】
技术研发人员:李律学,周书恒,祝慧佳,陆垚杰,
申请(专利权)人:中国科学院软件研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。