基于指令的大模型信息处理方法技术

技术编号:39782217 阅读:19 留言:0更新日期:2023-12-22 02:25
本申请涉及一种基于指令的大模型信息处理方法

【技术实现步骤摘要】
基于指令的大模型信息处理方法、装置、电子设备及介质


[0001]本申请涉及信息处理领域,特别是涉及基于指令的大模型信息处理方法

装置

电子设备及介质


技术介绍

[0002]随着大语言模型的兴起,自然语言信息处理技术也得到了一定程度的提升

对于自然语言信息的处理工作不仅仅包括对实体信息的抽取,还包括根据自然语言进行意图的判断

其中,意图判断工作在医疗等领域中能够方便根据患者的语言信息对患者的意图进行判断

[0003]然而,现有的大语言模型(简称大模型)在对信息进行意图判断时,大多根据信息内容进行分析,然后生成意图判断的结果

由于信息内容中可能存在多义词等情况,而模型在意图判断时又没有能够得到有效的提示和引导,可能会作出与目标意图偏差较大的输出结果,从而出现意图判断不准确的情况,降低了意图判断的准确率

[0004]针对相关技术中存在的意图判断准确率较低的问题,目前还没有提出有效的解决方案


技术实现思路

[0005]在本实施例中提供了一种基于指令的大模型信息处理方法

装置

电子设备及介质,以解决相关技术中意图判断准确率较低的问题

[0006]第一个方面,在本专利技术中提供了一种基于指令的大模型信息处理方法,包括以下步骤:获取预先构建的目标指令模板;其中,所述目标指令模板包括第一指令模板,所述第一指令模板的指令包括在多个预设的意图选项中确定对应于被响应字段的字段值的意图选项;获取初始大语言模型,将所述目标指令模板注入所述初始大语言模型,得到目标大语言模型;获取所述被响应字段的的当前字段值,通过所述目标大语言模型对所述被响应字段的当前字段值进行意图判断,得到意图判断结果

[0007]在其中的一些实施例中,所述被响应字段包括问题字段和回复字段;所述通过所述目标大语言模型对所述被响应字段的当前字段值进行意图判断,得到意图判断结果包括:根据所述问题字段的当前字段值和所述回复字段的当前字段值,在多个所述意图选项中确定目标意图选项,根据所述目标意图选项确定所述意图判断结果

[0008]在其中的一些实施例中,所述获取预先构建的目标指令模板包括:获取预先构建的初始指令模板;通过样本示例对所述初始指令模板进行训练,得到所述目标指令模板;
所述样本示例包括所述被响应字段的示例字段值和多个所述意图选项的示例选择结果

[0009]在其中的一些实施例中,所述样本示例的数量为三个

[0010]在其中的一些实施例中,所述通过样本示例对所述初始指令模板进行训练包括:将所述被响应字段的示例字段值作为模板输入,将多个所述意图选项的示例选择结果作为标签,对所述初始指令模板进行监督训练

[0011]在其中的一些实施例中,所述目标指令模板还包括第二指令模板,所述第二指令模板的指令包括确定预设的多个实体字段的实体内容;所述方法还包括:获取待识别文本;通过所述目标大语言模型对所述待识别文本进行实体识别,得到目标实体内容

[0012]在其中的一些实施例中,多个所述预设的实体字段包括主诉字段

现病史字段

既往病史字段

家族病史字段

生活方式和社会史字段

药物和过敏史字段

[0013]第二个方面,在本专利技术中提供了一种基于指令的大模型信息处理装置,包括:获取模块,用于获取预先构建的目标指令模板;其中,所述目标指令模板包括第一指令模板,所述第一指令模板的指令包括在多个预设的意图选项中确定对应于被响应字段的字段值的意图选项;处理模块,用于获取初始大语言模型,将所述目标指令模板注入所述初始大语言模型,得到目标大语言模型;判断模块,用于获取所述被响应字段的的当前字段值,通过所述目标大语言模型对所述被响应字段的当前字段值进行意图判断,得到意图判断结果

[0014]第三个方面,在本专利技术中提供了一种电子设备,包括存储器

处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的基于指令的大模型信息处理方法

[0015]第四个方面,在本专利技术中提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一个方面所述的基于指令的大模型信息处理方法

[0016]与相关技术相比,本专利技术具有以下有益效果:
1、
在本专利技术中,通过将目标指令模板注入初始大语言模型,得到目标大语言模型,在进行意图判断时,根据被响应字段的当前字段值,从目标指令模板的多个预设的意图选项中选择出目标的意图选项,从而得到意图判断结果,在意图判断过程中,由于意图判断结果是根据从多个意图选项中选择出的目标意图选项进行确定的,指令模板能够引导模型从有限的多个意图选项中选择出目标意图选项,根据目标意图选项确定意图判断结果,从而提高对意图判断的准确率,解决了相关技术中存在的意图判断准确率较低的问题

[0017]2、
在本专利技术中,先构建初始指令模板,然后通过样本示例对初始指令模板进行训练,得到目标指令模板,再将目标指令模板注入初始大语言模型中,得到目标大语言模型

利用该目标大语言模型对信息意图进行判断时,还能够有效利用预先对样本示例的学习结果来进行意图选项的选择,进一步提高了对意图判断的准确率

[0018]3、
本专利技术中,目标指令模板还包括第二指令模板,通过大语言模型对待识别文本进行信息抽取时,能够按照第二指令模板中预设的实体字段进行实体内容的提取,提高了
大语言模型的信息抽取性能

[0019]本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征

目的和优点更加简明易懂

附图说明
[0020]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定

在附图中:图1是执行本专利技术中提供的基于指令的大模型信息处理方法的终端硬件结构框图

[0021]图2是本专利技术提供的基于指令的大模型信息处理方法的流程图;图3是本专利技术提供的基于指令的大模型信息处理装置的结构框图

具体实施方式
[0022]为更清楚地理解本申请的目的

技术方案和优点,下面结合附图和实施例,对本申请进行了描述和说明

[0023]除另作定义外,本申请所涉及的技术术语或者科学术语应具有本申请所属
具备一般技能的人所理解的一般含本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于指令的大模型信息处理方法,其特征在于,包括以下步骤:获取预先构建的目标指令模板;其中,所述目标指令模板包括第一指令模板,所述第一指令模板的指令包括在多个预设的意图选项中确定对应于被响应字段的字段值的意图选项;获取初始大语言模型,将所述目标指令模板注入所述初始大语言模型,得到目标大语言模型;获取所述被响应字段的的当前字段值,通过所述目标大语言模型对所述被响应字段的当前字段值进行意图判断,得到意图判断结果
。2.
根据权利要求1所述的基于指令的大模型信息处理方法,其特征在于,所述被响应字段包括问题字段和回复字段;所述通过所述目标大语言模型对所述被响应字段的当前字段值进行意图判断,得到意图判断结果包括:根据所述问题字段的当前字段值和所述回复字段的当前字段值,在多个所述意图选项中确定目标意图选项,根据所述目标意图选项确定所述意图判断结果
。3.
根据权利要求1所述的基于指令的大模型信息处理方法,其特征在于,所述获取预先构建的目标指令模板包括:获取预先构建的初始指令模板;通过样本示例对所述初始指令模板进行训练,得到所述目标指令模板;所述样本示例包括所述被响应字段的示例字段值和多个所述意图选项的示例选择结果
。4.
根据权利要求1所述的基于指令的大模型信息处理方法,其特征在于,所述样本示例的数量为三个
。5.
根据权利要求3所述的基于指令的大模型信息处理方法,其特征在于,所述通过样本示例对所述初始指令模板进行训练包括:将所述被响应字段的示例字段值作为模板输入,将多个所述意图选项的示例选择结果作为标签,对所述初始指令模板进行监督训练
。6.
根据权利要求1所...

【专利技术属性】
技术研发人员:房洁
申请(专利权)人:安徽十锎信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1