System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种大语言模型推理增强方法、设备和存储介质技术_技高网

一种大语言模型推理增强方法、设备和存储介质技术

技术编号:41688826 阅读:7 留言:0更新日期:2024-06-14 15:38
本申请公开了一种大语言模型推理增强方法、设备和存储介质,该方法包括:提取查询语句的关键要素,基于所述关键要素和知识图谱构建推理路径;将所述查询语句和所述推理路径填入到查询结果生成提示模板中,通过大语言模型对所述查询结果生成提示模板进行处理,得到所述查询语句的查询结果。通过上述方式,本申请能够为大语言模型的推理提供充足的事实性依据,解决大语言模型推理过程中生成事实类错误的问题,有效增强大语言模型的推理能力。

【技术实现步骤摘要】

本申请涉及人工智能和智能问答领域,具体涉及一种大语言模型推理增强方法、设备和存储介质


技术介绍

1、随着人工智能领域的发展,大语言模型的应用场景越来越广泛。大语言模型(large language model,llm)是基于海量文本数据训练而成的深度学习模型,例如gpt3、chatgpt、llama等。与传统的语言模型相比,大语言模型在自然语言理解、生成、推理等方面均有质的飞跃,能准确理解文本中的用户意图,分析复杂的文本数据。

2、然而,大语言模型通常因缺乏事实性知识而在推理过程中生成事实类错误的表述,这一问题被称为幻觉。由于在一些领域中要求大语言模型的数据分析和推理结果高度准确,而大语言模型的幻觉问题阻碍了其在一些领域中的应用,因此增强大语言模型的事实性知识成为解决幻觉问题的关键。


技术实现思路

1、为解决上述技术问题,本申请采用的技术方案是:提供一种大语言模型推理增强方法、设备和存储介质,以至少解决相关技术中大语言模型通常因缺乏事实性知识而在推理过程中生成事实类错误的表述的问题。

2、根据本专利技术的一个实施例,提供了一种大语言模型推理增强方法,包括:

3、提取查询语句的关键要素,基于所述关键要素和知识图谱构建推理路径;

4、将所述查询语句和所述推理路径填入到查询结果生成提示模板中,通过大语言模型对所述查询结果生成提示模板进行处理,得到所述查询语句的查询结果。

5、为解决上述技术问题,本申请采用的一个技术方案是:提供一种电子设备,包括存储器和处理器,其中,存储器用于存储计算机程序,计算机程序在被处理器执行时,用于实现上述技术方案中的大语言模型推理增强方法。

6、为解决上述技术问题,本申请采用的一个技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,计算机程序在被处理器执行时,用于实现上述技术方案中的大语言模型推理增强方法。

7、通过上述方案,本申请的有益效果是:本申请提供的大语言模型推理增强方法通过提取查询语句中的关键要素,并基于关键要素和知识图谱构建推理路径,由大语言模型对查询语句和推理路径填入的查询结果生成提示模板进行处理,得到查询语句的查询结果;如此无需对大语言模型进行微调,通过知识图谱中与查询语句相关的事实性知识增强大语言模型,为大语言模型的推理提供充足的事实性依据,解决大语言模型推理过程中生成事实类错误的问题,有效增强大语言模型的推理能力。

本文档来自技高网...

【技术保护点】

1.一种大语言模型推理增强方法,其特征在于,包括:

2.根据权利要求1所述的大语言模型推理增强方法,其特征在于,所述将所述查询语句和所述推理路径填入到查询结果生成提示模板中,通过大语言模型对所述查询结果生成提示模板进行处理,得到所述查询语句的查询结果,包括:

3.根据权利要求1所述的大语言模型推理增强方法,其特征在于,所述基于所述关键要素和知识图谱构建推理路径,包括:

4.根据权利要求3所述的大语言模型推理增强方法,其特征在于,所述基于所述多个三元组构建出所述推理路径,包括:

5.根据权利要求3所述的大语言模型推理增强方法,其特征在于,所述M大于1。

6.根据权利要求1所述的大语言模型推理增强方法,其特征在于,所述提取查询语句的关键要素,之前包括:

7.根据权利要求6所述的大语言模型推理增强方法,其特征在于,所述提取查询语句的关键要素,包括:

8.根据权利要求7所述的大语言模型推理增强方法,其特征在于,所述时间转换提示模板包括第二上下文范例,所述第二上下文范例包括第二查询语句范例、及所述第二查询语句范例中的时间描述转换成规范时间描述后的语句;和/或,

9.一种电子设备,其特征在于,所述电子设备包括处理器、存储器,所述处理器耦接所述存储器,所述处理器被配置为基于存储在所述存储器中的指令,执行权利要求1至8任一项所述的大语言模型推理增强方法的一个或多个步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-8中任一项所述的大语言模型推理增强方法的步骤。

...

【技术特征摘要】

1.一种大语言模型推理增强方法,其特征在于,包括:

2.根据权利要求1所述的大语言模型推理增强方法,其特征在于,所述将所述查询语句和所述推理路径填入到查询结果生成提示模板中,通过大语言模型对所述查询结果生成提示模板进行处理,得到所述查询语句的查询结果,包括:

3.根据权利要求1所述的大语言模型推理增强方法,其特征在于,所述基于所述关键要素和知识图谱构建推理路径,包括:

4.根据权利要求3所述的大语言模型推理增强方法,其特征在于,所述基于所述多个三元组构建出所述推理路径,包括:

5.根据权利要求3所述的大语言模型推理增强方法,其特征在于,所述m大于1。

6.根据权利要求1所述的大语言模型推理增强方法,其特征在于,所述提取查询语句的关键要素,之前包括:

【专利技术属性】
技术研发人员:周明伟楼宏良陈波毛廷运郑博方刘伟棠陈立力
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1