System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据检索方法、装置、电子设备及介质制造方法及图纸_技高网

数据检索方法、装置、电子设备及介质制造方法及图纸

技术编号:44618835 阅读:0 留言:0更新日期:2025-03-17 18:18
本说明书提供一种数据检索方法、装置、电子设备及介质。所述方法包括:利用大语言模型分析目标问题文本是否可以拆分;在确定目标问题文本不可拆分的情况下,利用大语言模型将目标问题文本改写为抽象化问题;根据抽象化问题,对知识库进行检索,得到第一检索结果;利用大语言模型生成针对目标问题文本的假设性回答;根据假设性回答,对知识库进行检索,得到第二检索结果;根据目标问题文本,对知识库进行检索,得到第三检索结果;根据第一检索结果、第二检索结果和第三检索结果,确定目标检索结果。

【技术实现步骤摘要】

本说明书涉及人工智能,尤其涉及数据检索方法、装置、电子设备及介质


技术介绍

1、在当今信息化时代,知识库rag(retrieval-augmented generation)问答系统作为连接用户与海量信息的重要桥梁,正逐渐成为各行业智能化服务的核心组成部分。这类系统通过检索知识库中的相关信息片段,结合llm(大语言模型)生成回答,极大地提升了问题解答的准确性和丰富性。

2、目前,知识库问答系统通常采用基于关键词匹配或语义相似度计算的方法进行检索。然而在实际应用场景中,用户语言习惯、知识背景等差异,用户提问往往复杂多样、意图模糊、语境特殊,而由于现有检索机制在这些特殊场景下存在很大的局限性,导致其检索效果往往不尽人意,回答质量不高。


技术实现思路

1、为克服相关技术中存在的问题,本说明书提供了数据检索方法、装置、电子设备及介质。

2、根据本说明书实施例的第一方面,提供一种数据检索方法,所述方法包括:利用大语言模型分析目标问题文本是否可以拆分;在确定所述目标问题文本不可拆分的情况下,利用大语言模型将所述目标问题文本改写为抽象化问题;根据所述抽象化问题,对知识库进行检索,得到第一检索结果;利用大语言模型生成针对所述目标问题文本的假设性回答;根据所述假设性回答,对知识库进行检索,得到第二检索结果;根据所述目标问题文本,对知识库进行检索,得到第三检索结果;根据所述第一检索结果、第二检索结果和第三检索结果,确定目标检索结果。

3、根据本说明书实施例的第二方面,提供一种数据检索装置,包括:拆分确定模块,用于利用大语言模型分析目标问题文本是否可以拆分;改写模块,用于在确定所述目标问题文本不可拆分的情况下,利用大语言模型将所述目标问题文本改写为抽象化问题;第一检索模块,用于根据所述抽象化问题,对知识库进行检索,得到第一检索结果;假设回答模块,用于利用大语言模型生成针对所述目标问题文本的假设性回答;第二检索模块,用于根据所述假设性回答,对知识库进行检索,得到第二检索结果;第三检索模块,用于根据所述目标问题文本,对知识库进行检索,得到第三检索结果;结果确定模块,用于根据所述第一检索结果、第二检索结果和第三检索结果,确定目标检索结果。

4、根据本说明书实施例的第三方面,提供一种电子设备,包括:

5、处理器;

6、用于存储处理器可执行指令的存储器;

7、其中,所述处理器被配置为执行上述第一方面或其对应的任一实施方式的数据检索方法。

8、根据本说明书实施例的第四方面,提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的数据检索方法。

9、本说明书的实施例提供的技术方案可以包括以下有益效果:

10、本说明书实施例中,采用综合语义理解、子问题拆分、抽象问题生成、假设性回答的复合检索策略,可以根据问题类型定制检索路径,提升了检索灵活性与针对性。另外,通过综合多检索路径的检索结果,可以有效扩大检索范畴,提升召回率,提高检索的准确度与全面性。

11、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。

本文档来自技高网...

【技术保护点】

1.一种数据检索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述利用大语言模型分析目标问题文本是否可以拆分,包括:

5.根据权利要求1所述的方法,其特征在于,所述利用大语言模型将所述目标问题文本改写为抽象化问题,包括:

6.根据权利要求1所述的方法,其特征在于,利用大语言模型生成针对所述目标问题文本的假设性回答,包括:

7.根据权利要求3所述的方法,其特征在于,所述对原始问题文本进行预处理包括:

8.根据权利要求3所述的方法,其特征在于,所述利用大语言模型对所述中间问题文本进行语义优化处理,包括:

9.根据权利要求3所述的方法,其特征在于,所述方法还包括:

10.一种数据检索装置,其特征在于,所述装置包括:

11.一种电子设备,其特征在于,所述电子设备包括:

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至9中任一项所述的方法。

...

【技术特征摘要】

1.一种数据检索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述利用大语言模型分析目标问题文本是否可以拆分,包括:

5.根据权利要求1所述的方法,其特征在于,所述利用大语言模型将所述目标问题文本改写为抽象化问题,包括:

6.根据权利要求1所述的方法,其特征在于,利用大语言模型生成针对所述目标问题文本的假设性回答,包括:

7....

【专利技术属性】
技术研发人员:黄齐坤吴亚兵贾广辉毛彦泽
申请(专利权)人:新华三人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1