System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 信息处理方法、装置、电子设备、存储介质及程序产品制造方法及图纸_技高网

信息处理方法、装置、电子设备、存储介质及程序产品制造方法及图纸

技术编号:44237709 阅读:2 留言:0更新日期:2025-02-11 13:38
本申请实施例提供一种信息处理方法、装置、电子设备、存储介质及程序产品。该方法包括:获取用户输入的初始信息;在初始信息为数据查询任务时,确定初始信息对应的至少一个目标数据库;至少一个目标数据库是从多个数据库中筛选出来的;根据初始信息和至少一个目标数据库的信息,基于第一文本处理模型确定初始信息对应的至少一个精准查询信息;根据至少一个精准查询信息,确定初始信息对应的查询结果,可以更准确地理解用户的查询意图,减少了模糊查询带来的不确定性,提高了查询结果的相关性和准确性,并且从多个数据库中筛选出至少一个目标数据库,确保查询是在最相关的数据源中进行,这种筛选过程可以减少不必要的数据处理,提高效率。

【技术实现步骤摘要】

本申请涉及检索增强领域,尤其涉及一种信息处理方法、装置、电子设备、存储介质及程序产品


技术介绍

1、“检索增强生成(rag,retrieval-augmented generation)”是一种利用检索工具访问外部数据库来增强大语言模型(llms,large language models)生成质量的技术。它通过优化上下文信息,使得llms在生成文本时能够基于更广泛、更准确的知识基础。

2、但是,现有的检索器依赖于用户查询(query)和数据库中候选文本(candidatepassages)之间的语义匹配来决定返回的内容。这要求用户查询必须包含明确的查询意图,否则检索器难以在查询与目标文本之间建立有效的语义联系。因此,当前rag系统主要应用于查询意图明确、具体的问答任务。然而,在实际场景中,用户的查询需求往往更复杂且隐晦,基于“语义匹配”的检索器难以准确找到回答问题所需的文本片段。


技术实现思路

1、本申请实施例提供一种信息处理方法、装置、电子设备、存储介质及程序产品,用以提升查询结果的准确性。

2、第一方面,本申请实施例提供一种信息处理方法,包括:

3、获取用户输入的初始信息;

4、确定所述初始信息对应的至少一个目标数据库;所述至少一个目标数据库是从多个数据库中筛选出来的;

5、在所述初始信息为数据查询任务时,根据所述初始信息和所述至少一个目标数据库的信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息

6、根据所述至少一个精准查询信息,确定所述初始信息对应的查询结果。

7、在一种可能的实施方式中,根据所述至少一个精准查询信息,确定所述初始信息对应的查询结果,包括:

8、根据所述至少一个精准查询信息对所述至少一个目标数据库进行检索,得到各精准查询信息分别对应的查询结果;

9、根据所述初始信息和各精准查询信息分别对应的查询结果,确定所述初始信息对应的目标查询结果。

10、在一种可能的实施方式中,根据所述初始信息和所述至少一个目标数据库的信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息,包括:

11、根据所述初始信息和所述至少一个目标数据库的信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息和初步查询结果;

12、相应的,根据所述至少一个精准查询信息,确定所述初始信息对应的查询结果,包括:

13、根据所述至少一个精准查询信息和所述初步查询结果,确定所述初始信息对应的查询结果。

14、在一种可能的实施方式中,所述方法还包括:

15、针对所述多个数据库中的任一数据库,对所述数据库进行信息压缩,得到所述数据库对应的压缩信息;

16、将所述多个数据库进行整体数据压缩,得到所述多个数据对应的压缩信息;

17、相应的,根据所述初始信息和所述至少一个目标数据库的信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息,包括:

18、在所述至少一个目标数据库的数量为1个,或者与所述多个数据库的数量相同时,获取所述至少一个目标数据库对应的压缩信息;

19、根据所述初始信息和所述压缩信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息。

20、在一种可能的实施方式中,所述方法还包括:

21、获取用户输入的至少一个数据库组合,所述数据库组合中包含多个第一数据库的标识信息;

22、针对每一数据库组合,根据所述数据库组合对应的多个第一数据库的标识信息,确定所述数据库组合对应的多个第一数据库;将所述多个第一数据库进行整体数据压缩,得到所述数据库组合对应的压缩信息;

23、相应的,根据所述初始信息和所述至少一个目标数据库的信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息,包括:

24、在所述至少一个目标数据库的数量为大于1个且小于所述多个数据库的数量时,若在第一映射关系表中存在目标数据库组合对应的压缩信息,则获取所述目标数据库组合对应的目标压缩信息;其中,所述目标数据库组合由各目标数据库的标识信息组成;所述第一映射关系表用于指示数据库组合与压缩信息的对应关系;

25、根据所述初始信息和所述目标压缩信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息。

26、在一种可能的实施方式中,所述方法还包括:

27、若在第一映射关系表中不存在目标数据库组合对应的压缩信息,则将至少一个目标数据库进行整体数据压缩,得到所述至少一个目标数据库对应的压缩信息;

28、根据所述初始信息和所述至少一个目标数据库对应的压缩信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息。

29、在一种可能的实施方式中,对所述数据库进行信息压缩,得到所述数据库对应的压缩信息,包括:

30、将所述数据库的信息输入第二文本处理模型中,得到所述数据库对应的多个记忆令牌;

31、相应的,根据所述初始信息和所述压缩信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息,包括:

32、确定所述初始信息对应的多个第一原始令牌;

33、将多个第一原始令牌和多个记忆令牌,输入第一文本处理模型,得到所述初始信息对应的至少一个精准查询信息。

34、在一种可能的实施方式中,将多个第一原始令牌和多个记忆令牌,输入第一文本处理模型,得到所述初始信息对应的至少一个精准查询信息,包括:

35、将所述多个记忆令牌位于所述多个第一原始令牌之后,得到令牌输入序列;

36、将所述令牌输入序列,输入第一文本处理模型,得到所述初始信息对应的至少一个精准查询信息。

37、在一种可能的实施方式中,根据所述初始信息和所述至少一个目标数据库的信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息,包括:

38、在所述初始信息不是精准查询时,根据所述初始信息和所述至少一个目标数据库的信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息;

39、所述方法还包括:

40、在所述初始信息为精准查询时;

41、根据所述初始信息对所述至少一个目标数据库进行检索,得到所述精准查询信息对应的查询结果;

42、根据所述初始信息和所述精准查询信息对应的查询结果,确定所述初始信息对应的查询结果。

43、在一种可能的实施方式中,所述方法还包括:

44、在所述初始信息不是数据查询任务时,根据初始信息和所述至少一个目标数据库的信息,基于第三文本处理模型确定所述初始信息对应的摘要。

45、在一种可能的实施方式中,根据初始信息和所述至少一个目标数据库的信本文档来自技高网...

【技术保护点】

1.一种信息处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述至少一个精准查询信息,确定所述初始信息对应的查询结果,包括:

3.根据权利要求1所述的方法,其特征在于,根据所述初始信息和所述至少一个目标数据库的信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求4所述的方法,其特征在于,对所述数据库进行信息压缩,得到所述数据库对应的压缩信息,包括:

8.根据权利要求7所述的方法,其特征在于,将多个第一原始令牌和多个记忆令牌,输入第一文本处理模型,得到所述初始信息对应的至少一个精准查询信息,包括:

9.根据权利要求1所述的方法,其特征在于,根据所述初始信息和所述至少一个目标数据库的信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息,包括:

10.根据权利要求1所述的方法,其特征在于,所述方法还包括:

11.根据权利要求10所述的方法,其特征在于,根据初始信息和所述至少一个目标数据库的信息,基于第三文本处理模型确定所述初始信息对应的摘要,包括:

12.一种信息处理装置,其特征在于,包括:

13.一种电子设备,其特征在于,包括:存储器,处理器;

14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-11任一项所述的方法。

15.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-11任一项所述的方法。

...

【技术特征摘要】

1.一种信息处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述至少一个精准查询信息,确定所述初始信息对应的查询结果,包括:

3.根据权利要求1所述的方法,其特征在于,根据所述初始信息和所述至少一个目标数据库的信息,基于第一文本处理模型确定所述初始信息对应的至少一个精准查询信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求4所述的方法,其特征在于,对所述数据库进行信息压缩,得到所述数据库对应的压缩信息,包括:

8.根据权利要求7所述的方法,其特征在于,将多个第一原始令牌和多个记忆令牌,输入第一文本处理模型,得到所述初始信息对应的至少一个精准查询信息,包括:

【专利技术属性】
技术研发人员:艾博轩
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1