System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于RAG的优化识别方法、系统、设备及介质技术方案_技高网

一种用于RAG的优化识别方法、系统、设备及介质技术方案

技术编号:42036105 阅读:12 留言:0更新日期:2024-07-16 23:22
本发明专利技术公开了一种用于RAG的优化识别方法、系统、设备及介质,所述方法包括以下步骤:响应于商品推荐需求,将商品文件导入MySQL数据库;基于Elasticsearch和动态prompt技术,生成索引sql语句;根据索引sql语句,在MySQL数据库中筛选目标商品信息,将筛选的目标商品信息反馈至需求侧;本发明专利技术能够结合in‑context‑learning和动态prompt技术,令RAG系统的大模型根据上下文示例更好的理解用户问题,提升大模型处理问题的精准性和适应性,能够动态且灵活适应场景和需求变化,提升RAG系统性能,提升用户体验,弥补现有技术的缺陷,具有较高的应用价值。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别是涉及一种用于rag的优化识别方法、系统、设备及介质。


技术介绍

1、rag系统,是一种检索增强生成系统,其结合信息检索和生成技术,旨在提高生成式ai系统的性能;该技术通过从数据源检索相关信息,并将其注入到大型语言模型的提示中,以增强生成过程的事实性和合理性;在目前的rag技术中,存在一些重要缺点,特别是在处理文本块时,具体如下:

2、(一)数字描述错误:

3、目前rag技术在处理文本块中数字描述时存在一定缺陷,包括:大型语言模型可能会误解文本块中数字的含义,导致生成答案中包含不准确的数字信息;在一些需要精准数字描述的应用场景(特别是在商品以及科学数据等领域)中,此状况可能引起严重问题。

4、(二)内容理解错误:

5、目前rag技术的大型语言模型在处理文本块时,可能对其中内容产生误解;这种误解可能导致rag系统在检索相关文档块时出现错误,影响系统准确性和可靠性;特别是对于一些精确性和可信度要求较高的应用场景中,rag技术无法实现较佳的效果;因此,上述状况是rag技术的显著技术瓶颈。

6、(三)纠错问题:

7、在实际使用中,使用场景、人类口语、问题类别以及商品信息复杂多样,小概率会出现回答不准的问题;因此,纠正大模型出现的错误是相对困难的。


技术实现思路

1、本专利技术的目的在于,提供一种用于rag的优化识别方法、系统、设备及介质,进而解决现有技术中存在的上述所有问题或问题之一。>

2、为解决上述技术问题,本专利技术的具体技术方案如下:

3、一方面,本专利技术提供一种用于rag的优化识别方法,包括以下步骤:

4、文件导入步骤:

5、响应于商品推荐需求,将商品文件导入mysql数据库;

6、sql语句生成步骤:

7、基于elasticsearch和动态prompt技术,生成索引sql语句;

8、结果反馈步骤:

9、根据所述索引sql语句,在所述mysql数据库中筛选目标商品信息,将筛选的所述目标商品信息反馈至需求侧。

10、作为一种改进的方案,所述将商品文件导入mysql数据库,包括:

11、将所述商品文件切分为文本块;

12、将切分后的所述文本块存入所述mysql数据库中。

13、作为一种改进的方案,所述基于elasticsearch和动态prompt技术,生成索引sql语句,包括:

14、基于elasticsearch和动态prompt技术创建动态示例;

15、调用大模型基于所述动态示例生成所述索引sql语句。

16、作为一种改进的方案,所述基于elasticsearch和动态prompt技术创建动态示例,包括:

17、将与所述商品推荐需求对应的用户问题输入至elasticsearch数据库中;

18、在elasticsearch数据库中基于相似度策略检索问题与答案组合;

19、根据所述问题与答案组合引导生成sql语句的prompt,得到prompt例子;

20、将所述prompt例子作为所述动态示例。

21、作为一种改进的方案,所述调用大模型基于所述动态示例生成所述索引sql语句,包括:

22、基于大模型生成与所述prompt例子对应的正确sql语句;

23、将所述正确sql语句作为所述索引sql语句。

24、作为一种改进的方案,所述根据所述索引sql语句,在所述mysql数据库中筛选目标商品信息,包括:

25、将所述索引sql语句作为索引,在所述mysql数据库中查询对应的所述目标商品信息。

26、作为一种改进的方案,所述将筛选的所述目标商品信息反馈至需求侧,包括:

27、将所述目标商品信息放入大模型口语化描述模块;

28、通过所述大模型口语化描述模块响应所述需求侧的用户问题。

29、另一方面,本专利技术还提供一种用于rag的优化识别系统,包括:

30、文件导入模块,用于响应于商品推荐需求,将商品文件导入mysql数据库;

31、sql语句生成模块,用于基于elasticsearch和动态prompt技术,生成索引sql语句;

32、结果反馈模块,用于根据所述索引sql语句,在所述mysql数据库中筛选目标商品信息,将筛选的所述目标商品信息反馈至需求侧。

33、另一方面,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述用于rag的优化识别方法的步骤。

34、另一方面,本专利技术还提供一种计算机设备,所述计算机设备包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;其中:

35、所述存储器,用于存放计算机程序;

36、所述处理器,用于通过运行所述存储器上所存放的程序来执行所述用于rag的优化识别方法的步骤。

37、本专利技术技术方案的有益效果是:

38、本专利技术所述的用于rag的优化识别方法,可以实现结合in-context-learning和动态prompt技术,令rag系统的大模型根据上下文示例更好的理解用户问题,提升大模型处理问题的精准性和适应性,能够动态且灵活适应场景和需求变化,提升rag系统性能,提升用户体验,弥补现有技术的缺陷,具有较高的应用价值。

39、本专利技术所述的用于rag的优化识别系统,可以通过文件导入模块、sql语句生成模块以及结果反馈模块的相互配合,进而实现结合in-context-learning和动态prompt技术,令rag系统的大模型根据上下文示例更好的理解用户问题,提升大模型处理问题的精准性和适应性,能够动态且灵活适应场景和需求变化,提升rag系统性能,提升用户体验,弥补现有技术的缺陷,具有较高的应用价值。

40、本专利技术所述的计算机可读存储介质,可以实现引导文件导入模块、sql语句生成模块以及结果反馈模块进行配合,进而实现本专利技术所述的用于rag的优化识别方法,且本专利技术所述的计算机可读存储介质还有效提高所述用于rag的优化识别方法的可操作性。

41、本专利技术所述的计算机设备,可以实现存储并执行所述计算机可读存储介质,进而实现本专利技术所述的用于rag的优化识别方法。

本文档来自技高网...

【技术保护点】

1.一种用于RAG的优化识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的用于RAG的优化识别方法,其特征在于:

3.根据权利要求1所述的用于RAG的优化识别方法,其特征在于:

4.根据权利要求3所述的用于RAG的优化识别方法,其特征在于:

5.根据权利要求4所述的用于RAG的优化识别方法,其特征在于:

6.根据权利要求1所述的用于RAG的优化识别方法,其特征在于:

7.根据权利要求1所述的用于RAG的优化识别方法,其特征在于:

8.一种用于RAG的优化识别系统,其特征在于,包括:

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1~7中任一项所述用于RAG的优化识别方法的步骤。

10.一种计算机设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;其中:

【技术特征摘要】

1.一种用于rag的优化识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的用于rag的优化识别方法,其特征在于:

3.根据权利要求1所述的用于rag的优化识别方法,其特征在于:

4.根据权利要求3所述的用于rag的优化识别方法,其特征在于:

5.根据权利要求4所述的用于rag的优化识别方法,其特征在于:

6.根据权利要求1所述的用于rag的优化识别方法,其特征在于:

7.根据权利要求...

【专利技术属性】
技术研发人员:张峻铭冯落落李志芸尹青山房兰涛
申请(专利权)人:浪潮金融信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1