System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,特别是涉及一种用于rag的优化识别方法、系统、设备及介质。
技术介绍
1、rag系统,是一种检索增强生成系统,其结合信息检索和生成技术,旨在提高生成式ai系统的性能;该技术通过从数据源检索相关信息,并将其注入到大型语言模型的提示中,以增强生成过程的事实性和合理性;在目前的rag技术中,存在一些重要缺点,特别是在处理文本块时,具体如下:
2、(一)数字描述错误:
3、目前rag技术在处理文本块中数字描述时存在一定缺陷,包括:大型语言模型可能会误解文本块中数字的含义,导致生成答案中包含不准确的数字信息;在一些需要精准数字描述的应用场景(特别是在商品以及科学数据等领域)中,此状况可能引起严重问题。
4、(二)内容理解错误:
5、目前rag技术的大型语言模型在处理文本块时,可能对其中内容产生误解;这种误解可能导致rag系统在检索相关文档块时出现错误,影响系统准确性和可靠性;特别是对于一些精确性和可信度要求较高的应用场景中,rag技术无法实现较佳的效果;因此,上述状况是rag技术的显著技术瓶颈。
6、(三)纠错问题:
7、在实际使用中,使用场景、人类口语、问题类别以及商品信息复杂多样,小概率会出现回答不准的问题;因此,纠正大模型出现的错误是相对困难的。
技术实现思路
1、本专利技术的目的在于,提供一种用于rag的优化识别方法、系统、设备及介质,进而解决现有技术中存在的上述所有问题或问题之一。
>2、为解决上述技术问题,本专利技术的具体技术方案如下:
3、一方面,本专利技术提供一种用于rag的优化识别方法,包括以下步骤:
4、文件导入步骤:
5、响应于商品推荐需求,将商品文件导入mysql数据库;
6、sql语句生成步骤:
7、基于elasticsearch和动态prompt技术,生成索引sql语句;
8、结果反馈步骤:
9、根据所述索引sql语句,在所述mysql数据库中筛选目标商品信息,将筛选的所述目标商品信息反馈至需求侧。
10、作为一种改进的方案,所述将商品文件导入mysql数据库,包括:
11、将所述商品文件切分为文本块;
12、将切分后的所述文本块存入所述mysql数据库中。
13、作为一种改进的方案,所述基于elasticsearch和动态prompt技术,生成索引sql语句,包括:
14、基于elasticsearch和动态prompt技术创建动态示例;
15、调用大模型基于所述动态示例生成所述索引sql语句。
16、作为一种改进的方案,所述基于elasticsearch和动态prompt技术创建动态示例,包括:
17、将与所述商品推荐需求对应的用户问题输入至elasticsearch数据库中;
18、在elasticsearch数据库中基于相似度策略检索问题与答案组合;
19、根据所述问题与答案组合引导生成sql语句的prompt,得到prompt例子;
20、将所述prompt例子作为所述动态示例。
21、作为一种改进的方案,所述调用大模型基于所述动态示例生成所述索引sql语句,包括:
22、基于大模型生成与所述prompt例子对应的正确sql语句;
23、将所述正确sql语句作为所述索引sql语句。
24、作为一种改进的方案,所述根据所述索引sql语句,在所述mysql数据库中筛选目标商品信息,包括:
25、将所述索引sql语句作为索引,在所述mysql数据库中查询对应的所述目标商品信息。
26、作为一种改进的方案,所述将筛选的所述目标商品信息反馈至需求侧,包括:
27、将所述目标商品信息放入大模型口语化描述模块;
28、通过所述大模型口语化描述模块响应所述需求侧的用户问题。
29、另一方面,本专利技术还提供一种用于rag的优化识别系统,包括:
30、文件导入模块,用于响应于商品推荐需求,将商品文件导入mysql数据库;
31、sql语句生成模块,用于基于elasticsearch和动态prompt技术,生成索引sql语句;
32、结果反馈模块,用于根据所述索引sql语句,在所述mysql数据库中筛选目标商品信息,将筛选的所述目标商品信息反馈至需求侧。
33、另一方面,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述用于rag的优化识别方法的步骤。
34、另一方面,本专利技术还提供一种计算机设备,所述计算机设备包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;其中:
35、所述存储器,用于存放计算机程序;
36、所述处理器,用于通过运行所述存储器上所存放的程序来执行所述用于rag的优化识别方法的步骤。
37、本专利技术技术方案的有益效果是:
38、本专利技术所述的用于rag的优化识别方法,可以实现结合in-context-learning和动态prompt技术,令rag系统的大模型根据上下文示例更好的理解用户问题,提升大模型处理问题的精准性和适应性,能够动态且灵活适应场景和需求变化,提升rag系统性能,提升用户体验,弥补现有技术的缺陷,具有较高的应用价值。
39、本专利技术所述的用于rag的优化识别系统,可以通过文件导入模块、sql语句生成模块以及结果反馈模块的相互配合,进而实现结合in-context-learning和动态prompt技术,令rag系统的大模型根据上下文示例更好的理解用户问题,提升大模型处理问题的精准性和适应性,能够动态且灵活适应场景和需求变化,提升rag系统性能,提升用户体验,弥补现有技术的缺陷,具有较高的应用价值。
40、本专利技术所述的计算机可读存储介质,可以实现引导文件导入模块、sql语句生成模块以及结果反馈模块进行配合,进而实现本专利技术所述的用于rag的优化识别方法,且本专利技术所述的计算机可读存储介质还有效提高所述用于rag的优化识别方法的可操作性。
41、本专利技术所述的计算机设备,可以实现存储并执行所述计算机可读存储介质,进而实现本专利技术所述的用于rag的优化识别方法。
本文档来自技高网...【技术保护点】
1.一种用于RAG的优化识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的用于RAG的优化识别方法,其特征在于:
3.根据权利要求1所述的用于RAG的优化识别方法,其特征在于:
4.根据权利要求3所述的用于RAG的优化识别方法,其特征在于:
5.根据权利要求4所述的用于RAG的优化识别方法,其特征在于:
6.根据权利要求1所述的用于RAG的优化识别方法,其特征在于:
7.根据权利要求1所述的用于RAG的优化识别方法,其特征在于:
8.一种用于RAG的优化识别系统,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1~7中任一项所述用于RAG的优化识别方法的步骤。
10.一种计算机设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;其中:
【技术特征摘要】
1.一种用于rag的优化识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的用于rag的优化识别方法,其特征在于:
3.根据权利要求1所述的用于rag的优化识别方法,其特征在于:
4.根据权利要求3所述的用于rag的优化识别方法,其特征在于:
5.根据权利要求4所述的用于rag的优化识别方法,其特征在于:
6.根据权利要求1所述的用于rag的优化识别方法,其特征在于:
7.根据权利要求...
【专利技术属性】
技术研发人员:张峻铭,冯落落,李志芸,尹青山,房兰涛,
申请(专利权)人:浪潮金融信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。