System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及人工智能,特别是涉及一种多轮问答方法、装置、电子设备和计算机可读存储介质。
技术介绍
1、检索增强生成(retrieval augmented generation,rag)是一种结合搜索技术和大语言模型(large language model,llm)的内容生成技术,其将从数据源检索到的信息作为llm生成答案的依据,从而增强了生成内容的准确性和相关性。
2、相关技术中的rag系统包括向量库、检索模块、排序模块和llm模块。其中,检索模块利用文本到向量(text to vector)技术的语义嵌入向量模型对输入信息进行编码得到查询向量,并与向量库中的文本向量进行比对,以获取相似度接近的向量索引,进而检索相关知识文本。然而,rag系统中的检索模块所用的语义嵌入向量模型的参数量较小,通常不具备多轮复杂语义映射能力,因此,通常针对单轮次对话内容进行处理,而在多轮场景下由于上下文省略导致难以检索到所需文本。
技术实现思路
1、本公开实施例提供了一种多轮问答方法、装置、电子设备和计算机可读存储介质,它可以提高多轮复杂语义的映射能力,从而提高检索的准确性。
2、根据本公开的一方面,提供了一种多轮问答方法,所述方法包括:
3、将当前轮的输入信息分别与多个历史轮的输入信息进行相关性匹配以得到当前轮与历史轮之间的多个相关性检索分数矩阵;
4、将当前轮的输入信息与多个历史轮的输入信息拼接后得到当前轮的查询信息;
5、根据所述查询信
6、对当前轮的检索分数矩阵和多个相关性检索分数矩阵进行加权处理以得到当前轮的目标检索分数矩阵;
7、根据所述目标检索分数矩阵对数据库中的多个文本进行排序以得到检索结果,并将所述检索结果作为答案生成阶段的知识提示。
8、可选地,获取当前轮的检索分数矩阵包括:对当前轮的查询信息进行编码得到当前轮的查询向量;获取当前轮的查询向量与多个文本对应的文本向量之间的相似度以得到每个文本向量对应的当前轮的检索分数;将数据库中每个文本向量对应的当前轮的检索分数形成检索分数矩阵。
9、可选地,对当前轮的检索分数矩阵和多个相关性检索分数矩阵进行加权处理得到当前轮的目标检索分数矩阵包括:
10、将数据库中每个文本对应的当前轮的检索分数和多个相关性检索分数相加得到第一检索分数;
11、将数据库中每个文本对应的多个相关性检索分数与1相加得到第二检索分数;
12、将第一检索分数和第二检索分数相除以得到数据库中每个文本对应的当前轮的目标检索分数;
13、将数据库中每个文本对应的当前轮的目标检索分数形成当前轮的目标检索分数矩阵。
14、可选地,获取当前轮的输入信息与多个历史轮的输入信息对应的多个相关性检索分数矩阵包括:
15、获取当前轮的输入信息与多个历史轮的输入信息之间的多个语义相似度;
16、将多个历史轮的输入信息的检索分数矩阵与其对应的多个语义相似度相乘得到当前轮的输入信息与多个历史轮的输入信息的多个相关性检索分数矩阵。
17、可选地,所述多轮问答方法还包括:
18、当前轮为首轮时,将当前轮的输入信息作为当前轮的查询信息;
19、当前轮不为首轮时,将当前轮的输入信息与多个历史轮的输入信息拼接作为当前轮的查询信息。
20、可选地,根据所述目标检索分数矩阵对数据库中的多个文本进行排序以得到检索结果,并将检索结果作为答案生成阶段的知识提示包括:
21、根据多个文本对应的目标检索分数对多个文本进行排序得到排序靠前的第一数目个文本;
22、将第一数目个文本作为答案生成阶段的知识提示,第一数目为正整数,第一数目小于数据库中文本的数目。
23、可选地,所述多轮问答方法还包括:根据所述检索结果生成问答结果。
24、根据本公开的一方面,提供一种多轮问答装置,包括:
25、第一处理模块,用于将当前轮的输入信息分别与多个历史轮的输入信息进行相关性匹配以获取当前轮与历史轮之间的多个相关性检索分数矩阵;
26、第二处理模块,用于将当前轮的输入信息与多个历史轮的输入信息拼接后得到当前轮的查询信息;
27、检索模块,用于根据所述查询信息对数据库进行检索以得到当前轮的检索分数矩阵;
28、第三处理模块,用于对当前轮的检索分数矩阵和多个相关性检索分数矩阵进行加权处理以得到当前轮的目标检索分数矩阵;
29、排序模块,用于根据当前轮的目标检索分数矩阵对数据库中的多个文本进行排序,并作为答案生成阶段的知识提示以得到检索结果,并将检索结果作为答案生成阶段的知识提示;
30、生成模块,用于根据所述检索结果生成问答结果。
31、根据本公开的一方面,提出一种电子设备,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器运行时实现如上所述的多轮问答方法。
32、根据本公开的一方面,提出一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器运行,以实现如上所述的多轮问答方法。
33、本公开提出一种多轮问答方法、装置、电子设备和计算机可读存储介质,方法通过对当前轮的输入信息与多个历史轮的输入信息之间进行相似度匹配以得到多个相关性检索分数矩阵,并根据多个相关性检索分数矩阵对当前轮的检索分数矩阵进行加权处理以得到当前轮的目标检索分数矩阵,可以有效利用上下文信息,提高检索模块的语义理解和映射能力,提高rag系统在多轮对话场景下的检索效果和响应质量。
34、进一步地,利用多个相关性检索分数矩阵与当前轮的检索分数矩阵进行加权处理,可以动态调整不同历史输入信息的重要性。
35、进一步地,相关性匹配和加权处理的计算过程简单,可以采用轻量化的模块实现,对计算资源的需求较低,适用于算力有限或者实时性能较高的场景。
36、本公开的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
本文档来自技高网...【技术保护点】
1.一种多轮问答方法,其特征在于,包括:
2.根据权利1所述的多轮问答方法,其特征在于,获取当前轮的检索分数矩阵包括:
3.根据权利1所述的多轮问答方法,其特征在于,对当前轮的检索分数矩阵和多个相关性检索分数矩阵进行加权处理得到当前轮的目标检索分数矩阵包括:
4.根据权利1所述的多轮问答方法,其特征在于,获取当前轮的输入信息与多个历史轮的输入信息对应的多个相关性检索分数矩阵包括:
5.根据权利要求1所述的多轮问答方法,其特征在于,还包括:
6.根据权利要求1所述的多轮问答方法,其特征在于,根据所述目标检索分数矩阵对数据库中的多个文本进行排序以得到检索结果,并将检索结果作为答案生成阶段的知识提示包括:
7.根据权利要求1所述的多轮问答方法,其特征在于,还包括:
8.一种多轮问答装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器运行,以实现如权利要求1至7中任一项所述的多轮问答方法。
...【技术特征摘要】
1.一种多轮问答方法,其特征在于,包括:
2.根据权利1所述的多轮问答方法,其特征在于,获取当前轮的检索分数矩阵包括:
3.根据权利1所述的多轮问答方法,其特征在于,对当前轮的检索分数矩阵和多个相关性检索分数矩阵进行加权处理得到当前轮的目标检索分数矩阵包括:
4.根据权利1所述的多轮问答方法,其特征在于,获取当前轮的输入信息与多个历史轮的输入信息对应的多个相关性检索分数矩阵包括:
5.根据权利要求1所述的多轮问答方法,其特征在于,还包括:
6.根据权利要求1所述的多轮问答方法,其特征在于,根据所述目标检索分数矩阵对数据库中的多个文本进行排序以得到检索结果,并...
【专利技术属性】
技术研发人员:米良,
申请(专利权)人:苏州亿铸智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。