System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,具体涉及一种上下文答案生成方法、装置、计算机设备及存储介质。
技术介绍
1、检索增强生成(retrieval-augmented generation,rag)模型结合了语言生成模型和信息检索技术。当rag模型需要生成文本或者回答问题时,会先从一个庞大的文档集合中检索出相关的信息,然后利用这些检索到的信息来指导上下文答案的生成,从而提高预测的质量和准确性。然而,如果rag模型在检索阶段的检索结果不准确将会导致后续生成阶段生成的上下文答案也不准确,当前检索阶段一般是采用单一的检索方式,根据检索需求在文档集合中进行语义检索,得到检索结果,并不能有效的提高检索结果的准确性,容易包括误导性信息。
2、因此,相关技术存在检索局限性较大,检索结果中容易包括误导性信息,影响生成上下文答案准确性的问题。
技术实现思路
1、有鉴于此,本专利技术提供了一种上下文答案生成方法、装置、计算机设备及存储介质,以解决检索局限性较大,检索结果中容易包括误导性信息,影响生成上下文答案准确性的问题。
2、第一方面,本专利技术提供了一种上下文答案生成方法,包括:
3、根据待回复问题和检索式模型,得到检索结果,其中,检索式模型用于在语料库中获取待回复问题对应的第一文本信息并生成包含第一文本信息的检索结果;
4、根据待回复问题和生成式模型,得到生成结果,其中,生成式模型用于生成待回复问题对应的第二文本信息并生成包含第二文本信息的生成结果;
6、将目标结果输入预设生成器,生成待回复问题对应的上下文答案,其中,预设生成器用于根据目标结果构建并生成上下文答案。
7、本实施例提供的上下文答案生成方法,在检索阶段设计有检索式模型和生成式模型,根据检索式模型得到获取待回复问题对应的检索结果,根据生成式模型生成待回复问题对应的生成结果,根据预设评估指标对检索结果和生成结果进行评估,而方便得到最优的目标结果,极大的提高了检索阶段结果的准确性。利用预设生成器根据目标结果生成上下文答案,生成的上下文信息具有较高的检索准确性,而生成的结果也更为稳定与准确。解决了检索局限性较大,检索结果中容易包括误导性信息,影响生成上下文答案准确性的问题。
8、在一些可选的实施方式中,根据待回复问题和检索式模型,得到检索结果,包括:
9、将待回复问题输入检索式模型,得到检索结果;
10、检索式模型用于对待回复问题进行特征提取操作,得到问题特征,将问题特征与语料库中的问答文本进行匹配,得到包含第一预设数量个问答文本的中间文本信息,根据预设指标,从中间文本信息的第一预设数量个问答文本中确定第二预设数量个目标问答文本,将目标问答文本作为第一文本信息,生成包含第一文本信息的检索结果,其中,第二预设数量小于或等于第一预设数量。
11、在本实施方式中,将待回复问题输入检索式模型,利用检索式模型从语料库中确定待回复问题对应的目标问答文本,得到检索结果,预设生成器根据该检索结果生成上下文答案可以提高上下文答案的质量和准确性。
12、在一些可选的实施方式中,根据预设评估指标,生成检索结果的第一评估分数和生成结果的第二评估分数,包括:
13、确定检索结果的第一文本信息中与待回复问题相关的相关文本信息,并确定相关文本信息的第一数量;
14、获取语料库中与待回复问题相关的相关问答文本,并确定相关问答文本的第二数量;
15、利用第一数量除以第二数量,得到检索结果的准确率;
16、利用第一数量除以第二预设数量,得到检索结果的召回率;
17、根据准确率、召回率以及预设公式,得到检索结果对应的调和平均值,并根据调和平均值得到第一评估分数;
18、预设公式满足:
19、
20、其中,f为调和平均值,α为预设参数,p为准确率,r为召回率;
21、确定生成结果的第二文本信息的困惑度和熵,并确定第二文本信息的平均回复长度;
22、确定生成结果的第二文本信息中单词总数、一元词的第三数量以及二元词的第四数量;
23、利用第三数量除以单词总数,得到一元词的第一比例,利用第四数量除以单词总数,得到二元词的第二比例,根据第一比例和第二比例得到生成结果的回复多样性指标;
24、根据困惑度、熵、回复多样性指标、平均回复长度以及预设权重,得到第二评估分数。
25、在本实施方式中,利用评估模型根据预设评估指标对检索结果和生成结果进行评估,得到检索结果的第一评估分数和生成结果的第二评估分数。通过评估分数方便得到最优的目标结果,极大的提高了检索阶段结果的准确性。
26、在一些可选的实施方式中,根据预设评估指标,生成检索结果的第一评估分数和生成结果的第二评估分数,包括:
27、将检索结果输入评估模型,得到第一评估分数,其中,评估模型用于根据预设评估指标确定检索结果为目标结果的概率,评估模型是根据第一训练样本对初始评估模型进行训练后得到的,初始评估模型是根据预设评估指标构建的;
28、将生成结果输入评估模型,得到第二评估分数,其中,评估模型用于根据预设评估指标确定生成结果为目标结果的概率。
29、在本实施方式中,利用预设评估指标构建评估模型,利用评估模型根据预设评估指标对检索结果和生成结果进行评估,输出对应的评估分数。通过评估分数方便得到最优的目标结果,极大的提高了检索阶段结果的准确性。
30、在一些可选的实施方式中,在根据待回复问题和生成式模型,得到生成结果之前,方法还包括:
31、根据预设算法构建初始模型;
32、获取第二训练样本,根据第二训练样本对初始模型进行训练,得到生成式模型。
33、在本实施方式中,根据预设算法构建初始模型;并根据第二训练样本对初始模型进行训练,得到生成式模型。通过生成式模型自行生成与待回复问题相匹配的生成结果,通过生成结果可以弥补检索结果可能存在的信息缺失或表达生硬的问题。
34、在一些可选的实施方式中,根据待回复问题和生成式模型,得到生成结果,包括:
35、将待回复问题输入生成式模型,得到生成结果;
36、生成式模型包括编码器和解码器,生成式模型的编码器用于确定待回复问题的语义特征,生成式模型的解码器用于根据语义特征生成第二文本信息并生成包含第二文本信息的生成结果。
37、在一些可选的实施方式中,方法还包括:
38、获取新增评估指标,其中,新增评估指标包括:检索结果中前第三预设数量个第一文本信息的准确率和/或检索结果的平均准确率,第三预设数量本文档来自技高网...
【技术保护点】
1.一种上下文答案生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据待回复问题和检索式模型,得到检索结果,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述预设评估指标,生成所述检索结果的第一评估分数,包括:
4.根据权利要求1所述的方法,其特征在于,根据所述预设评估指标,生成所述生成结果的第二评估分数,包括:
5.根据权利要求1所述的方法,其特征在于,所述根据预设评估指标,生成所述检索结果的第一评估分数和所述生成结果的第二评估分数,包括:
6.根据权利要求1所述的方法,其特征在于,所述根据所述待回复问题和生成式模型,得到生成结果,包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种上下文答案生成装置,其特征在于,所述装置包括:
9.一种计算机设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至7中任一项所
...【技术特征摘要】
1.一种上下文答案生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据待回复问题和检索式模型,得到检索结果,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述预设评估指标,生成所述检索结果的第一评估分数,包括:
4.根据权利要求1所述的方法,其特征在于,根据所述预设评估指标,生成所述生成结果的第二评估分数,包括:
5.根据权利要求1所述的方法,其特征在于,所述根据预设评估指标,生成所述检索结果的第一评估分数和所述生...
【专利技术属性】
技术研发人员:陈红琳,
申请(专利权)人:苏州元脑智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。