System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种答案生成方法、装置和设备制造方法及图纸_技高网

一种答案生成方法、装置和设备制造方法及图纸

技术编号:43201884 阅读:9 留言:0更新日期:2024-11-01 20:20
本申请提供一种答案生成方法、装置和设备。本申请提供的方法,包括:响应于用户输入的问题和问题相关的参考文本,在参考文本的长度大于大模型的输入窗口的第一长度时,对参考文本进行切分,得到参考文本对应的多个切分片段;每个切分片段的长度均小于检索模型的输入窗口的第二长度;针对每个切分片段,利用检索模型,计算每个切分片段相对于问题的相关性值;根据每个切分片段相对于问题的相关性值,从多个切分片段中选出多个目标切分片段;多个目标切分片段的总长度小于或者等于第一长度和问题的第三长度的差值;根据多个目标切分片段,利用所述大模型获取问题的答案。本申请提供的答案生成方法、装置和设备,可以精确的生成问题对应的答案。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种答案生成方法、装置和设备


技术介绍

1、近年来,基于大模型生成答案的技术迅速崛起,成为人工智能领域的重要趋势。大模型能够理解和生成自然语言文本,具有高度的语义理解和上下文处理能力,其可以在各类话题上提供准确、详细和连贯的回答。

2、为了准确的获取问题的答案,一般会向大模型提供问题相关的参考文本,当问题相关的参考文本超出大模型的输入窗口时,大模型会对参考文本进行截断处理,以适配器输入窗口的大小,这样,容易造成大模型理解上的偏差,使得输出的答案不准确。


技术实现思路

1、有鉴于此,本申请提供一种答案生成方法、装置和设备,用以在长文本问答中生成精确的答案。

2、具体地,本申请是通过如下技术方案实现的:

3、本申请第一方面提供一种答案方法,所述方法包括:

4、响应于用户输入的问题和所述问题相关的参考文本,在所述参考文本的长度大于大模型的输入窗口的第一长度时,对所述参考文本进行切分,得到所述参考文本对应的多个切分片段;其中,所述多个切分片段中的每个切分片段的长度均小于预先训练好的检索模型的输入窗口的第二长度;

5、针对所述每个切分片段,利用所述检索模型,计算所述每个切分片段相对于所述问题的相关性值;

6、根据所述每个切分片段相对于所述问题的相关性值,从所述多个切分片段中选出多个目标切分片段;其中,所述多个目标切分片段的总长度小于或者等于所述第一长度和所述问题的第三长度的差值;

>7、根据所述多个目标切分片段,利用所述大模型获取所述问题的答案。

8、本申请第二方面提供一种答案装置,所述装置包括切分模块、计算模块、选择模块和输出模块;其中,

9、所述切分模块,用于响应于用户输入的问题和所述问题相关的参考文本,在所述参考文本的长度大于大模型的输入窗口的第一长度时,对所述参考文本进行切分,得到所述参考文本对应的多个切分片段;其中,所述多个切分片段中的每个切分片段的长度均小于预先训练好的检索模型的输入窗口的第二长度;

10、所述计算模块,用于针对所述每个切分片段,利用所述检索模型,计算所述每个切分片段相对于所述问题的相关性值;

11、所述选择模块,用于根据所述每个切分片段相对于所述问题的相关性值,从所述多个切分片段中选出多个目标切分片段;其中,所述多个目标切分片段的总长度小于或者等于所述第一长度和所述问题的第三长度的差值;

12、所述输出模块,用于根据所述多个目标切分片段,利用所述大模型获取所述问题的答案。

13、本申请第三方面提供一种答案生成设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请第一方面提供的任一项所述方法的步骤。

14、本申请第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本申请第一方面提供的任一项所述方法的步骤。

15、本申请提供的答案生成方法、装置和设备,响应于用户输入的问题和问题相关的参考文本,通过对参考文本进行切分处理,得到参考文本对应的多个切分片段,进而利用检索模型计算每个切分片段相对于问题的相关性值,这样,可以根据每个切分片段相对于问题的相关性值从多个切分片段中选出适配大模型的输入窗口大小的多个目标切分片段,进而使得大模型根据多个目标切分片段来获取问题的答案,这样,通过筛选目标切分片段,不仅能够过滤掉无关信息,减少噪音干扰,还能够筛选出最相关的片段输入大模型,使得大模型基于与问题最相关的片段进行推理,可以提高答案的精确性。此外,通过筛选目标切分片段,可以减少不必要的计算,可以提升大模型的处理能力和处理性能。

本文档来自技高网...

【技术保护点】

1.一种答案生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述参考文本进行切分,得到所述参考文本对应的多个切分片段,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述每个切分片段相对于所述问题的相关性值,从所述多个切分片段中选出多个目标切分片段,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述每个切分片段相对于所述问题的相关性值,从所述多个切分片段中选出多个目标切分片段,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述多个目标切分片段,利用所述大模型获取所述问题的答案,包括:

6.根据权利要求5所述的方法,其特征在于,所述拼接所述多个目标切分片段和所述问题,得到拼接结果,包括:

7.根据权利要求2所述的方法,其特征在于,所述预先设定的多个标点符号包括句号、逗号、分号、感叹号、问号、空格和空字符。

8.一种答案生成装置,其特征在于,所述装置包括切分模块、计算模块、选择模块和输出模块;其中,

9.一种答案生成设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1-7任一项所述方法的步骤。

...

【技术特征摘要】

1.一种答案生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述参考文本进行切分,得到所述参考文本对应的多个切分片段,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述每个切分片段相对于所述问题的相关性值,从所述多个切分片段中选出多个目标切分片段,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述每个切分片段相对于所述问题的相关性值,从所述多个切分片段中选出多个目标切分片段,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述多个目标切分片段,利用所述大模型获取所述问题的答案,包括:

6.根据权利要求5所述的方...

【专利技术属性】
技术研发人员:王佳欣余晓填肖嵘罗忆
申请(专利权)人:深圳云天励飞技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1