答案生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：42669381 阅读：5 留言：0更新日期：2024-09-10 12:24

本发明专利技术涉及计算机技术领域，公开了一种答案生成方法、装置、计算机设备及存储介质。该方法包括：根据大语言模型的原始问题确定初始答案文本；初始答案文本中包括原始问题和初始答案；初始答案为原始问题对应的答案；生成指示将原始问题拆分为子问题集合的提示词；将原始问题和提示词输入到大语言模型；大语言模型被配置为将原始问题拆分为子问题集合；确定子问题集合中子问题对应的答案，根据子问题集合中的子问题、子问题对应的答案、初始答案文本，生成目标答案；目标答案为满足预设指标的答案。本发明专利技术的技术方案在大语言模型的训练数据的丰富度较低、数据量较少的情况下，也可以得到完整性和准确度较高的答案文本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机，具体涉及答案生成方法、装置、计算机设备及存储介质。

技术介绍

1、在计算机
中，大语言模型经过深度训练后，在自然语言理解和推理方面取得了显著突破，应用十分广泛。

2、尽管大语言模型取得了重要进展，但是在大语言模型的训练过程中，可能会由于过于强调正确性，在实际训练过程中，不能充分考虑到训练数据的丰富度，训练过程中往往缺少支撑多轮推理的训练数据，导致最终生成的答案文本完整性较低，准确度较低。

3、因此，如何提高答案文本的完整性和准确性成为本领域技术人员亟需解决的技术问题。

技术实现思路

1、有鉴于此，本专利技术提供了一种答案生成方法、装置、计算机设备及存储介质，以解决相关技术中生成的答案文本完整性较低，准确度较低的问题。

2、第一方面，本专利技术提供了一种答案生成方法，包括：

3、根据大语言模型的原始问题确定初始答案文本；所述初始答案文本中包括原始问题和初始答案；所述初始答案为所述原始问题对应的答案；

4、生成指示将所述原始问题拆分为子问题集合的提示词；

5、将所述原始问题和所述提示词输入到大语言模型；所述大语言模型被配置为将所述原始问题拆分为子问题集合；

6、确定所述子问题集合中子问题对应的答案，根据所述子问题集合中的子问题、所述子问题对应的答案、所述初始答案文本，生成目标答案；所述目标答案为满足预设指标的答案。

7、在一种可选的实施方式中，所述确定所述子问题集

8、重复执行以下生成操作，直至生成所述目标答案：

9、从本次生成操作针对的子问题集合中选择一个子问题，确定该子问题对应的答案；其中，首次生成操作针对的子问题集合为通过所述大语言模型对原始问题进行拆分得到的子问题集合；

10、将该子问题从本次生成操作针对的子问题集合中移除，得到本次生成操作针对的目标子问题集合；

11、将该子问题确定为追加问题，将该子问题对应的答案确定为追加答案；

12、根据所述追加问题、所述追加答案、所述原始问题、所述初始答案或上一次生成操作针对的当前答案，生成本次生成操作针对的新的问题；

13、根据本次生成操作针对的新的问题，确定本次生成操作针对的当前答案；

14、在本次生成操作为第次数阈值次生成操作时，将本次生成操作针对的当前答案确定为目标答案；

15、在本次生成操作针对的当前答案满足预设指标时，将本次生成操作针对的当前答案确定为目标答案；

16、在本次生成操作针对的当前答案不满足预设指标且本次生成操未作为第次数阈值次生成操作时，根据本次生成操作针对的当前答案确定新的子问题；

17、将新的子问题添加到本次生成操作针对的目标子问题集合中，生成下次生成操作针对的子问题集合。

18、在一种可选的实施方式中，所述在本次生成操作针对的当前答案满足预设指标时，将本次生成操作针对的当前答案确定为目标答案，包括：

19、在根据本次生成操作针对的当前答案的准确度、完整度、详细度确定的指标值满足预设指标时，将本次生成操作针对的当前答案确定为目标答案。

20、在一种可选的实施方式中，根据本次生成操作针对的新的问题，确定本次生成操作针对的当前答案，包括：

21、将本次生成操作针对的新的问题输入到大语言模型中，得到本次生成操作针对的当前答案。

22、在一种可选的实施方式中，所述根据本次生成操作针对的当前答案确定新的子问题，包括：

23、根据本次生成操作针对的当前答案生成大语言模型的新的问题；

24、根据大语言模型的新的问题确定参考答案；

25、将所述参考答案中的问题确定为新的子问题。

26、在一种可选的实施方式中，所述根据本次生成操作针对的当前答案生成大语言模型的新的问题，包括：

27、将本次生成操作针对的当前答案添加到大语言模型的原始问题的前面或后面，生成大语言模型的新的问题。

28、第二方面，本专利技术提供了一种答案生成装置，包括：

29、第一处理模块，用于根据大语言模型的原始问题确定初始答案文本；所述初始答案文本中包括原始问题和初始答案；所述初始答案为所述原始问题对应的答案；

30、第二处理模块，用于生成指示将所述原始问题拆分为子问题集合的提示词；

31、第三处理模块，用于将所述原始问题和所述提示词输入到大语言模型；所述大语言模型被配置为将所述原始问题拆分为子问题集合；

32、第四处理模块，用于确定所述子问题集合中子问题对应的答案，根据所述子问题集合中的子问题、所述子问题对应的答案、所述初始答案文本，生成目标答案；所述目标答案为满足预设指标的答案。

33、第三方面，本专利技术提供了一种计算机设备，包括：存储器和处理器，存储器和处理器之间互相通信连接，存储器中存储有计算机指令，处理器通过执行计算机指令，从而执行上述第一方面或其对应的任一实施方式的答案生成方法。

34、第四方面，本专利技术提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机指令，计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的答案生成方法。

35、第五方面，本专利技术提供了一种计算机程序产品，包括计算机指令，计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的答案生成方法。

36、本专利技术提供的技术方案，具有如下技术效果：

37、本专利技术实施例通过大语言模型的原始问题确定了初始答案文本，考虑到大语言模型在训练过程中的不足，得到的初始答案文本内容完整性较低，准确度较低。基于上述考虑，本专利技术在得到初始答案文本之后，设计了如下方法实现复杂事件推理。通过生成指示将原始问题拆分为子问题集合提示词，可以在大语言模型中对原始问题进行拆分，得到子问题集合，确定了子问题集合中子问题对应的答案。可以根据子问题集合中的子问题、子问题对应的答案、初始答案文本，生成目标答案，来丰富答案的内容。从而在大语言模型的训练数据的丰富度较低、数据量较少的情况下，也可以得到完整性和准确度较高的答案。

本文档来自技高网...

【技术保护点】

1.一种答案生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述确定所述子问题集合中子问题对应的答案，根据所述子问题集合中的子问题、所述子问题对应的答案、所述初始答案文本，生成目标答案，包括：

3.根据权利要求2所述的方法，其特征在于，所述在本次生成操作针对的当前答案满足预设指标时，将本次生成操作针对的当前答案确定为目标答案，包括：

4.根据权利要求2所述的方法，其特征在于，根据本次生成操作针对的新的问题，确定本次生成操作针对的当前答案，包括：

5.根据权利要求2所述的方法，其特征在于，所述根据本次生成操作针对的当前答案确定新的子问题，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据本次生成操作针对的当前答案生成大语言模型的新的问题，包括：

7.一种答案生成装置，其特征在于，包括：

8.一种计算机设备，其特征在于，包括：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机指令，所述计算机指令用于使计算机执行权利要求1至6中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种答案生成方法，其特征在于，包括：

4.根据权利要求2所述的方法，其特征在于，根据本次生成操作针对的新的问题，确定本次生成操作针对的当前答案，包括...

【专利技术属性】
技术研发人员：张忠辉，付祥政，肖子恒，谭罗达，何雨玲，岳冠宇，
申请(专利权)人：湖南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人