对话方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号：44018146 阅读：10 留言：0更新日期：2025-01-15 01:03

本申请提供一种对话方法、装置、设备、存储介质及程序产品，该对话方法包括：从输入信息中识别出意图和槽位值；基于意图和槽位值，通过对话管理模型确定对话策略；其中，对话管理模型基于大语言模型构建得到，对话管理模型基于通用对话数据以及目标对话领域的样本对话数据训练得到，目标对话领域是指输入信息所属的对话领域；基于对话策略，生成输入信息的回复信息。本申请能够提升对话灵活性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及自然语言处理，特别涉及一种对话方法、装置、设备、存储介质及程序产品。

技术介绍

1、随着人工智能的快速发展，任务式对话系统在智能客服、智能助手等领域得到广泛应用。

2、目前，任务式对话系统中的对话管理模块，一般基于状态机、规则或浅层机器学习实现，大多依赖预定义的状态空间和策略集，缺乏灵活性和开放性，难以应对复杂多变的对话场景，因此，存在对话灵活性差的问题。

技术实现思路

1、本申请提供了一种对话方法、装置、设备、存储介质及程序产品，用以解决对话灵活性差的问题。

2、根据本申请实施例的第一方面，提供了一种对话方法，包括：

3、从输入信息中识别出意图和槽位值；

4、基于所述意图和所述槽位值，通过对话管理模型确定对话策略；其中，所述对话管理模型基于大语言模型构建得到，所述对话管理模型基于通用对话数据以及目标对话领域的样本对话数据训练得到，所述目标对话领域是指所述输入信息所属的对话领域；

5、基于所述对话策略，生成所述输入信息的回复信息。

6、可选地，所述通用对话数据包括多个对话领域的无标注的对话数据；所述目标对话领域的样本对话数据包括所述目标对话领域的有标注的对话数据；

7、所述对话管理模型的训练过程，包括：

8、基于所述通用对话数据，对所述对话管理模型进行预训练，得到预训练后的对话管理模型；

9、基于所述目标对话领域的样本对话数据，对所述预训练后的对话管理模型进行对话策

10、可选地，所述基于所述目标对话领域的样本对话数据，对所述预训练后的对话管理模型进行对话策略预测训练，得到训练后的对话管理模型，包括：

11、基于所述目标对话领域的样本对话数据，生成第一提示词；

12、将所述第一提示词输入至所述预训练后的对话管理模型中，得到训练后的对话管理模型，其中，所述第一提示词用于指示所述预训练后的对话管理模型基于所述目标对话领域的样本对话数据进行对话策略预测训练。

13、可选地，所述对话管理模型包括对话状态跟踪子模型和对话策略学习子模型；所述对话状态跟踪子模型包括大语言模型；所述对话策略学习子模型包括大语言模型；

14、所述基于所述意图和所述槽位值，通过对话管理模型确定对话策略，包括：

15、基于所述意图、所述槽位值和历史对话状态，通过所述对话状态跟踪子模型获得当前对话状态；

16、基于所述当前对话状态，通过所述对话策略学习子模型确定对话策略。

17、可选地，所述方法还包括：

18、在通过所述对话管理模型无法确定对话策略的情况下，基于所述意图和所述槽位值，从外部数据和/或所述输入信息的历史对话数据中检索，确定对话策略。

19、可选地，所述从输入信息中识别出意图和槽位值，包括：

20、基于所述输入信息，通过自然语言理解模型获得意图和槽位值；其中，所述自然语言理解模型包括大语言模型，所述自然语言理解模型基于所述通用对话数据以及所述目标对话领域的意图标注数据训练得到，所述意图标注数据包括对样本输入数据标注意图和槽位值得到的数据。

21、可选地，所述基于所述对话策略，生成所述输入信息的回复信息，包括：

22、基于所述对话策略，通过自然语言生成模型获得所述输入信息的回复信息，其中，所述自然语言生成模型包括大语言模型，所述自然语言生成模型基于所述通用对话数据训练得到。

23、可选地，所述方法还包括：

24、基于样本数据，通过自然语言理解模型获得样本意图和样本槽位值；

25、基于所述样本意图和所述样本槽位值，通过所述对话管理模型确定样本对话策略；

26、基于所述样本对话策略，通过自然语言生成模型获得所述样本数据的回复信息；

27、基于所述样本数据和所述样本数据的回复信息，获得实际对话完成质量；

28、基于所述实际对话完成质量和所述样本数据对应的标注对话完成质量，对所述自然语言理解模型、所述对话管理模型和所述自然语言生成模型进行训练。

29、根据本申请实施例的第二方面，提供了一种对话装置，包括：

30、识别单元，用于从输入信息中识别出意图和槽位值；

31、处理单元，用于基于所述意图和所述槽位值，通过对话管理模型确定对话策略；其中，所述对话管理模型基于大语言模型构建得到，所述对话管理模型基于通用对话数据以及目标对话领域的样本对话数据训练得到，所述目标对话领域是指所述输入信息所属的对话领域；

32、生成单元，用于基于所述对话策略，生成所述输入信息的回复信息。

33、根据本申请实施例的第三方面，提供了一种电子设备，包括存储器和处理器；

34、所述存储器与所述处理器连接，用于存储程序；

35、所述处理器用于通过运行所述存储器中的程序，实现第一方面所述的对话方法。

36、根据本申请实施例的第四方面，提供了一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器运行时，实现第一方面所述的对话方法。

37、根据本申请实施例的第五方面，提供了一种计算机程序产品，包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行第一方面所述的对话方法。

38、本申请中，从输入信息中识别出意图和槽位值，基于意图和槽位值，通过对话管理模型确定对话策略，其中，对话管理模型基于大语言模型构建得到，对话管理模型基于通用对话数据以及目标对话领域的样本对话数据训练得到，目标对话领域是指输入信息所属的对话领域，基于对话动作，生成输入信息的回复信息。对话管理模型基于通用对话数据以及目标对话领域的样本对话数据训练得到，由于使用了通用对话数据训练对话管理模型，能够不局限于特定领域，能够应对复杂多变的对话场景，提升对话的灵活性和开放性，由于使用了目标对话领域的样本对话数据训练对话管理模型，能够在提升对话的灵活性和开放性的前提下，不影响目标对话领域对话的准确性。而且，对话管理模型基于大语言模型构建得到，得益于大语言模型强大的语义理解和生成能力，对话管理模型能够准确把握对话意图，并以接近人类的语言智能进行策略控制，确定对话策略，使得对话流程更加自然流畅。

本文档来自技高网...

【技术保护点】

1.一种对话方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述通用对话数据包括多个对话领域的无标注的对话数据；所述目标对话领域的样本对话数据包括所述目标对话领域的有标注的对话数据；

3.根据权利要求2所述的方法，其特征在于，所述基于所述目标对话领域的样本对话数据，对所述预训练后的对话管理模型进行对话策略预测训练，得到训练后的对话管理模型，包括：

4.根据权利要求1所述的方法，其特征在于，所述对话管理模型包括对话状态跟踪子模型和对话策略学习子模型；所述对话状态跟踪子模型包括大语言模型；所述对话策略学习子模型包括大语言模型；

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，所述从输入信息中识别出意图和槽位值，包括：

7.根据权利要求1所述的方法，其特征在于，所述基于所述对话策略，生成所述输入信息的回复信息，包括：

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

9.一种对话装置，其特征在于，包括：>

10.一种电子设备，其特征在于，包括存储器和处理器；

11.一种存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器运行时，实现如权利要求1至8中任意一项所述的对话方法。

12.一种计算机程序产品，其特征在于，包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行如权利要求1至8中任意一项所述的对话方法。

...

【技术特征摘要】

1.一种对话方法，其特征在于，包括：

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.根据权利要求1...

【专利技术属性】
技术研发人员：杨强，胡成春，吕昕，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人