人机对话方法、对话网络模型的训练方法及装置制造方法及图纸

技术编号：41253175 阅读：7 留言：0更新日期：2024-05-11 09:14

本公开实施例提供了一种人机对话方法、对话网络模型的训练方法及装置，包括：获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据，根据第二历史对话数据、当前的对话环境数据、第二输入对话数据确定第二语义关键字，根据第二语义关键字和预设类型知识库，生成并输出与第二输入对话数据对应的第二反馈对话数据，其中，预设类型知识库包括：知识图谱、文本知识、以及除知识图谱和文本知识之外的外部知识，可以避免第二反馈对话数据因关键知识的缺失而导致的歧义和语义模糊，提高了第二反馈对话数据的可靠性和有效性，且提高用户的交互体验。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能，尤其涉及一种人机对话方法、对话网络模型的训练方法及装置。

技术介绍

1、对话系统是人工智能中的重要技术之一，对话系统旨在辅助人类并与人类完成自然、连贯、流畅的交流任务的计算机系统。如，基于对话系统，可以完成人机对话。

2、在一些实施例中，对话系统可以采集用户发起的用户对话数据，并从预设类型知识库中确定针对用户对话数据的反馈对话数据，并输出反馈对话数据。其中，预设类型知识库包括文本知识和知识图谱。

3、然而，文本知识和知识图谱中的知识更新相对较慢，可能导致确定出的反馈对话数据有歧义或者不清楚。

技术实现思路

1、为提高人机对话的可靠性和有效性，本公开实施例提供了一种人机对话方法、对话网络模型的训练方法及装置。

2、根据本公开实施例的一个方面，本公开实施例提供了一种人机对话方法，所述方法包括：

3、获取第二历史对话数据、当前的对话环境数据、用户输入的第二输入对话数据；

4、根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据确定第二语义关键字；

5、根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，其中，所述预设类型知识库包括：知识图谱、文本知识、以及除所述知识图谱和文本知识之外的外部知识。

6、在本实施例中，一方面，通过结合当前的对话环境数据确定第二语义关键字，使得第二语义关键字可以表征更多维度的内容，提高第二语义关键

7、在一些实施例中，所述根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，包括：

8、分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二语义关键字对应的知识；

9、根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据。

10、在本实施例中，通过从各类型的知识(即外部知识、知识图谱、文本知识)中，分别获取第二语义关键字对应的知识，使得获取到的知识较为丰富和全面，以便当基于较为丰富和全面的知识确定第二反馈对话数据时，使得第二反馈对话数据具有较高的可靠性和有效性。

11、在一些实施例中，在所述分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二语义关键字对应的知识之后，所述方法还包括：

12、根据从第一类型知识获取到的与所述第二语义关键字对应的知识，在至少一个其他类型知识中进行检索，得到与从第一类型知识获取到的与所述第二语义关键字对应的知识相关联的知识；

13、其中，所述至少一个其他类型知识中的与所述第二语义关键字对应的知识包括检索得到的与所述从第一类型知识获取到的与所述第二语义关键字对应的知识相关联的知识；所述第一类型知识为所述外部知识、所述知识图谱、所述文本知识中的任意一种，所述至少一个其他类型知识为所述外部知识、所述知识图谱、所述文本知识中除所述第一类型知识之外的类型知识。

14、在本实施例中，通过“多跳检索”的方式从不同类型的知识获取相关联的知识，可以避免知识的遗漏，实现在不同类型的知识中的交叉检索，提高了与第二语义关键字对应的知识的多样性和充分性。

15、在一些实施例中，根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据，包括：

16、对各获取到的与所述第二语义关键字对应的知识分别进行编码，得到各自对应的目标特征向量；

17、根据所述各自对应的目标特征向量，生成并输出所述第二反馈对话数据。

18、在一些实施例中，所述根据所述各自对应的目标特征向量，生成并输出所述第二反馈对话数据，包括：

19、对所述各自对应的目标特征向量进行融合处理，得到目标融合特征向量；

20、根据所述目标融合特征向量生成并输出所述第二反馈对话数据。

21、在本实施例中，通过对各目标特征向量进行融合处理，以使得目标融合特征向量可以表征各目标特征向量各自对应的特征，以便当基于目标融合特征向量确定第二反馈对话数据时，使得第二反馈对话数据具有较高的可靠性和有效性。

22、在一些实施例中，所述目标融合特征向量是将所述各自对应的目标特征向量输入至预先训练得到的交叉注意力网络模型得到的。

23、在一些实施例中，所述根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据，包括：

24、对各获取到的与所述第二语义关键字对应的知识进行去冗余处理，得到去冗余处理后的知识；

25、根据所述去冗余处理后的知识生成并输出所述第二反馈对话数据。

26、在本实施例中，通过去冗余处理，可以避免数据冗余，减少数据处理量，提高交互效率。

27、在一些实施例中，所述方法还包括：

28、根据所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据，确定是否需要引入所述外部知识的第三分类结果；

29、以及，所述根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，包括：若所述第三分类结果表征为需要引入所述外部知识，则根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据。

30、在本实施例中，通过先确定是否需要引入外部知识，以便在知识图谱和文本知识无法满足对话需求的情况下，引入外部知识，以结合外部知识确定第二反馈对话数据，使得第二反馈对话数据可以满足用户的对话需求，提高交互体验。

31、在一些实施例中，所述第三分类结果是将所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据输入至预先训练的二分类网络模型得到的；

32、其中，所述二分类模型是基于第三样本数据集学习确定是否需要引入所述外部知识的能力的模型，所述第三样本数据集中包括第三样本输入对话数据、第三样本历史对话数据、以及与第三样本输入对话数据对应的第二样本对话环境数据。

33、在一些实施例中，所述第二语义关键字是将所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据输入至预先训练的生成网络模型得到的；

34、其中，所述生成网络模型是基于第四样本数据集学习与所述第四样本数据集对应的第三样本语义关键字的能力的模型，所述第四样本数据集中包括第四样本输入对话数据、第四样本历史对话数据、以及与第四样本输入对话数据对应的第三样本对话环境数据。

35、在一些实施例中，外部知识包括网络知识和多模态知识，其中，多模态知识为包括图片和文本文档来自技高网...

【技术保护点】

1.一种人机对话方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述第二语义关键字和预设类型知识库，生成并输出与所述第二输入对话数据对应的第二反馈对话数据，包括：

3.根据权利要求2所述的方法，其特征在于，在所述分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二语义关键字对应的知识之后，所述方法还包括：

4.根据权利要求2所述的方法，其特征在于，所述根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述各自对应的目标特征向量，生成并输出所述第二反馈对话数据，包括：

6.根据权利要求5所述的方法，其特征在于，所述目标融合特征向量是将所述各自对应的目标特征向量输入至预先训练得到的交叉注意力网络模型得到的。

7.根据权利要求2-6中任一项所述的方法，其特征在于，所述根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据，包括：

8.根据权利要求1-

9.根据权利要求8所述的方法，其特征在于，所述第三分类结果是将所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据输入至预先训练的二分类网络模型得到的；

10.根据权利要求1-9中任一项所述的方法，其特征在于，所述第二语义关键字是将所述第二历史对话数据、所述当前的对话环境数据、所述第二输入对话数据输入至预先训练的生成网络模型得到的；

11.一种对话网络模型的训练方法，其特征在于，所述方法包括：

12.根据权利要求11所述的方法，其特征在于，所述根据所述第二样本语义关键字和预设类型知识库，训练得到具有预测与输入对话数据对应的反馈对话数据能力的对话网络模型，包括：

13.根据权利要求12所述的方法，其特征在于，在所述分别从所述外部知识、所述知识图谱、所述文本知识中，获取与所述第二样本语义关键字对应的知识之后，所述方法还包括：

14.根据权利要求12所述的方法，其特征在于，所述根据各获取到的与所述第二样本语义关键字对应的知识，训练得到所述对话网络模型，包括：

15.根据权利要求14所述的方法，其特征在于，所述根据所述各自对应的特征向量训练得到所述对话网络模型，包括：

16.根据权利要求15所述的方法，其特征在于，所述融合特征向量是将所述各自对应的特征向量输入至预先训练得到的交叉注意力网络模型得到的。

17.根据权利要求12-16中任一项所述的方法，其特征在于，所述根据各获取到的与所述第二样本语义关键字对应的知识，训练得到所述对话网络模型，包括：

18.根据权利要求11-16中任一项所述的方法，其特征在于，所述方法还包括：

19.根据权利要求18所述的方法，其特征在于，所述第一分类结果是将所述第二样本数据集输入至预先训练的二分类网络模型得到的；

20.根据权利要求11-19中任一项所述的方法，其特征在于，所述第二样本语义关键字是将所述第二样本数据集输入至预先训练的生成网络模型得到的；

21.一种人机对话装置，其特征在于，所述装置包括：

22.一种对话网络模型的训练装置，其特征在于，所述装置包括：

23.一种计算机存储介质，其特征在于，所述计算机存储介质上存储有计算机指令，当所述计算机指令在被处理器运行时，使得权利要求1至10中任一项所述的方法被执行；或者，使得权利要求11至20中任一项所述的方法被执行。

24.一种电子设备，其特征在于，包括：

25.一种计算机程序产品，其特征在于，当所述计算机程序产品在处理器上运行时，使得权利要求1至10中任一项所述的方法被执行；或者，使得权利要求11至20中任一项所述的方法被执行。

26.一种芯片，其特征在于，包括：

27.一种终端设备，其特征在于，包括：

...

【技术特征摘要】

1.一种人机对话方法，其特征在于，所述方法包括：

4.根据权利要求2所述的方法，其特征在于，所述根据各获取到的与所述第二语义关键字对应的知识，生成并输出所述第二反馈对话数据，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述各自对应的目标特征向量，生成并输出所述第二反馈对话数据，包括：

8.根据权利要求1-6中任一项所述的方法，其特征在于，所述方法还包括：

11.一种对话网络模型的训练方法，其特征在于，所述方法包括：

13.根据权利要求12所述的方法，其特征在于，在所述分别从所述外部知...

【专利技术属性】
技术研发人员：李一同，糜飞，王雅圣，庄兆永，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人