一种对话状态预测方法和相关装置制造方法及图纸

技术编号：41190824 阅读：4 留言：0更新日期：2024-05-07 22:21

本申请公开了一种对话状态预测方法和相关装置，涉及人工智能技术领域。该方法包括：将目标语音通话中当前对话轮次的用户语音的转译文本与目标语音通话对应的历史对话记录文本进行拼接，获得对话文本序列；将当前对话轮次的前一个对话轮次结束时对应的对话状态的预测结果以三元组为单位进行分割，获得多个三元组序列。将多个三元组序列和对话文本序列输入到预测模型中，通过预测模型将三元组序列中的槽与对话文本序列中同一个槽的信息进行融合，获得当前对话轮次的对话状态的预测结果。本申请中的方案可以提高对话状态的预测结果的预测精度，提高对话状态追踪模块的智能化程度，解决智能语音服务交互体验较差的缺点。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，特别是涉及一种对话状态预测方法和相关装置。

技术介绍

1、银行的历史数据显示，银行承接的电话咨询业务多为信息查询、简单业务办理等流程逻辑较为清晰、版式相对固定的重复性来电。随着人机交互技术的发展，智能语音服务在银行领域被广泛应用，部分电话咨询业务可以采用智能对话机器人代替人工客服为银行用户提供服务。

2、由于当前作为智能对话机器人核心模块之一的对话状态追踪模块的智能化程度较低，需要用户按照指定模板进行信息表达，同时无法实现联系对话上下文准确理解用户表达的内容的问题，导致存在智能语音服务交互体验较差的缺点。

技术实现思路

1、基于上述问题，本申请提供了一种对话状态预测方法，用以提高对话状态追踪模块的智能化程度，提高对话状态追踪模块理解用户表达的内容的能力，优化交互过程，减少交互成本并提高交互体验。

2、本申请实施例公开了如下技术方案：

3、本申请第一方面提供了一种对话状态预测方法，包括：

4、获取目标语音通话中当前对话轮次的用户语音的转译文本、所述目标语音通话对应的历史对话记录文本和所述当前对话轮次的前一个对话轮次结束时对应的对话状态的预测结果；所述目标语音通话中包括多个对话轮次；每个对话轮次指示用户和对话机器人之间解决一个问题的多个对话内容；所述历史对话记录文本按照时间先后顺序记录所述用户与所述对话机器人之间的对话内容；

5、将所述转译文本拼接到所述历史对话记录文本后，获得对话文本序列；所述对话文本序列

6、将所述对话状态的预测结果以三元组为单位进行分割，获得多个三元组序列；所述三元组包括领域、槽和槽值；所述三元组序列中的槽与所述对话文本序列中的槽有对应关系；

7、将所述对话文本序列和所述多个三元组序列作为预测模型的输入数据，通过所述预测模型将所述多个三元组序列中每个三元组序列中的槽与所述对话文本序列中相同的槽的信息进行融合，获得所述当前对话轮次的对话状态的预测结果；所述预测模型是事先训练的、用于获取所述输入数据对应的对话状态的预测结果的模型。

8、在一种可选的实现方式中，所述将所述对话文本序列和所述多个三元组序列作为预测模型的输入数据，通过所述预测模型将所述多个三元组序列中每个三元组序列中的槽与所述对话文本序列中相同的槽的信息进行融合，获得所述当前对话轮次的对话状态的预测结果，包括：

9、获取所述对话文本序列中每个词语的第一向量，构成第一向量矩阵；

10、获取所述多个三元组序列中每个三元组序列的第二向量，构成第二向量矩阵；

11、基于多头注意力机制对所述第一向量矩阵和所述第二向量矩阵进行处理，获得第一融合向量矩阵；

12、基于所述第一融合向量矩阵和所述用户对应的用户三元组矩阵，获得第二融合向量矩阵；所述用户三元组矩阵中的每个元素代表该用户的特征；

13、对于所述第二融合向量矩阵中每个第二融合向量，从槽值候选集合中确定与该第二融合向量的欧式距离最小的槽值作为该第二融合向量对应的目标槽值；槽值候选集合中包括领域内与每个槽对应的多个可选的槽值；

14、基于多个所述目标槽值，生成所述当前对话轮次的对话状态的预测结果。

15、在一种可选的实现方式中，获取所述预测模型，包括：

16、基于数据训练集训练待训练模型，直到满足预设的停止条件后，停止训练待训练模型，获得所述预测模型；所述预设的停止条件包括连续n次待训练模型的性能均未得到提升；所述n是大于等于2的正整数。

17、在一种可选的实现方式中，所述基于数据训练集训练待训练模型，直到满足预设的停止条件后，停止训练待训练模型，获得所述预测模型，包括：

18、获取槽值状态识别模块，所述槽值状态识别模块用于在待训练模型获得所述输入数据对应的目标槽值后，判断获得的所述输入数据对应的槽值的准确性；

19、基于所述数据训练集和所述槽值状态识别模块训练待训练模型，直到满足预设的停止条件后，停止训练待训练模型，获得所述预测模型。

20、在一种可选的实现方式中，所述获得数据训练集，包括：

21、获取预设的、理论上的对话状态的三元组集合作为对话状态预测实体；

22、获取多个用户中每个用户的用户三元组矩阵；

23、对于多个语音通话中的每个语音通话，将该语音通话对应的历史对话记录文本中的内容进行三元组标注后按照交互轮次进行划分，获得多轮对话数据；多轮对话数据中的每一轮对话数据包括：该对话轮次发生前的对话历史记录文本、该对话轮次的前一个对话轮次的对话状态的结果、该对话轮次的状态标注和对应的用户三元组矩阵；所述状态标注是指按照领域、槽和槽值对历史对话记录文本中的内容进行标注的结果；

24、基于所述多轮对话数据，构建数据训练集。

25、在一种可选的实现方式中，所述获取所述对话文本序列中每个词语的第一向量，构成第一向量矩阵，包括：

26、对所述对话文本序列中的文本进行词性标注，获得目标对话文本序列；

27、对所述目标对话文本序列中的每个词语进行编码，获取所述目标对话文本序列中的每个词语的第一向量；

28、基于所述目标对话文本序列中的每个词语的第一向量，构建所述第一向量矩阵。

29、在一种可选的实现方式中，所述获取所述多个三元组序列中每个三元组序列的第二向量，构成第二向量矩阵，包括：

30、对所述多个三元组序列中每个三元组序列进行编码，获得每个三元组序列的第二向量；

31、基于每个三元组序列的第二向量，构建所述第二向量矩阵。

32、本申请第二方面提供一种对话状态预测装置，包括：

33、数据获取模块，用于获取在目标语音通话中当前对话轮次的用户语音的转译文本、所述目标语音通话对应的历史对话记录文本和所述当前对话轮次的前一个对话轮次结束时对应的对话状态的预测结果；所述目标语音通话中包括多个对话轮次；每个对话轮次指示用户和对话机器人之间解决一个问题的多个对话内容；所述历史对话记录文本按照时间先后顺序记录所述用户与所述对话机器人之间的对话内容；

34、对话文本序列生成模块，用于将所述转译文本拼接到所述历史对话记录文本后，获得对话文本序列；所述对话文本序列中包括槽以及槽对应的文字信息；槽表征所述用户在所述对话文本序列中表达出的意图；

35、三元组序列生成模块，用于将所述对话状态的预测结果以三元组为单位进行分割，获得多个三元组序列；所述三元组包括领域、槽和槽值；所述三元组序列中的槽与所述对话文本序列中的槽有对应关系；

36、预测结果获取模块，用于将所述对话文本序列和所述多个三元组序列作为预测模型的输入数据，通过所述预测模型将所述多个三元组序列中每个三元组序列中的槽与所述对话文本序列中相同的槽的信息进本文档来自技高网...

【技术保护点】

1.一种对话状态预测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述对话文本序列和所述多个三元组序列作为预测模型的输入数据，通过所述预测模型将所述多个三元组序列中每个三元组序列中的槽与所述对话文本序列中相同的槽的信息进行融合，获得所述当前对话轮次的对话状态的预测结果，包括：

3.根据权利要求1所述的方法，其特征在于，获取所述预测模型，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于数据训练集训练待训练模型，直到满足预设的停止条件后，停止训练待训练模型，获得所述预测模型，包括：

5.根据权利要求3所述的方法，其特征在于，所述获得数据训练集，包括：

6.根据权利要求2所述的方法，其特征在于，所述获取所述对话文本序列中每个词语的第一向量，构成第一向量矩阵，包括：

7.根据权利要求2所述的方法，其特征在于，所述获取所述多个三元组序列中每个三元组序列的第二向量，构成第二向量矩阵，包括：

8.一种对话状态预测装置，其特征在于，所述装置包括：

9.一种

10.一种电子设备，其特征在于，包括：

...

【技术特征摘要】

1.一种对话状态预测方法，其特征在于，所述方法包括：

3.根据权利要求1所述的方法，其特征在于，获取所述预测模型，包括：

5....

【专利技术属性】
技术研发人员：齐剑书，
申请(专利权)人：中国农业银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人