一种对话状态确定方法、装置、设备及存储介质制造方法及图纸

技术编号:33719499 阅读:13 留言:0更新日期:2022-06-08 21:10
本申请实施例提供了一种对话状态确定方法,包括:获取输入数据;其中,输入数据,为任一领域的对话过程中用户输入的对话数据;通过训练完成的神经网络,对输入数据进行处理,得到输出数据;其中,训练完成的神经网络,是基于样本数据中的第一数据,对参数初步调整的神经网络的网络参数进行元测试得到的;参数初步调整的神经网络,是基于样本数据中的第二数据,对每一领域的子神经网络进行元训练得到的;第一数据携带标注信息;第二数据未携带标注信息;样本数据,包括至少一个领域的对话数据;基于输出数据,确定对话的对话状态。本申请实施例还提供了一种对话状态确定装置、设备以及计算机可读存储介质。机可读存储介质。机可读存储介质。

【技术实现步骤摘要】
一种对话状态确定方法、装置、设备及存储介质


[0001]本申请涉及信息
,尤其涉及一种对话状态确定方法、装置、设备以及计算机可读存储介质。

技术介绍

[0002]多领域生成式对话系统,能够在任一领域完成与任一用户的对话交互。在相关技术中,多领域生成式对话系统多采用神经网络进行对话处理。在对多领域生成式对话系统对应的神经网络在训练时,采用的是半监督训练的方法,并且,在上述半监督训练过程中,通常是将携带有标注信息的样本数据、以及未携带标注信息的样本数据同时作为神经网络的输入数据进行训练。然而,在实际应用中,携带有标注信息的样本数据的数据量较小,进而使得其对神经网络的网络参数改善作用有限。因此,在相关技术中,多领域生成式对话系统的神经网络对用户输入的对话数据的处理性能较差。

技术实现思路

[0003]本申请实施例提供了一种对话状态确定方法、对话状态确定装置、对话状态确定设备以及计算机可读存储介质。
[0004]本申请实施例所提供的对话状态确定方法,能够通过训练完成的神经网络对任一领域的对话数据进行高效精确的识别,从而能够快速准确的确定任一领域的任一对话的状态。
[0005]本申请实施例所提供的对话状态确定方法是这样实现的:
[0006]一种对话状态确定方法,所述方法包括:
[0007]获取输入数据;其中,所述输入数据,为任一领域的对话过程中用户输入的对话数据;
[0008]通过训练完成的神经网络,对所述输入数据进行处理,得到输出数据;其中,所述训练完成的神经网络,是基于样本数据中的第一数据,对参数初步调整的所述神经网络的网络参数进行元测试得到的;所述参数初步调整的所述神经网络,是基于所述样本数据中的第二数据,对所述神经网络进行元训练得到的;所述第一数据携带标注信息;所述第二数据未携带标注信息;所述样本数据,包括至少一个领域的对话数据;
[0009]基于所述输出数据,确定所述对话的对话状态。
[0010]在一些实施方式中,所述第二数据,包括至少一个领域的对话数据;所述参数初步调整的所述神经网络,是基于所述样本数据中的第二数据,对所述神经网络进行元训练得到的,包括:
[0011]基于所述第二数据,对所述每一领域的子神经网络的网络参数进行调整,得到参数初步调整的所述每一领域的子神经网络;
[0012]基于参数初步调整的所述每一领域的子神经网络的网络参数、以及所述第二数据,对神经网络的网络参数进行调整,得到参数初步调整的所述神经网络;其中,所述领域
参数调整结束的神经网络,包括参数初步调整的所述每一领域的子神经网络。
[0013]在一些实施方式中,所述基于所述第二数据,对所述每一领域的子神经网络的网络参数进行调整,得到参数初步调整的所述每一领域的子神经网络,包括:
[0014]从所述第二数据中获取领域训练数据;其中,所述领域训练数据,用于对所述每一领域的子神经网络进行训练;
[0015]基于所述领域训练数据中的每一领域的对话数据,对所述每一领域的子神经网络的网络参数进行调整,得到所述参数初步调整的所述每一领域的子神经网络。
[0016]在一些实施方式中,所述基于所述领域训练数据中的每一领域的对话数据,对所述每一领域的子神经网络的网络参数进行调整,得到所述参数初步调整的所述每一领域的子神经网络,包括:
[0017]基于所述每一领域的子神经网络,对所述领域训练数据中每一领域的对话数据进行元学习处理,得到每一领域的训练误差;
[0018]基于所述每一领域的训练误差,调整所述每一领域的子神经网络的网络参数,得到所述参数初步调整的所述每一领域的子神经网络。
[0019]在一些实施方式中,所述基于所述每一领域的子神经网络,对所述领域训练数据中每一领域的对话数据进行元学习处理,得到每一领域的训练误差,包括:
[0020]将所述领域训练数据中第d领域的对话数据的第t轮对话数据,输入至所述第d领域的子神经网络,得到第t轮输出数据;其中,d为大于或等于0的整数;所述t为大于或等于1的整数;
[0021]基于所述第t轮输出数据,得到所述第d领域的训练误差。
[0022]在一些实施方式中,所述基于所述参数初步调整的每一领域的子神经网络的网络参数、以及所述第二数据,对神经网络的网络参数进行调整,得到参数初步调整的所述神经网络,包括:
[0023]从所述第二数据中获取领域检测数据;其中,所述领域检测数据,用于对神经网络进行训练;
[0024]基于所述参数初步调整的每一领域的子神经网络的网络参数、以及所述领域检测数据,对所述神经网络的网络参数进行调整,得到参数初步调整的所述神经网络。
[0025]在一些实施方式中,所述基于参数初步调整的每一领域的子神经网络的网络参数、以及所述领域检测数据,对所述神经网络的网络参数进行调整,得到参数初步调整的所述神经网络,包括:
[0026]基于所述参数初步调整的每一领域的子神经网络的网络参数,对所述领域检测数据中的每一领域的对话数据进行处理,得到每一领域检测误差;
[0027]基于所述每一领域检测误差,得到网络训练误差;
[0028]基于所述网络训练误差,对所述神经网络的网络参数进行调整,得到所述参数初步调整后所述神经网络。
[0029]在一些实施方式中,所述基于所述网络训练误差,对所述神经网络的网络参数进行调整,得到所述参数初步调整后所述神经网络,包括:
[0030]在所述神经网络的网络参数调整结果收敛的情况下,基于所述网络参数调整结果,得到所述参数初步调整后所述神经网络;
[0031]在所述神经网络的网络参数调整结果不收敛的情况下,重新执行以下步骤,直至所述领域参数调整结束的神经网络的网络参数调整结果收敛:
[0032]将所述神经网络的网络参数作为每一领域的子神经网络的网络参数;
[0033]基于所述第二数据,对所述每一领域的子神经网络的网络参数进行调整,得到参数初步调整的所述每一领域的子神经网络;
[0034]基于参数初步调整的所述每一领域的子神经网络的网络参数、以及所述第二数据,得到参数初步调整的所述神经网络。
[0035]在一些实施方式中,所述第一数据,包括至少一个领域的对话数据;所述训练完成的神经网络,是通过以下方式得到的:
[0036]将所述第一数据中的每一对话数据输入至所述参数初步调整的神经网络,得到与每一对话数据对应的对话误差;
[0037]对每一所述对话误差进行累加,得到网络调整误差;
[0038]基于所述网络调整误差,对所述参数初步调整的神经网络的网络参数进行调整,得到所述训练完成的神经网络。
[0039]在一些实施方式中,所述基于所述网络调整误差,对所述参数初步调整的神经网络的网络参数进行调整,得到所述训练完成的神经网络,包括:
[0040]在对所述参数初步调整的神经网络的网络参数调整结果收敛的情况下,基于所述网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话状态确定方法,其特征在于,所述方法包括:获取输入数据;其中,所述输入数据,为任一领域的对话过程中用户输入的对话数据;通过训练完成的神经网络,对所述输入数据进行处理,得到输出数据;其中,所述训练完成的神经网络,是基于样本数据中的第一数据,对参数初步调整的所述神经网络的网络参数进行元测试得到的;所述参数初步调整的所述神经网络,是基于所述样本数据中的第二数据,对所述神经网络进行元训练得到的;所述第一数据携带标注信息;所述第二数据未携带标注信息;所述样本数据,包括至少一个领域的对话数据;基于所述输出数据,确定所述对话的对话状态。2.根据权利要求1所述的方法,其特征在于,所述第二数据,包括至少一个领域的对话数据;所述参数初步调整的所述神经网络,是基于所述样本数据中的第二数据,对所述神经网络进行元训练得到的,包括:基于所述第二数据,对所述每一领域的子神经网络的网络参数进行调整,得到参数初步调整的所述每一领域的子神经网络;基于参数初步调整的所述每一领域的子神经网络的网络参数、以及所述第二数据,对神经网络的网络参数进行调整,得到参数初步调整的所述神经网络。3.根据权利要求2所述的方法,其特征在于,所述基于所述第二数据,对所述每一领域的子神经网络的网络参数进行调整,得到参数初步调整的所述每一领域的子神经网络,包括:从所述第二数据中获取领域训练数据;其中,所述领域训练数据,用于对所述每一领域的子神经网络进行训练;基于所述领域训练数据中的每一领域的对话数据,对所述每一领域的子神经网络的网络参数进行调整,得到所述参数初步调整的所述每一领域的子神经网络。4.根据权利要求3所述的方法,其特征在于,所述基于所述领域训练数据中的每一领域的对话数据,对所述每一领域的子神经网络的网络参数进行调整,得到所述参数初步调整的所述每一领域的子神经网络,包括:基于所述每一领域的子神经网络,对所述领域训练数据中每一领域的对话数据进行元学习处理,得到每一领域的训练误差;基于所述每一领域的训练误差,调整所述每一领域的子神经网络的网络参数,得到所述参数初步调整的所述每一领域的子神经网络。5.根据权利要求4所述的方法,其特征在于,所述基于所述每一领域的子神经网络,对所述领域训练数据中每一领域的对话数据进行元学习处理,得到每一领域的训练误差,包括:将所述领域训练数据中第d领域的对话数据的第t轮对话数据,输入至所述第d领域的子神经网络,得到第t轮输出数据;其中,d为大于或等于0的整数;所述t为大于或等于1的整数;基于所述第t轮输出数据,得到所述第d领域的训练误差。6.根据权利要求2所述的方法,其特征在于,所述基于所述参数初步调整的每一领域的子神经网络的网络参数、以及所述第二数据,对所述神经网络的网络参数进行调整,得到参数初步调整的所述神经网络,包括:
从所述第二数据中获取领域检测数据;其中,所述领域检测数据,用于对所述神经网络进行训练;基于所述参数初步调整的每一领域的子神经网络的网络参数、以及所述领域检测数据,对所述神经网络的网络参数进行调整,得到参数初步调整的所述神经网络。7.根据权利要求6所述的方法,其特征在于,所述基于参数初步调整的每一领域的子神经网络的网络参数、以及所述领域检测数据,得到参数初步调整的所述神经网络,包括:基于所述参数初步调整的每一领域的子神经网络的网络...

【专利技术属性】
技术研发人员:马硕
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1