对话理解及模型训练方法、装置、设备和存储介质制造方法及图纸

技术编号：29757729 阅读：29 留言：0更新日期：2021-08-20 21:11

本公开提供了一种对话理解及模型训练方法、装置、设备和存储介质，涉及计算机技术领域，具体涉及自然语言处理、深度学习等人工智能领域。对话理解方法包括：获取对话信息；获取所述对话信息对应的当前任务的任务信息；采用对话理解模型，基于所述当前任务的任务信息对所述对话信息进行处理，以获得对话理解结果。本公开可以降低对话理解所需的样本量。

全部详细技术资料下载

【技术实现步骤摘要】
对话理解及模型训练方法、装置、设备和存储介质
本公开涉及计算机
，具体涉及自然语言处理、深度学习等人工智能领域，尤其涉及一种对话理解及模型训练方法、装置、设备和存储介质。
技术介绍
人机对话（Human-MachineConversation）是指让机器理解和运用自然语言实现人机通信的技术。自然语言理解（NaturalLanguageUnderstanding，NLU）是自然语言处理（NaturalLanguageProcessing，NLP）的重要组成部分，NLU的核心任务是将自然语言转化为机器可处理的形式化语言，建立自然语言与资源和服务的连接。人机对话过程中进行的NLU可以称为对话理解，人机对话系统一般采用对话理解模型对输入信息进行对话理解，以获得对话理解结果。相关技术中，对话理解模型的输入信息一般仅为对话信息。
技术实现思路
本公开提供了一种对话理解及模型训练方法、装置、设备和存储介质。根据本公开的一方面，提供了一种对话理解方法，包括：获取对话信息；获取所述对话信息对应的当前任务的任务信息；采用对话理解模型，基于所述当前任务的任务信息对所述对话信息进行处理，以获得对话理解结果。根据本公开的另一方面，提供了一种对话理解模型的训练方法，包括：获取训练数据，所述训练数据包括：对话信息样本和目标任务的任务信息；采用所述训练数据，训练对话理解模型。根据本公开的另一方面，提供了一种对话理解装置，包括：第一获取模块，用于获取对话信息；第二获取模块，用于获取所述...

【技术保护点】
1.一种对话理解方法，包括：/n获取对话信息；/n获取所述对话信息对应的当前任务的任务信息；/n采用对话理解模型，基于所述当前任务的任务信息对所述对话信息进行处理，以获得对话理解结果。/n

【技术特征摘要】
1.一种对话理解方法，包括：
获取对话信息；
获取所述对话信息对应的当前任务的任务信息；
采用对话理解模型，基于所述当前任务的任务信息对所述对话信息进行处理，以获得对话理解结果。

2.根据权利要求1所述的方法，其中，所述任务信息包括预设的关键字，所述关键字为至少一个，所述采用对话理解模型，基于所述当前任务的任务信息对所述对话信息进行处理，以获得对话理解结果，包括：
采用对话理解模型，将所述对话信息与所述至少一个关键字中的各个关键字进行匹配，以获得所述各个关键字对应的值，将所述各个关键字对应的值作为对话理解结果。

3.根据权利要求2所述的方法，其中，所述关键字包括任务名和任务属性，所述对话理解模型包括：输入层、隐层和输出层，所述采用对话理解模型，将所述对话信息与所述至少一个关键字中的各个关键字进行匹配，以获得所述各个关键字对应的值，包括：
采用所述输入层，将所述对话信息转换为对话输入向量，将所述任务名转换为任务名输入向量，将所述任务属性转换为任务属性输入向量；
采用所述隐层，分别匹配所述对话输入向量和所述任务名输入向量，以及所述对话输入向量和所述任务属性输入向量，以获得隐层输出向量；
采用所述输出层，对所述隐层输出向量进行处理，以获得所述任务名对应的值，以及所述任务属性对应的值。

4.根据权利要求3所述的方法，其中，所述输出层包括分类层和序列标注层，所述隐层输出向量包括第一隐层输出向量和第二隐层输出向量，所述采用所述输出层，对所述隐层输出向量进行处理，以获得所述任务名对应的值，以及所述任务属性对应的值，包括：
采用所述分类层对所述第一隐层输出向量进行处理，以获得分类结果，所述分类结果包括：第一分类结果，或者，第二分类结果，所述第一分类结果用于表明所述对话信息中是否包含与所述任务名一致的信息，所述第二分类结果用于表明所述对话信息中是否包含与所述任务属性一致的信息；
若所述分类结果为所述第一分类结果，将所述第一分类结果作为所述任务名对应的值；
若所述分类结果为所述第二分类结果，且所述第二分类结果表明所述对话信息中包含与所述任务属性一致的信息，采用所述序列标注层对所述第二隐层输出向量进行处理，以获得序列标注结果，将所述序列标注结果作为所述任务属性对应的值。

5.一种对话理解模型的训练方法，包括：
获取训练数据，所述训练数据包括：对话信息样本和目标任务的任务信息；
采用所述训练数据，训练对话理解模型。

6.根据权利要求5所述的方法，其中，所述采用所述训练数据，训练对话理解模型，包括：
基于所述对话信息样本对应的对话状态，获得所述目标任务的任务信息对应的正例和负例；
采用所述正例和负例，训练对话理解模型。

7.根据权利要求6所述的方法，其中，所述对话状态包括意图名和词槽名，所述基于所述对话信息样本对应的对话状态，获得所述目标任务的任务信息对应的正例和负例，包括：
若所述目标任务的任务信息包括目标任务名，将意图名与所述目标任务名一致的对话信息样本，作为所述目标任务名对应的正例，将意图名与所述目标任务名不一致的对话信息样本，作为所述目标任务名对应的负例；和/或，
若所述目标任务的任务信息包括目标任务属性，将词槽名与所述目标任务属性一致的对话信息样本，作为所述目标任务属性对应的正例，将词槽名与所述目标任务属性不一致的对话信息样本，作为所述目标任务属性对应的负例。

8.一种对话理解装置，包括：
第一获取模块，用于获取对话信息；
第二获取模块，用于获取所...

【专利技术属性】
技术研发人员：于振龙，孙辉丰，孙叔琦，常月，李婷婷，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人