对话理解及模型训练方法、装置、设备和存储介质制造方法及图纸

技术编号:29757729 阅读:29 留言:0更新日期:2021-08-20 21:11
本公开提供了一种对话理解及模型训练方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能领域。对话理解方法包括:获取对话信息;获取所述对话信息对应的当前任务的任务信息;采用对话理解模型,基于所述当前任务的任务信息对所述对话信息进行处理,以获得对话理解结果。本公开可以降低对话理解所需的样本量。

【技术实现步骤摘要】
对话理解及模型训练方法、装置、设备和存储介质
本公开涉及计算机
,具体涉及自然语言处理、深度学习等人工智能领域,尤其涉及一种对话理解及模型训练方法、装置、设备和存储介质。
技术介绍
人机对话(Human-MachineConversation)是指让机器理解和运用自然语言实现人机通信的技术。自然语言理解(NaturalLanguageUnderstanding,NLU)是自然语言处理(NaturalLanguageProcessing,NLP)的重要组成部分,NLU的核心任务是将自然语言转化为机器可处理的形式化语言,建立自然语言与资源和服务的连接。人机对话过程中进行的NLU可以称为对话理解,人机对话系统一般采用对话理解模型对输入信息进行对话理解,以获得对话理解结果。相关技术中,对话理解模型的输入信息一般仅为对话信息。
技术实现思路
本公开提供了一种对话理解及模型训练方法、装置、设备和存储介质。根据本公开的一方面,提供了一种对话理解方法,包括:获取对话信息;获取所述对话信息对应的当前任务的任务信息;采用对话理解模型,基于所述当前任务的任务信息对所述对话信息进行处理,以获得对话理解结果。根据本公开的另一方面,提供了一种对话理解模型的训练方法,包括:获取训练数据,所述训练数据包括:对话信息样本和目标任务的任务信息;采用所述训练数据,训练对话理解模型。根据本公开的另一方面,提供了一种对话理解装置,包括:第一获取模块,用于获取对话信息;第二获取模块,用于获取所述对话信息对应的当前任务的任务信息;对话理解模块,用于采用对话理解模型,基于所述当前任务的任务信息对所述对话信息进行处理,以获得对话理解结果。根据本公开的另一方面,提供了一种对话理解模型的训练装置,包括:获取模块,用于获取训练数据,所述训练数据包括:对话信息样本和目标任务的任务信息;训练模块,用于采用所述训练数据,训练对话理解模型。根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述任一方面的任一项所述的方法。根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述任一方面的任一项所述的方法。根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一方面的任一项所述的方法。根据本公开的技术方案,可以降低对话理解所需的样本量。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本公开的限定。其中:图1是根据本公开第一实施例的示意图;图2是根据本公开第二实施例的示意图;图3是根据本公开第三实施例的示意图;图4是根据本公开第四实施例的示意图;图5是根据本公开第五实施例的示意图;图6是根据本公开第六实施例的示意图;图7是根据本公开第七实施例的示意图;图8是用来实现本公开实施例的对话理解或对话理解模型的训练方法中任一方法的电子设备的示意图。具体实施方式以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1是根据本公开第一实施例的示意图。本实施例提供一种对话理解方法,包括:101、获取对话信息。102、获取所述对话信息对应的当前任务的任务信息。103、采用对话理解模型,基于所述当前任务的任务信息对所述对话信息进行处理,以获得对话理解结果。本实施例的执行主体可以称为人机对话系统,人机对话系统可以位于服务器或者终端设备上。以人机对话系统位于服务器上为例,用户使用的终端设备上可以安装用于人机对话的客户端,客户端比如为应用程序(Application,APP)形式等。用户可以以语音、文本等形式向客户端中输入信息,用户输入的信息可以称为用户查询信息(query),人机对话系统可以基于用户输入的查询信息向用户进行反馈,人机对话系统反馈的信息可以称为系统应答信息。对话信息可以包括用户查询信息,和/或,系统应答信息,对话信息还可以称为对话上下文(context)。人机对话可以应用到不同的任务下,任务比如包括:订饮品、订机票、查询天气等。相关技术中,对话理解模型的输入信息一般仅为对话信息,在不同的任务下需要采用对应任务的样本数据进行训练,为了提高对话理解效果,需要较大量的样本数据。本实施例中,输入信息不仅包括对话信息,还包括当前任务的任务信息,比如,若当前任务为订饮品,则输入信息还包括:订饮品对应的任务信息。一般来讲,人机对话系统可以提供定制化的对话服务,定制化的对话服务是指人机对话系统事先定义了其能够服务的场景(或称为任务),因此,当前任务是指人机对话系统事先定义的服务场景,一个人机对话系统可以提供一种或多种场景的对话服务。比如,一个人机对话系统是用于订饮品的,则该人机对话系统对应的当前任务为订饮品。任务信息可以包括:关键字(key),关键字可以为一个或多个,关键字用于对任务进行描述,还可以称为任务描述信息。对应不同的任务,可以预先定义各自对应的任务描述信息,也即关键字。关键字可以包括:任务名和任务属性,任务名类似意图名,任务属性类似词槽名。任务名可以为一个或多个,任务属性可以为一个或多个。以订饮品为例,任务名和任务属性可以分别包括:任务名:订饮品,任务属性:饮料种类等。进一步地,任务名和任务属性的后面还可以附加样例,样例可以为一个或多个,样例可以是定义的或者是历史对话信息。不同任务名和/或任务属性,对应的样例的数量可以相同或不同。比如,任务名:订饮品,我要喝可乐,给我杯果汁;任务属性:饮料种类,果汁,奶茶。如图2所示,以当前任务为订饮品为例,对话理解模型的输入信息包括:对话信息,以及订饮品对应的任务描述信息,将任务描述信息作为关键字与对话信息一起输入到对话理解模型中,对话理解模型对输入信息进行处理后,输出为对话理解结果,可以将关键字对应的值作为对话理解结果。上述以任务信息为用户预先定义的任务描述信息为例,此时不需要样本,即可以实现零样本进行对话理解。上述的任务信息还可以为当前任务对应的历史对话信息,比如,当前任务为订饮品,历史上用户输入的query包括“我要喝咖啡”,则任务信息还可以是“我要喝咖啡”。历史对话信息还可以本文档来自技高网...

【技术保护点】
1.一种对话理解方法,包括:/n获取对话信息;/n获取所述对话信息对应的当前任务的任务信息;/n采用对话理解模型,基于所述当前任务的任务信息对所述对话信息进行处理,以获得对话理解结果。/n

【技术特征摘要】
1.一种对话理解方法,包括:
获取对话信息;
获取所述对话信息对应的当前任务的任务信息;
采用对话理解模型,基于所述当前任务的任务信息对所述对话信息进行处理,以获得对话理解结果。


2.根据权利要求1所述的方法,其中,所述任务信息包括预设的关键字,所述关键字为至少一个,所述采用对话理解模型,基于所述当前任务的任务信息对所述对话信息进行处理,以获得对话理解结果,包括:
采用对话理解模型,将所述对话信息与所述至少一个关键字中的各个关键字进行匹配,以获得所述各个关键字对应的值,将所述各个关键字对应的值作为对话理解结果。


3.根据权利要求2所述的方法,其中,所述关键字包括任务名和任务属性,所述对话理解模型包括:输入层、隐层和输出层,所述采用对话理解模型,将所述对话信息与所述至少一个关键字中的各个关键字进行匹配,以获得所述各个关键字对应的值,包括:
采用所述输入层,将所述对话信息转换为对话输入向量,将所述任务名转换为任务名输入向量,将所述任务属性转换为任务属性输入向量;
采用所述隐层,分别匹配所述对话输入向量和所述任务名输入向量,以及所述对话输入向量和所述任务属性输入向量,以获得隐层输出向量;
采用所述输出层,对所述隐层输出向量进行处理,以获得所述任务名对应的值,以及所述任务属性对应的值。


4.根据权利要求3所述的方法,其中,所述输出层包括分类层和序列标注层,所述隐层输出向量包括第一隐层输出向量和第二隐层输出向量,所述采用所述输出层,对所述隐层输出向量进行处理,以获得所述任务名对应的值,以及所述任务属性对应的值,包括:
采用所述分类层对所述第一隐层输出向量进行处理,以获得分类结果,所述分类结果包括:第一分类结果,或者,第二分类结果,所述第一分类结果用于表明所述对话信息中是否包含与所述任务名一致的信息,所述第二分类结果用于表明所述对话信息中是否包含与所述任务属性一致的信息;
若所述分类结果为所述第一分类结果,将所述第一分类结果作为所述任务名对应的值;
若所述分类结果为所述第二分类结果,且所述第二分类结果表明所述对话信息中包含与所述任务属性一致的信息,采用所述序列标注层对所述第二隐层输出向量进行处理,以获得序列标注结果,将所述序列标注结果作为所述任务属性对应的值。


5.一种对话理解模型的训练方法,包括:
获取训练数据,所述训练数据包括:对话信息样本和目标任务的任务信息;
采用所述训练数据,训练对话理解模型。


6.根据权利要求5所述的方法,其中,所述采用所述训练数据,训练对话理解模型,包括:
基于所述对话信息样本对应的对话状态,获得所述目标任务的任务信息对应的正例和负例;
采用所述正例和负例,训练对话理解模型。


7.根据权利要求6所述的方法,其中,所述对话状态包括意图名和词槽名,所述基于所述对话信息样本对应的对话状态,获得所述目标任务的任务信息对应的正例和负例,包括:
若所述目标任务的任务信息包括目标任务名,将意图名与所述目标任务名一致的对话信息样本,作为所述目标任务名对应的正例,将意图名与所述目标任务名不一致的对话信息样本,作为所述目标任务名对应的负例;和/或,
若所述目标任务的任务信息包括目标任务属性,将词槽名与所述目标任务属性一致的对话信息样本,作为所述目标任务属性对应的正例,将词槽名与所述目标任务属性不一致的对话信息样本,作为所述目标任务属性对应的负例。


8.一种对话理解装置,包括:
第一获取模块,用于获取对话信息;
第二获取模块,用于获取所...

【专利技术属性】
技术研发人员:于振龙孙辉丰孙叔琦常月李婷婷
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1