动态对话状态图学习方法、装置、系统及存储介质制造方法及图纸

技术编号:37332700 阅读:11 留言:0更新日期:2023-04-21 23:10
本发明专利技术公开了一种动态对话状态图学习方法、装置、系统及存储介质,该方法包括获取当前对话话语的表示;对所述当前对话话语的表示进行增强处理;其中,所述增强处理包括结构化增强表示和非结构化增强表示;根据当前对话话语的表示,生成对话状态图,并将新对话话语对应的新节点加入对话状态图,以动态地更新对话状态图;基于更新后的对话状态图,确定对话整体的状态表示。本发明专利技术针对多轮对话的特征,通过动态地生成更新对话状态图,并能为对话话语生成表示,对话状态图和这些表示可以被利用到对话系统中,有效提升对话话语的学习和表示能力,解决了目前对话状态图生成忽略了当前对话整体状态对话语标识产生影响的技术问题。整体状态对话语标识产生影响的技术问题。整体状态对话语标识产生影响的技术问题。

【技术实现步骤摘要】
动态对话状态图学习方法、装置、系统及存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及到一种动态对话状态图学习方法、装置、系统及存储介质。

技术介绍

[0002]随着深度学习的快速发展,自然语言处理领域中的各种任务的效果都得到了提升。在自然语言处理的多轮对话的研究中,最基本且最具有挑战性的任务类型是对话理解,其作用是使机器能够阅读和理解上下文。与纯文本阅读相比,多轮对话中经常存在交叉依赖关系,即在对话中说话者的转换是随机的,打破了普通非对话文本的连续性,并且话语的顺序影响着对话的模式,不同时刻发生的对话话语也对多轮对话的理解有不同的贡献,总的来说,最近说出的话语将更具有决定性。与单轮对话相比,多轮对话的话语可能会省略之前话语提到过的信息,或是用代词替代,这增加了机器理解对话话语的难度。最重要的,在一个对话历史中可能会有多个对话话题,并且在对话中话题的转变是很常见且难以检测的。
[0003]在以往处理多轮对话话语的方法中,大多数方法将话语表示输入到RNN中,如LSTM、GRU,来编码多轮对话中新发生的话语。这种方式虽然能够对多轮对话进行表示,但是它将对话的结构统一看作是一条链,然而基于多轮对话的特性,对话结构应该会更复杂。之后有人提出了对更复杂的对话结构进行编码,并根据对话结构来增强话语表示,大量实验证明了这种方法的有效性。而在对话结构生成的模型中,目前的方法是直接将新话语的单词表示输入到LSTM或Bi

LSTM中来获取话语表示,这种方式忽略了当前对话整体状态对话语表示产生的影响,这样可能会使机器在对新的话语进行理解时忽略一些信息,导致机器不能很好的理解话语并更新对话状态图。
[0004]因此需要设计一种动态对话状态图学习的方法,能够在对话语进行表示时更好地考虑对话结构和对话历史信息,并更好地生成更新对话状态图。

技术实现思路

[0005]本专利技术的主要目的在于提供一种动态对话状态图学习方法、装置、系统及存储介质,旨在解决目前对话状态图生成忽略了当前对话整体状态对话语标识产生影响的技术问题。
[0006]为实现上述目的,本专利技术提供一种动态对话状态图学习方法,所述方法包括以下步骤:获取当前对话话语的表示;对所述当前对话话语的表示进行增强处理;其中,所述增强处理包括结构化增强表示和非结构化增强表示;根据当前对话话语的表示,生成对话状态图,并将新对话话语对应的新节点加入对话状态图,以动态地更新对话状态图;
基于更新后的对话状态图,确定对话整体的状态表示。
[0007]可选的,所述获取当前对话话语的表示步骤,具体包括:将当前对话话语中单词的初始表示和对话整体状态的表示输入到BERT,通过BERT来获取对话话语中单词的表示,再将单词的表示输入到Bi

LSTM中来获取对话话语的表示。
[0008]可选的,所述结构化增强表示,具体包括:按照已有的对话状态图中根节点到新对话话语对应节点的路径,将路径中的对话话语表示输入到LSTM,以获取当前话语的结构化增强表示。
[0009]可选的,所述非结构化增强表示,具体包括:按照对话话语发生的顺序将对话话语表示输入到LSTM,以获得当前话语的非结构化增强表示。
[0010]可选的,所述将新对话话语对应的新节点加入对话状态图,以动态地更新对话状态图,具体包括:将新对话话语的表示与对话状态图中存在的节点话语的结构化增强表示和非结构化表示连接,根据连接的表示分别使用两个神经网络来判断新节点与已存在的哪个节点连接,以及连接的边的类型。
[0011]可选的,所述根据连接的表示分别使用两个神经网络来判断新节点与已存在的哪个节点连接,以及连接的边的类型步骤,具体包括:将新对话话语的表示、非结构化表示和对话状态图中存在的对话话语的非结构化表示、结构化增强表示连接,并计算所有已存在节点的分数,将分数最高的节点作为新节点的父节点,并将新节点添加到对话状态图中,表达式具体为:;其中,当前添加的新节点为j,目前图中已存在的各个节点为k,为节点j的话语表示,、分别为节点j和节点k的非结构化增强表示,为节点k的结构化增强表示,为连接操作,为上述表示的连接,用于之后计算节点k的分数,为一个两层的神经网络,为节点k的分数;计算新节点与其父节点连接边的类型,选择分数最高的类型作为新节点和其父节点连接的边的类型,表达式具体为:;其中为新节点j的话语表示、非结构化增强表示和其父节点k的结构化增强表示、非结构化增强表示的连接,为每个边类型的分数向量。
[0012]可选的,所述基于更新后的对话状态图,确定对话整体的状态表示,具体包括:通过Tree

structure LSTM对对话状态图中的节点进行一次编码,最后取根节点的Tree

structure LSTM输出来作为对话整体状态的表示。
[0013]此外,为了实现上述目的,本专利技术还提供了一种动态对话状态图学习装置,所述动态对话状态图学习装置包括:获取模块,用于获取当前对话话语的表示;
增强处理模块,用于对所述当前对话话语的表示进行增强处理;其中,所述增强处理包括结构化增强表示和非结构化增强表示;更新模块,用于根据当前对话话语的表示,生成对话状态图,并将新对话话语对应的新节点加入对话状态图,以动态地更新对话状态图;确定模块,用于基于更新后的对话状态图,确定对话整体的状态表示。
[0014]此外,为了实现上述目的,本专利技术还提供了一种动态对话状态图学习系统,所述系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的动态对话状态图学习程序,所述动态对话状态图学习程序被所述处理器执行时实现如上所述的动态对话状态图学习方法的步骤。
[0015]此外,为了实现上述目的,本专利技术还提供了一种存储介质,所述存储介质上存储有动态对话状态图学习程序,所述动态对话状态图学习程序被处理器执行时实现如上所述的动态对话状态图学习方法的步骤。
[0016]本专利技术实施例提出的一种动态对话状态图学习方法、装置、系统及存储介质,该方法包括获取当前对话话语的表示;对所述当前对话话语的表示进行增强处理;其中,所述增强处理包括结构化增强表示和非结构化增强表示;根据当前对话话语的表示,生成对话状态图,并将新对话话语对应的新节点加入对话状态图,以动态地更新对话状态图;基于更新后的对话状态图,确定对话整体的状态表示。本专利技术针对多轮对话的特征,通过动态地生成更新对话状态图,并能为对话话语生成表示,对话状态图和这些表示可以被利用到对话系统中,有效提升对话话语的学习和表示能力,解决了目前对话状态图生成忽略了当前对话整体状态对话语标识产生影响的技术问题。
附图说明
[0017]图1为本专利技术实施例中一种动态对话状态图学习系统的结构示意图。
[0018]图2为本专利技术实施例中一种动态对话状态图学习方法的流程示意图。
[0019]图3为本专利技术实施例中一种动态对话状态图学习方法的实例示意图。
[0020]图4本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种动态对话状态图学习方法,其特征在于,所述方法包括以下步骤:获取当前对话话语的表示;对所述当前对话话语的表示进行增强处理;其中,所述增强处理包括结构化增强表示和非结构化增强表示;根据当前对话话语的表示,生成对话状态图,并将新对话话语对应的新节点加入对话状态图,以动态地更新对话状态图;基于更新后的对话状态图,确定对话整体的状态表示。2.如权利要求1所述的动态对话状态图学习方法,其特征在于,获取当前对话话语的表示步骤,具体包括:将当前对话话语中单词的初始表示和对话整体状态的表示输入到BERT,通过BERT来获取对话话语中单词的表示,再将单词的表示输入到Bi

LSTM中来获取对话话语的表示。3.如权利要求1所述的动态对话状态图学习方法,其特征在于,所述结构化增强表示,具体包括:按照已有的对话状态图中根节点到新对话话语对应节点的路径,将路径中的对话话语表示输入到LSTM,以获取当前话语的结构化增强表示。4.如权利要求1所述的动态对话状态图学习方法,其特征在于,所述非结构化增强表示,具体包括:按照对话话语发生的顺序将对话话语表示输入到LSTM,以获得当前话语的非结构化增强表示。5.如权利要求1所述的动态对话状态图学习方法,其特征在于,所述将新对话话语对应的新节点加入对话状态图,以动态地更新对话状态图,具体包括:将新对话话语的表示与对话状态图中存在的节点话语的结构化增强表示和非结构化表示连接,根据连接的表示分别使用两个神经网络来判断新节点与已存在的哪个节点连接,以及连接的边的类型。6.如权利要求5所述的动态对话状态图学习方法,其特征在于,所述根据连接的表示分别使用两个神经网络来判断新节点与已存在的哪个节点连接,以及连接的边的类型步骤,具体包括:将新对话话语的表示、非结构化表示和对话状态图中存在的对话话语的非结构化表示、结构化增强表示连接,并计算所有已存在节点的分数,将分数最高的节点作为新节点的父节点,并将新节点添加到对话状态图中,...

【专利技术属性】
技术研发人员:周正斌王震花福军钟凯肖美虹
申请(专利权)人:创意信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1