动态对话状态图学习方法、装置、系统及存储介质制造方法及图纸

技术编号：37332700 阅读：11 留言：0更新日期：2023-04-21 23:10

本发明专利技术公开了一种动态对话状态图学习方法、装置、系统及存储介质，该方法包括获取当前对话话语的表示；对所述当前对话话语的表示进行增强处理；其中，所述增强处理包括结构化增强表示和非结构化增强表示；根据当前对话话语的表示，生成对话状态图，并将新对话话语对应的新节点加入对话状态图，以动态地更新对话状态图；基于更新后的对话状态图，确定对话整体的状态表示。本发明专利技术针对多轮对话的特征，通过动态地生成更新对话状态图，并能为对话话语生成表示，对话状态图和这些表示可以被利用到对话系统中，有效提升对话话语的学习和表示能力，解决了目前对话状态图生成忽略了当前对话整体状态对话语标识产生影响的技术问题。整体状态对话语标识产生影响的技术问题。整体状态对话语标识产生影响的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
动态对话状态图学习方法、装置、系统及存储介质

[0001]本专利技术涉及自然语言处理
，尤其涉及到一种动态对话状态图学习方法、装置、系统及存储介质。

技术介绍

[0002]随着深度学习的快速发展，自然语言处理领域中的各种任务的效果都得到了提升。在自然语言处理的多轮对话的研究中，最基本且最具有挑战性的任务类型是对话理解，其作用是使机器能够阅读和理解上下文。与纯文本阅读相比，多轮对话中经常存在交叉依赖关系，即在对话中说话者的转换是随机的，打破了普通非对话文本的连续性，并且话语的顺序影响着对话的模式，不同时刻发生的对话话语也对多轮对话的理解有不同的贡献，总的来说，最近说出的话语将更具有决定性。与单轮对话相比，多轮对话的话语可能会省略之前话语提到过的信息，或是用代词替代，这增加了机器理解对话话语的难度。最重要的，在一个对话历史中可能会有多个对话话题，并且在对话中话题的转变是很常见且难以检测的。
[0003]在以往处理多轮对话话语的方法中，大多数方法将话语表示输入到RNN中，如LSTM、GRU，来编码多轮对话中新发生的话语。这种方式虽然能够对多轮对话进行表示，但是它将对话的结构统一看作是一条链，然而基于多轮对话的特性，对话结构应该会更复杂。之后有人提出了对更复杂的对话结构进行编码，并根据对话结构来增强话语表示，大量实验证明了这种方法的有效性。而在对话结构生成的模型中，目前的方法是直接将新话语的单词表示输入到LSTM或Bi
‑
LSTM中来获取话语表示，这种方式忽略了当前对话整体状态对话语表示产生的...

【技术保护点】

【技术特征摘要】
1.一种动态对话状态图学习方法，其特征在于，所述方法包括以下步骤：获取当前对话话语的表示；对所述当前对话话语的表示进行增强处理；其中，所述增强处理包括结构化增强表示和非结构化增强表示；根据当前对话话语的表示，生成对话状态图，并将新对话话语对应的新节点加入对话状态图，以动态地更新对话状态图；基于更新后的对话状态图，确定对话整体的状态表示。2.如权利要求1所述的动态对话状态图学习方法，其特征在于，获取当前对话话语的表示步骤，具体包括：将当前对话话语中单词的初始表示和对话整体状态的表示输入到BERT，通过BERT来获取对话话语中单词的表示，再将单词的表示输入到Bi
‑
LSTM中来获取对话话语的表示。3.如权利要求1所述的动态对话状态图学习方法，其特征在于，所述结构化增强表示，具体包括：按照已有的对话状态图中根节点到新对话话语对应节点的路径，将路径中的对话话语表示输入到LSTM，以获取当前话语的结构化增强表示。4.如权利要求1所述的动态对话状态图学习方法，其特征在于，所述非结构化增强表示，具体包括：按照对话话语发生的顺序将对话话语表示输入到LSTM，以获得当前话语的非结构化增强表示。5.如权利要求1所述的动态对话状态图学习方法，其特征在于，所述将新对话话语对应的新节点加入对话状态图，以动态地更新对话状态图，具体包括：将新对话话语的表示与对话状态图中存在的节点话语的结构化增强表示和非结构化表示连接，根据连接的表示分别使用两个神经网络来判断新节点与已存在的哪个节点连接，以及连接的边的类型。6.如权利要求5所述的动态对话状态图学习方法，其特征在于，所述根据连接的表示分别使用两个神经网络来判断新节点与已存在的哪个节点连接，以及连接的边的类型步骤，具体包括：将新对话话语的表示、非结构化表示和对话状态图中存在的对话话语的非结构化表示、结构化增强表示连接，并计算所有已存在节点的分数，将分数最高的节点作为新节点的父节点，并将新节点添加到对话状态图中，...

【专利技术属性】
技术研发人员：周正斌，王震，花福军，钟凯，肖美虹，
申请(专利权)人：创意信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人