一种基于记忆网络的对话策略状态跟踪方法及系统技术方案

技术编号:31021500 阅读:13 留言:0更新日期:2021-11-30 03:10
本发明专利技术提供的一种基于记忆网络的对话策略状态跟踪方法及系统,跟踪方法包括:网络模型包括多个记忆数组;获取原始对话语言文本;将原始对话语言文本预处理,获得神经网络里内在的词向量;将词向量存储在所述记忆数组的下一个位置;根据词向量在所有记忆数组中选择出最相关的k个记忆单元;获取原始对话语言文本和最相关的k个记忆单元,获得相关记忆参数;使用评分函数计算候选词与相关记忆参数的相关性,获得计算得分;获取计算得分中最相关的语言文本。强化模型的记忆存储能力,使得整个对话系统保留更多的语义信息,提升了对话机器人对意图的理解和对关键信息的把握。提升了对话机器人对任务的理解。机器人对任务的理解。机器人对任务的理解。

【技术实现步骤摘要】
一种基于记忆网络的对话策略状态跟踪方法及系统


[0001]本专利技术涉及对话沟通领域,尤其涉及一种基于记忆网络的对话策略状态跟踪方法及系统。

技术介绍

[0002]随着移动互联网和智能终端的快速发展,任务型人机对话系统在工业界的应用越来越广泛。对话系统会面向某一个任务,具备处理一些业务的能力。对话系统首先能够理解人类给出的信息,将其表示为一个内部状态,然后根据策略和对话状态选择一些动作,最后把动作转化为自然语言的表达形式。
[0003]对话状态跟踪是对话系统的主要模块之一,目标是追踪用户需求并判断当前的对话状态。对于对话系统来说,这一模块有着重大意义,很多时候要综合考虑用户的输入才能理解用户的真正需求。
[0004]传统的循环神经网络、长短期记忆等模型的隐藏状态或者任务机制的记忆存储能力太弱,无法精确记录一段话中所表达的全部内容,很容易丢失一部分语义信息。

技术实现思路

[0005]鉴于上述问题,提出了本专利技术以便提供克服上述问题或者至少部分地解决上述问题的一种基于记忆网络的对话策略状态跟踪方法及系统。
[0006]根据本专利技术的一个方面,提供了一种基于记忆网络的对话策略状态跟踪方法,所述跟踪方法包括:网络模型包括多个记忆数组;
[0007]获取原始对话语言文本;
[0008]将所述原始对话语言文本预处理,获得神经网络里内在的词向量;
[0009]将所述词向量存储在所述记忆数组的下一个位置;
[0010]根据所述词向量在所有记忆数组中选择出最相关的k个记忆单元;
[0011]获取所述原始对话语言文本和所述最相关的k个记忆单元,获得相关记忆参数;
[0012]使用评分函数计算候选词与所述相关记忆参数的相关性,获得计算得分;
[0013]获取所述计算得分中最相关的语言文本。
[0014]可选的,所述将所述原始对话语言文本预处理,获得神经网络里内在的词向量具体包括:
[0015]采用文本输入解析、共参考和实体解析进行标准化预处理;
[0016]将所述原始文本x转化为内部词向量I(x)。
[0017]可选的,所述将所述词向量存储在所述记忆数组的下一个位置具体包括:直接写入新的记忆,对原有的记忆不做更新;
[0018][0019]m
N
=x;
[0020]N=N+1;
[0021]其中x为原始文本,I(x)为经过转换后的内部词向量,m为记忆数组,i,N为第几条数据。
[0022]可选的,所述使用评分函数计算候选词与所述相关记忆参数,获得计算得分具体包括:
[0023]根据所述原始文本x和选出的最相关的k个记忆单元m
oi
,获取相关记忆参数为[x,m
o1
,m
o2
];
[0024]使用评分函数计算所有候选词与所述相关记忆参数的相关性;
[0025]获取最相关的结果r=argmax
ωεW
S
R
([x,m
o1
,m
o2
],ω);
[0026]其中ω为候选词,W为字典中所有候选词集合,S
R
是计算得分的函数;
[0027]评分函数S
O
和S
R
具有相同的形式,满足以下条件:
[0028]s(x,y)=Φ
x
(x)
T
U
T

y
(y)
[0029]U是n
×
D矩阵,其中n是维数,D是特征的个数,Φ
x
和Φ
y
的作用是从原始文本映射到D维特征空间。
[0030]一种基于记忆网络的对话策略状态跟踪系统,所述跟踪系统具体包括:
[0031]信息输入模块,用于获取原始对话语言文本;将所述原始对话语言文本预处理,获得神经网络里内在的词向量;
[0032]归纳总结模块,用于将所述词向量存储在所述记忆数组的下一个位置;
[0033]记忆数组单元,用于根据所述词向量在所有记忆数组中选择出最相关的k个记忆单元;获取所述原始对话语言文本和所述最相关的k个记忆单元,获得相关记忆参数;
[0034]输出模块,用于使用评分函数计算候选词与所述相关记忆参数的相关性,获得计算得分;
[0035]评价结果输出模块,用于获取所述计算得分中最相关的语言文本。
[0036]本专利技术提供的一种基于记忆网络的对话策略状态跟踪方法,所述跟踪方法包括:网络模型包括多个记忆数组;获取原始对话语言文本;将所述原始对话语言文本预处理,获得神经网络里内在的词向量;将所述词向量存储在所述记忆数组的下一个位置;根据所述词向量在所有记忆数组中选择出最相关的k个记忆单元;获取所述原始对话语言文本和所述最相关的k个记忆单元,获得相关记忆参数;使用评分函数计算候选词与所述相关记忆参数的相关性,获得计算得分;获取所述计算得分中最相关的语言文本。强化模型的记忆存储能力,使得整个对话系统保留更多的语义信息,提升了对话机器人对意图的理解和对关键信息的把握。提升了对话机器人对任务的理解。
[0037]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0038]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0039]图1为本专利技术实施例提供的一种基于记忆网络的对话策略状态跟踪方法的流程图;
[0040]图2为本专利技术一种基于记忆网络的对话策略状态跟踪系统的组成框图。
具体实施方式
[0041]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0042]本专利技术的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
[0043]下面结合附图和实施例,对本专利技术的技术方案做进一步的详细描述。
[0044]如图1所示,一种基于记忆网络的对话策略状态跟踪方法,所述跟踪方法包括:网络模型包括多个记忆数组;
[0045]获取原始对话语言文本;将所述原始对话语言文本预处理,获得神经网络里内在的词向量;采用文本输入解析、共参考和实体解析进行标准化预处理;将所述原始文本x转本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于记忆网络的对话策略状态跟踪方法,其特征在于,所述跟踪方法包括:网络模型包括多个记忆数组;获取原始对话语言文本;将所述原始对话语言文本预处理,获得神经网络里内在的词向量;将所述词向量存储在所述记忆数组的下一个位置;根据所述词向量在所有记忆数组中选择出最相关的k个记忆单元;获取所述原始对话语言文本和所述最相关的k个记忆单元,获得相关记忆参数;使用评分函数计算候选词与所述相关记忆参数的相关性,获得计算得分;获取所述计算得分中最相关的语言文本。2.根据权利要求1所述的一种基于记忆网络的对话策略状态跟踪方法,其特征在于,所述将所述原始对话语言文本预处理,获得神经网络里内在的词向量具体包括:采用文本输入解析、共参考和实体解析进行标准化预处理;将所述原始文本x转化为内部词向量I(x)。3.根据权利要求1所述的一种基于记忆网络的对话策略状态跟踪方法,其特征在于,所述将所述词向量存储在所述记忆数组的下一个位置具体包括:直接写入新的记忆,对原有的记忆不做更新;m
N
=x;N=N+1;其中x为原始文本,I(x)为经过转换后的内部词向量,m为记忆数组,i,N为第几条数据。4.根据权利要求1所述的一种基于记忆网络的对话策略状态跟踪方法,其特征在于,所述使用评分函数计算候选词与所述相关记忆参数,获得计算得分具体包括:根据所述原始文本x和选出的最相关的k个记忆单元m
oi
,获取相关记忆参数为[x,m
o1
,m
o2
...

【专利技术属性】
技术研发人员:郑颖龙叶杭周昉昉许鑫禹刘佳木陈颖璇林嘉鑫张乐然刘清源
申请(专利权)人:广东电力信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1