对话信息的意图识别方法、装置、设备及存储介质制造方法及图纸

技术编号:35278218 阅读:17 留言:0更新日期:2022-10-22 12:20
本申请公开了一种对话信息的意图识别方法、装置、设备及存储介质,属于人工智能技术领域。所述方法包括:获取待识别的对话文本;对对话文本进行特征提取处理,得到对话文本的特征信息;对特征信息进行多维度分类编码,将特征信息中的多个离散特征变量转换为连续特征变量,得到特征信息的多维度特征向量;对多维度特征向量分别进行分类处理,得到特征信息的多维度分类结果;对多维度分类结果进行融合识别处理,确定对话文本的意图识别结果。本申请中,从多个维度进行分析处理确定意图识别结果,能够提升意图识别结果的准确性,将多个离散特征变量转换为多维度的连续特征变量,能够有效地减少后续特征处理过程中的信息损失。减少后续特征处理过程中的信息损失。减少后续特征处理过程中的信息损失。

【技术实现步骤摘要】
对话信息的意图识别方法、装置、设备及存储介质


[0001]本申请涉及人工智能
,特别涉及一种对话信息的意图识别方法、 装置、设备及存储介质。

技术介绍

[0002]任务导向型对话是指人工智能与用户之间的自动交流对话。在任务导向型 对话中,需要对用户输入的对话文本进行意图识别,以向用户反馈合适的应答 文本。
[0003]在相关技术中,在任务导向型对话的应用过程中,自动应答系统会提前确 定好固定的应答文本,进而在获取用户输入的对话文本之后,依据预先设定好 的关键词提取规则确定该对话文本中的关键词,基于该对话文本中的关键词, 确定该关键词对应的下一句应答文本,进而向用户展示该下一句应答文本,以 此来实现自动对话。
[0004]然而,在上述相关技术中,关键词并不能够完整且准确地反映出用户输入 的对话文本的语义信息,从而导致对用户输入的对话文本的意图识别不够准确。

技术实现思路

[0005]本申请实施例提供了一种对话信息的意图识别方法、装置、设备及存储介 质,能够提升意图识别结果的准确性。所述技术方案如下:
[0006]根据本申请实施例的一个方面,提供了一种对话信息的意图识别方法,所 述方法包括:
[0007]获取待识别的对话文本;
[0008]对所述对话文本进行特征提取处理,得到所述对话文本的特征信息;其中, 所述特征信息中包括多个离散特征变量;
[0009]对所述特征信息进行多维度分类编码,将所述特征信息中的多个离散特征 变量转换为连续特征变量,得到所述特征信息的多维度特征向量;其中,所述 多维度特征向量包括多个不同维度的连续特征变量;
[0010]对所述多维度特征向量分别进行分类处理,得到所述特征信息的多维度分 类结果,所述多维度分类结果包括所述多个不同维度的分类结果;
[0011]对所述多维度分类结果进行融合识别处理,确定所述对话文本的意图识别 结果。
[0012]根据本申请实施例的一个方面,提供了一种意图识别模型的训练方法,所 述方法包括:
[0013]获取意图识别模型的至少一个训练样本,所述训练样本包括样本对话文本 和所述样本对话文本对应的标签信息;
[0014]对所述样本对话文本进行特征提取处理,得到所述样本对话文本的特征信 息;其中,所述特征信息中包括多个离散特征变量;
[0015]对所述特征信息进行多维度分类编码,将所述特征信息中的多个离散特征 变量转换为连续特征变量,得到所述特征信息的多维度特征向量;其中,所述 多维度特征向量
包括多个不同维度的特征向量,所述特征向量为连续特征变量;
[0016]对所述多维度特征向量分别进行分类处理,得到所述特征信息的多维度分 类结果,所述多维度分类结果包括多个不同维度的分类结果;
[0017]对所述多维度分类结果进行融合识别处理,确定所述对话文本的意图识别 结果;
[0018]基于所述多维度分类结果、所述意图识别结果,以及所述样本对话文本对 应的标签信息,计算所述意图识别模型的损失函数值;
[0019]基于所述损失函数值对所述对话信息的意图识别模型的参数进行调整。
[0020]根据本申请实施例的一个方面,提供了一种对话信息的意图识别装置,所 述装置包括:
[0021]文本获取模块,用于获取待识别的对话文本;
[0022]特征提取模块,用于对所述对话文本进行特征提取处理,得到所述对话文 本的特征信息;其中,所述特征信息中包括多个离散特征变量;
[0023]特征编码模块,用于对所述特征信息进行多维度分类编码,将所述特征信 息中的多个离散特征变量转换为连续特征变量,得到所述特征信息的多维度特 征向量;其中,所述多维度特征向量包括多个不同维度的连续特征变量;
[0024]特征分类模块,用于对所述多维度特征向量分别进行分类处理,得到所述 特征信息的多维度分类结果,所述多维度分类结果包括所述多个不同维度的分 类结果;
[0025]结果融合模块,用于对所述多维度分类结果进行融合识别处理,确定所述 对话文本的意图识别结果。
[0026]根据本申请实施例的一个方面,提供了一种意图识别模型的训练装置,所 述装置包括:
[0027]样本获取模块,用于获取意图识别模型的至少一个训练样本,所述训练样 本包括样本对话文本和所述样本对话文本对应的标签信息;
[0028]特征获取模块,用于对所述样本对话文本进行特征提取处理,得到所述样 本对话文本的特征信息;其中,所述特征信息中包括多个离散特征变量;
[0029]向量获取模块,用于对所述特征信息进行多维度分类编码,将所述特征信 息中的多个离散特征变量转换为连续特征变量,得到所述特征信息的多维度特 征向量;其中,所述多维度特征向量包括多个不同维度的特征向量,所述特征 向量为连续特征变量;
[0030]向量分类模块,用于对所述多维度特征向量分别进行分类处理,得到所述 特征信息的多维度分类结果,所述多维度分类结果包括多个不同维度的分类结 果;
[0031]结果获取模块,用于对所述多维度分类结果进行融合识别处理,确定所述 对话文本的意图识别结果;
[0032]函数值确定模块,用于基于所述多维度分类结果、所述意图识别结果,以 及所述样本对话文本对应的标签信息,计算所述意图识别模型的损失函数值;
[0033]参数调整模块,用于基于所述损失函数值对所述对话信息的意图识别模型 的参数进行调整。
[0034]根据本申请实施例的一个方面,本申请实施例提供了一种计算机设备,所 述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少 一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代 码集或指令集由所述处理器加
载并执行以实现上述对话信息的意图识别方法, 或实现上述意图识别模型的训练方法。
[0035]根据本申请实施例的一个方面,本申请实施例提供了一种计算机可读存储 介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指 令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器 加载并执行以实现上述对话信息的意图识别方法,或实现上述意图识别模型的 训练方法。
[0036]根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序, 该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机 可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指 令,处理器执行该计算机指令,使得该计算机设备执行上述对话信息的意图识 别方法,或实现上述意图识别模型的训练方法。
[0037]本申请实施例提供的技术方案可以带来如下有益效果:
[0038]通过对话文本的多维度分类编码、多维护分类处理,确定对话文本的多维 度分类结果,进而将多维度分类结果进行融合识别处理,确定对话文本的意图 识别结果,从多个维度进行分析处理确定意图识别结果本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话信息的意图识别方法,其特征在于,所述方法包括:获取待识别的对话文本;对所述对话文本进行特征提取处理,得到所述对话文本的特征信息;其中,所述特征信息中包括多个离散特征变量;对所述特征信息进行多维度分类编码,将所述特征信息中的多个离散特征变量转换为连续特征变量,得到所述特征信息的多维度特征向量;其中,所述多维度特征向量包括多个不同维度的连续特征变量;对所述多维度特征向量分别进行分类处理,得到所述特征信息的多维度分类结果,所述多维度分类结果包括所述多个不同维度的分类结果;对所述多维度分类结果进行融合识别处理,确定所述对话文本的意图识别结果。2.根据权利要求1所述的方法,其特征在于,所述多维度特征向量包括领域特征向量、动作特征向量和实体名词特征向量;其中,所述领域特征向量用于指示所述对话文本所属的领域,所述动作特征向量用于指示所述对话文本的输入者待执行的动作,所述实体名词特征向量用于指示与所述领域和所述动作相关联的实体名词。3.根据权利要求1所述的方法,其特征在于,所述对所述多维度特征向量分别进行分类处理,得到所述特征信息的多维度分类结果,包括:针对目标维度,采用均值计算网络对目标维度特征向量进行处理,获取所述目标维度特征向量的均值向量;其中,所述均值向量用于指示所述目标维度特征向量在空间上的分布均值;采用方差计算网络对所述目标维度特征向量进行处理,获取所述目标维度特征向量的方差向量;其中,所述方差向量用于指示所述目标维度特征向量在空间上的分布方差;采用目标噪声对所述方差向量进行噪声叠加处理,得到处理后的方差向量;基于所述均值向量和所述处理后的方差向量,确定所述目标维度特征向量对应的待分类特征向量;对所述待分类特征向量进行分类处理,得到所述特征信息的目标维度分类结果。4.根据权利要求1至3任一项所述的方法,其特征在于,所述对所述多维度分类结果进行融合识别处理,确定所述对话文本的意图识别结果之后,还包括:根据所述意图识别结果,从对话文本库中获取与所述意图识别结果相关联的应答文本作为候选应答文本;在所述候选应答文本的数量不唯一的情况下,获取各个所述候选应答文本的质量评价指标;从所述候选应答文本中,选择所述质量评价指标满足条件的候选应答文本作为所述对话文本对应的应答文本。5.一种意图识别模型的训练方法,其特征在于,所述方法包括:获取意图识别模型的至少一个训练样本,所述训练样本包括样本对话文本和所述样本对话文本对应的标签信息;对所述样本对话文本进行特征提取处理,得到所述样本对话文本的特征信息;其中,所述特征信息中包括多个离散特征变量;
对所述特征信息进行多维度分类编码,将所述特征信息中的多个离散特征变量转换为连续特征变量,得到所述特征信息的多维度特征向量;其中,所述多维度特征向量包括多个不同维度的连续特征变量;对所述多维度特征向量分别进行分类处理,得到所述特征信息的多维度分类结果,所述多维度分类结果包括所述多个不同维度的分类结果;对所述多维度分类结果进行融合识别处理,确定所述样本对话文本的意图识别结果;基于所述多维度分类结果、所述意图识别结果,以及所述样本对话文本对应的标签信息,计算所述意图识别模型的损失函数值;基于所述损失函数值对所述意图识别模型的参数进行调整。6.根据权利要求5所述的方法,其特征在于,所述多维度分类结果包括领域分类结果、动作分类结果和实体名词分类结果;所述标签信息包括所述样本对话文本对应的领域分类标签、动作分类标签和实体名词分类标签,以及所述样本对话文本对应的意图识别标签。7.根据权利要求6所述的方法,其特征在于,所述基于所述多维度分类结果、所述意图识别结果,以及所述样本对话文本对应的标签信息,计算所述意图识别模型的损失函数值,包括:基于所述领域分类结果、所述动作分类结果、所述实体名词分类结果,结合所述领域分类标签、所述动作分类标签和所述实体名词分类标签,确定所述意图识别模型对应的第一损失函数值;其中,第一损失函数用于衡量所述意图识别模型的多维度分类结果的准确度;基于所述意图识别结果和所述意图识别标签,确定所述意图识别模型对应的第二损失函数值;其中,第二损失函数用于衡量所述意图识别模型的意图识别结果的准确度;基于所述第一损失函数值和所述第二损失函数值,确定所述意图识别模型的损失函数值。8.根据权利要求7所述的方法,其特征在于,所述基于所述领域分类结果、所述动作分类结果、所述实体名词分类结果,结合所述领域分类标签、所述动作分类标签和所述实体名词分类标签,确定所述意图识别模型对应的第一损失函数值,包括:基于所述领域分类结果,结合所述领域分类标签、所述动作分类标签和所述实体名词分类标签,确定所述意图识别模型中领域分类器对应的损失函数值;基于所述动作分类结果,结合所述领域分类标签、所述动作分类标签和所述实体名词分类标签,确定所述意图识别模型中动作分类器对应的损失函数值;基于所述实体名词分类结果,结合所述领域分类标签、所述动作分类标签和所述实体名词分类标签,确定所述意图识别模型中实体名词分类器对应的损失函数值;根据所述领域分类器对应的损失函数值、...

【专利技术属性】
技术研发人员:侯政旭刘亚飞欧子菁赵瑞辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1