对话信息的意图识别方法、装置、设备及存储介质制造方法及图纸

技术编号：35278218 阅读：28 留言：0更新日期：2022-10-22 12:20

本申请公开了一种对话信息的意图识别方法、装置、设备及存储介质，属于人工智能技术领域。所述方法包括：获取待识别的对话文本；对对话文本进行特征提取处理，得到对话文本的特征信息；对特征信息进行多维度分类编码，将特征信息中的多个离散特征变量转换为连续特征变量，得到特征信息的多维度特征向量；对多维度特征向量分别进行分类处理，得到特征信息的多维度分类结果；对多维度分类结果进行融合识别处理，确定对话文本的意图识别结果。本申请中，从多个维度进行分析处理确定意图识别结果，能够提升意图识别结果的准确性，将多个离散特征变量转换为多维度的连续特征变量，能够有效地减少后续特征处理过程中的信息损失。减少后续特征处理过程中的信息损失。减少后续特征处理过程中的信息损失。

全部详细技术资料下载

【技术实现步骤摘要】
对话信息的意图识别方法、装置、设备及存储介质

[0001]本申请涉及人工智能
，特别涉及一种对话信息的意图识别方法、装置、设备及存储介质。

技术介绍

[0002]任务导向型对话是指人工智能与用户之间的自动交流对话。在任务导向型对话中，需要对用户输入的对话文本进行意图识别，以向用户反馈合适的应答文本。
[0003]在相关技术中，在任务导向型对话的应用过程中，自动应答系统会提前确定好固定的应答文本，进而在获取用户输入的对话文本之后，依据预先设定好的关键词提取规则确定该对话文本中的关键词，基于该对话文本中的关键词，确定该关键词对应的下一句应答文本，进而向用户展示该下一句应答文本，以此来实现自动对话。
[0004]然而，在上述相关技术中，关键词并不能够完整且准确地反映出用户输入的对话文本的语义信息，从而导致对用户输入的对话文本的意图识别不够准确。

技术实现思路

[0005]本申请实施例提供了一种对话信息的意图识别方法、装置、设备及存储介质，能够提升意图识别结果的准确性。所述技术方案如下：
[0006]根据本申请实施例的一个方面，提供了一种对话信息的意图识别方法，所述方法包括：
[0007]获取待识别的对话文本；
[0008]对所述对话文本进行特征提取处理，得到所述对话文本的特征信息；其中，所述特征信息中包括多个离散特征变量；
[0009]对所述特征信息进行多维度分类编码，将所述特征信息中的多个离散特征变量转换为连续特征变量，得到所述...

【技术保护点】

【技术特征摘要】
1.一种对话信息的意图识别方法，其特征在于，所述方法包括：获取待识别的对话文本；对所述对话文本进行特征提取处理，得到所述对话文本的特征信息；其中，所述特征信息中包括多个离散特征变量；对所述特征信息进行多维度分类编码，将所述特征信息中的多个离散特征变量转换为连续特征变量，得到所述特征信息的多维度特征向量；其中，所述多维度特征向量包括多个不同维度的连续特征变量；对所述多维度特征向量分别进行分类处理，得到所述特征信息的多维度分类结果，所述多维度分类结果包括所述多个不同维度的分类结果；对所述多维度分类结果进行融合识别处理，确定所述对话文本的意图识别结果。2.根据权利要求1所述的方法，其特征在于，所述多维度特征向量包括领域特征向量、动作特征向量和实体名词特征向量；其中，所述领域特征向量用于指示所述对话文本所属的领域，所述动作特征向量用于指示所述对话文本的输入者待执行的动作，所述实体名词特征向量用于指示与所述领域和所述动作相关联的实体名词。3.根据权利要求1所述的方法，其特征在于，所述对所述多维度特征向量分别进行分类处理，得到所述特征信息的多维度分类结果，包括：针对目标维度，采用均值计算网络对目标维度特征向量进行处理，获取所述目标维度特征向量的均值向量；其中，所述均值向量用于指示所述目标维度特征向量在空间上的分布均值；采用方差计算网络对所述目标维度特征向量进行处理，获取所述目标维度特征向量的方差向量；其中，所述方差向量用于指示所述目标维度特征向量在空间上的分布方差；采用目标噪声对所述方差向量进行噪声叠加处理，得到处理后的方差向量；基于所述均值向量和所述处理后的方差向量，确定所述目标维度特征向量对应的待分类特征向量；对所述待分类特征向量进行分类处理，得到所述特征信息的目标维度分类结果。4.根据权利要求1至3任一项所述的方法，其特征在于，所述对所述多维度分类结果进行融合识别处理，确定所述对话文本的意图识别结果之后，还包括：根据所述意图识别结果，从对话文本库中获取与所述意图识别结果相关联的应答文本作为候选应答文本；在所述候选应答文本的数量不唯一的情况下，获取各个所述候选应答文本的质量评价指标；从所述候选应答文本中，选择所述质量评价指标满足条件的候选应答文本作为所述对话文本对应的应答文本。5.一种意图识别模型的训练方法，其特征在于，所述方法包括：获取意图识别模型的至少一个训练样本，所述训练样本包括样本对话文本和所述样本对话文本对应的标签信息；对所述样本对话文本进行特征提取处理，得到所述样本对话文本的特征信息；其中，所述特征信息中包括多个离散特征变量；
对所述特征信息进行多维度分类编码，将所述特征信息中的多个离散特征变量转换为连续特征变量，得到所述特征信息的多维度特征向量；其中，所述多维度特征向量包括多个不同维度的连续特征变量；对所述多维度特征向量分别进行分类处理，得到所述特征信息的多维度分类结果，所述多维度分类结果包括所述多个不同维度的分类结果；对所述多维度分类结果进行融合识别处理，确定所述样本对话文本的意图识别结果；基于所述多维度分类结果、所述意图识别结果，以及所述样本对话文本对应的标签信息，计算所述意图识别模型的损失函数值；基于所述损失函数值对所述意图识别模型的参数进行调整。6.根据权利要求5所述的方法，其特征在于，所述多维度分类结果包括领域分类结果、动作分类结果和实体名词分类结果；所述标签信息包括所述样本对话文本对应的领域分类标签、动作分类标签和实体名词分类标签，以及所述样本对话文本对应的意图识别标签。7.根据权利要求6所述的方法，其特征在于，所述基于所述多维度分类结果、所述意图识别结果，以及所述样本对话文本对应的标签信息，计算所述意图识别模型的损失函数值，包括：基于所述领域分类结果、所述动作分类结果、所述实体名词分类结果，结合所述领域分类标签、所述动作分类标签和所述实体名词分类标签，确定所述意图识别模型对应的第一损失函数值；其中，第一损失函数用于衡量所述意图识别模型的多维度分类结果的准确度；基于所述意图识别结果和所述意图识别标签，确定所述意图识别模型对应的第二损失函数值；其中，第二损失函数用于衡量所述意图识别模型的意图识别结果的准确度；基于所述第一损失函数值和所述第二损失函数值，确定所述意图识别模型的损失函数值。8.根据权利要求7所述的方法，其特征在于，所述基于所述领域分类结果、所述动作分类结果、所述实体名词分类结果，结合所述领域分类标签、所述动作分类标签和所述实体名词分类标签，确定所述意图识别模型对应的第一损失函数值，包括：基于所述领域分类结果，结合所述领域分类标签、所述动作分类标签和所述实体名词分类标签，确定所述意图识别模型中领域分类器对应的损失函数值；基于所述动作分类结果，结合所述领域分类标签、所述动作分类标签和所述实体名词分类标签，确定所述意图识别模型中动作分类器对应的损失函数值；基于所述实体名词分类结果，结合所述领域分类标签、所述动作分类标签和所述实体名词分类标签，确定所述意图识别模型中实体名词分类器对应的损失函数值；根据所述领域分类器对应的损失函数值、...

【专利技术属性】
技术研发人员：侯政旭，刘亚飞，欧子菁，赵瑞辉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人