本申请实施例提供了一种用户意图识别方法、装置、设备以及存储介质,涉及计算机技术领域,旨在提高意图识别的效率和准确性,所述方法包括:获得待识别文本,以及多个候选意图各自的描述语句;对所述多个候选意图各自的描述语句进行处理,得到所述多个候选意图各自对应的句向量;对所述待识别文本中各个词语各自对应的词向量进行拼接,得到所述待识别文本对应的词向量序列;基于所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量,从所述多个候选意图中确定与所述待识别文本匹配的用户意图。匹配的用户意图。匹配的用户意图。
【技术实现步骤摘要】
用户意图识别方法、装置、对话系统、设备以及存储介质
[0001]本申请涉及计算机
,特别是涉及一种用户意图识别方法、装置、对话系统、设备及存储介质。
技术介绍
[0002]近年来,以对话系统为核心的产品,比如智能音箱、智能客服等,逐渐步入大众的视野,其中,在对话系统中涉及到机器人针对用户提出的问题进行解答,表现为用户问机器人回答的对话形式。如此,需要对用户提出的问题进行意图识别,以确定用户问问题的真实意图,进而向用户反馈匹配其真实意图的信息。
[0003]相关技术中,意图识别是指对输入的文本进行识别,以确定用户的真实意图,常用的方法是做文本分类,具体方式是将待识别的文本的向量与多个候选意图的描述语句的向量拼接后,输入到模型进行匹配,根据匹配的结果,得到用户真实的意图。
[0004]然而,采用这一方式时,往往受限于模型对输入的向量的最长长度限制,不适用于有大量候选意图的场景,存在意图识别效率低的问题。
技术实现思路
[0005]为了解决上述问题,本申请提供了一种用户意图识别方法、装置、对话系统、设备及存储介质,旨在提高意图识别的效率。
[0006]本公开实施例的第一方面,提供了一种用户意图识别方法,所述方法包括:
[0007]获得待识别文本,以及多个候选意图各自的描述语句;
[0008]对所述多个候选意图各自的描述语句进行处理,得到所述多个候选意图各自对应的句向量;
[0009]对所述待识别文本中各个词语各自对应的词向量进行拼接,得到所述待识别文本对应的词向量序列;
[0010]基于所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量,从所述多个候选意图中确定与所述待识别文本匹配的用户意图。
[0011]可选地,对所述多个候选意图各自的描述语句进行处理,得到所述多个候选意图各自对应的句向量,包括:
[0012]将所述多个候选意图各自的描述语句输入预先训练的向量转换模型,得到所述多个候选意图各自对应的句向量;
[0013]其中,所述向量转换模型是以多个样本意图各自对应的描述语句为训练数据,对第一预设模型进行训练得到的。
[0014]可选地,对所述多个候选意图各自的描述语句进行处理,得到所述多个候选意图各自对应的句向量,包括:
[0015]针对每个候选意图的描述语句,执行以下步骤:
[0016]获得该候选意图的描述语句中各个词语各自对应的词向量;
[0017]将所得到的多个词向量压缩为一个向量,得到该候选意图对应的句向量。
[0018]可选地,基于所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量,从所述多个候选意图中确定与所述待识别文本匹配的用户意图,包括:
[0019]对所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量进行拼接,得到第一拼接向量;
[0020]将所述第一拼接向量输入到第一意图识别模型,获得由所述第一意图识别模型输出的与所述待识别文本匹配的用户意图;
[0021]其中,所述第一意图识别模型是以多个携带标签的拼接向量样本为训练样本,对第二预设模型训练得到的;其中,所述拼接向量样本为样本文本的对应的词向量序列和多个样本候选意图各自对应的句向量拼接而成的,所述标签用于表征与所述拼接向量样本匹配的意图。
[0022]可选地,基于所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量,从所述多个候选意图中确定与所述待识别文本匹配的用户意图,包括:
[0023]对所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量进行拼接,得到第二拼接向量;
[0024]将所述第二拼接向量输入到第二意图识别模型,获得由所述第二意图识别模型输出的与所述待识别文本匹配的用户意图;
[0025]其中,所述第二意图识别模型是以多个携带双重标签的拼接向量样本为训练数据,对第三预设模型训练得到的;所述拼接向量样本为样本文本的对应的词向量序列和多个样本候选意图各自对应的句向量拼接而成的;
[0026]所述双重标签中的一种分类标签用于表征与所述拼接向量样本匹配的意图,另一种匹配标签用于表征所述多个样本候选意图各自对应的句向量与所述样本文本对应的词向量序列是否匹配。
[0027]可选地,所述第二意图识别模型是通过以下步骤得到:
[0028]将所述多个携带双重标签的拼接向量样本输入到所述第三预设模型;
[0029]获得所述第三预设模型输出的分类预测结果和匹配预测结果,其中,所述分类预测结果用于表征与所述拼接向量样本匹配的意图,所述匹配预测结果用于表征所述多个样本候选意图各自对应的句向量与所述样本文本对应的词向量序列是否匹配;
[0030]根据所述分类预测结果和所述分类标签,确定分类损失,以及根据所述匹配预测结果和所述匹配标签,确定匹配损失;
[0031]根据所述分类损失和所述匹配损失,对所述第三预设模型进行更新;
[0032]将多次更新后得到的第三预设模型确定为所述第二意图识别模型。
[0033]可选地,根据所述分类损失和所述匹配损失,对所述第三预设模型进行更新,包括:
[0034]根据所述分类损失对应的权重和所述匹配损失对应的权重,对所述分类损失和所述匹配损失进行融合,得到整体损失;
[0035]根据所述整体损失,对所述第三预设模型进行更新。
[0036]本公开实施例的第二方面,提供了一种用户意图识别装置,所述装置包括:
[0037]获得模块,用于获得待识别文本,以及多个候选意图各自的描述语句;
[0038]处理模块,用于对所述多个候选意图各自的描述语句进行处理,得到所述多个候选意图各自对应的句向量;
[0039]拼接模块,用于对所述待识别文本中各个词语各自对应的词向量进行拼接,得到所述待识别文本对应的词向量序列;
[0040]识别模块,用于基于所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量,从所述多个候选意图中确定与所述待识别文本匹配的用户意图。
[0041]本公开实施例的第三方面,提供了一种对话系统,包括语音识别模块、意图识别模块、对话模块;其中:
[0042]所述语音识别模块,用于将接收到待识别语音识别为待识别文本;
[0043]所述意图识别模块用于执行第一方面实施例所述的用户意图识别方法,以输出与所述待识别文本匹配的用户意图;
[0044]所述对话模块用于根据所述用户意图,输出自然语音。
[0045]本公开实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行时实现如第一方面所述的用户意图识别方法。
[0046]本公开实施例还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,能够执行上述第一方面中任一项所述的用户意图识别方法所执行的操作。
[0047本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种用户意图识别方法,其特征在于,所述方法包括:获得待识别文本,以及多个候选意图各自的描述语句;对所述多个候选意图各自的描述语句进行处理,得到所述多个候选意图各自对应的句向量;对所述待识别文本中各个词语各自对应的词向量进行拼接,得到所述待识别文本对应的词向量序列;基于所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量,从所述多个候选意图中确定与所述待识别文本匹配的用户意图。2.根据权利要求1所述的方法,其特征在于,对所述多个候选意图各自的描述语句进行处理,得到所述多个候选意图各自对应的句向量,包括:将所述多个候选意图各自的描述语句输入预先训练的向量转换模型,得到所述多个候选意图各自对应的句向量;其中,所述向量转换模型是以多个样本意图各自对应的描述语句为训练数据,对第一预设模型进行训练得到的。3.根据权利要求1所述的方法,其特征在于,对所述多个候选意图各自的描述语句进行处理,得到所述多个候选意图各自对应的句向量,包括:针对每个候选意图的描述语句,执行以下步骤:获得该候选意图的描述语句中各个词语各自对应的词向量;将所得到的多个词向量压缩为一个向量,得到该候选意图对应的句向量。4.根据权利要求1所述的方法,其特征在于,基于所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量,从所述多个候选意图中确定与所述待识别文本匹配的用户意图,包括:对所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量进行拼接,得到第一拼接向量;将所述第一拼接向量输入到第一意图识别模型,获得由所述第一意图识别模型输出的与所述待识别文本匹配的用户意图;其中,所述第一意图识别模型是以多个携带标签的拼接向量样本为训练样本,对第二预设模型训练得到的;其中,所述拼接向量样本为样本文本的对应的词向量序列和多个样本候选意图各自对应的句向量拼接而成的,所述标签用于表征与所述拼接向量样本匹配的意图。5.根据权利要求1所述的方法,其特征在于,基于所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量,从所述多个候选意图中确定与所述待识别文本匹配的用户意图,包括:对所述待识别文本对应的词向量序列和所述多个候选意图各自对应的句向量进行拼接,得到第二拼接向量;将所述第二拼接向量输入到第二意图识别模型,获得由所述第二意图识别模型输出的与所述待识别文本匹配的用户意图;其中,所述第二意图识别模型是以多个携带双重标签的拼接向量样本为训练数据,对第三预设模型训练得到的;所述拼接向量样本为样本文本的对应的词向量序列和多个样本
...
【专利技术属性】
技术研发人员:陈见耸,周乾琳,崔林燕,杨帆,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。