一种意图识别方法及装置、存储介质、计算机设备制造方法及图纸

技术编号:35412396 阅读:16 留言:0更新日期:2022-11-03 11:09
本发明专利技术公开了一种意图识别方法及装置、存储介质、计算机设备,涉及人工智能技术领域,主要目的在于解决现有的意图分类方法中由于类别的局限性导致的意图识别的准确率低的问题。包括:获取待识别意图的文本信息;若所述文本信息中未检测到前置匹配项,则将所述文本信息分别与包含目标意图的标准语句以及经各标准语句进行扩充的相似语句进行语义相似度处理,得到第一相似度值、第二相似度值;基于所述第一相似度值、所述第二相似度值之间的比较结果,从所述标准语句、所述相似语句中确定所述文本信息的意图。文本信息的意图。文本信息的意图。

【技术实现步骤摘要】
一种意图识别方法及装置、存储介质、计算机设备


[0001]本专利技术涉及一种人工智能
,特别是涉及一种意图识别方法及装置、存储介质、计算机设备。

技术介绍

[0002]随着人工智能技术的不断发展,对自然语言的识别与理解技术被应用到了生产与生活中,其中意图识别在越来越多的领域发挥着重要作用,诸如智能客服之类的对话产品。
[0003]目前,传统的意图识别方法主要是将用户话术预处理后直接放入意图分类模型进行分类,意图分类模型根据设定各个意图类别的相似度阈值,对意图进行分类,得到意图分类结果。但是,采用现有的意图识别方法需要提前对用户可能提出的意图进行分类,从而设定各个意图的相似度阈值。对于较开放的领域,提前对可能出现的用户意图进行分类存在局限性,提前定义的分类不能完全覆盖用户的意图,导致将用户意图勉强归并至提前定义好的有限的意图分类中,降低了意图识别的准确率。

技术实现思路

[0004]有鉴于此,本专利技术提供一种意图识别方法及装置、存储介质、计算机设备,主要目的在于解决现有的意图分类方法中由于类别的局限性导致的意图识别的准确率低的问题。
[0005]依据本专利技术一个方面,提供了一种意图识别方法,包括:
[0006]获取待识别意图的文本信息;
[0007]若所述文本信息中未检测到前置匹配项,则将所述文本信息分别与包含目标意图的标准语句以及经各标准语句进行扩充的相似语句进行语义相似度处理,得到第一相似度值、第二相似度值,所述前置匹配项包含不同匹配规则的匹配对象;
>[0008]基于所述第一相似度值、所述第二相似度值之间的比较结果,从所述标准语句、所述相似语句中确定所述文本信息的意图。
[0009]进一步的,所述获取待识别意图的文本信息之后,所述方法还包括:
[0010]将所述文本信息进行分词处理,得到所述文本信息中的分词;
[0011]基于所述前置匹配项中的匹配对象对所述分词进行检测;所述匹配对象包含关键词和/或适用所述匹配规则的词语、字符;所述匹配规则为进行语义匹配的规则;
[0012]若在所述分词中检测到所述匹配对象,则基于所述分词确定所述文本信息的意图。
[0013]进一步的,所述将所述文本信息分别与包含目标意图的标准语句以及经各标准语句进行扩充的相似语句进行语义相似度处理,得到第一相似度值、第二相似度值之前,所述方法还包括:
[0014]获取目标意图的标准语句,对所述标准语句的语法、语序、词语中的一项或多项进行语义相似扩充,得到多个相似语句;所述相似语句与所述标准语句表征相同的目标意图;
[0015]基于所述标准语句与所述相似语句,建立目标领域的意图识别库;
[0016]采用语言模型将所述标准语句和所述相似语句分别转换为第一句向量和第二句向量。
[0017]进一步的,所述采用语言模型将所述标准语句和所述相似语句分别转换为第一句向量和第二句向量之前,所述方法还包括:
[0018]采用文本语料对所述语言模型进行训练,得到用于句向量转换的所述语言模型。
[0019]进一步的,所述将所述文本信息分别与包含目标意图的标准语句以及经各标准语句进行扩充的相似语句进行语义相似度处理,得到第一相似度值、第二相似度值包括:
[0020]采用所述语言模型将所述文本信息转换为第三句向量;
[0021]采用余弦相似度计算所述第一句向量与所述第三句向量之间的语义相似度,得到第一相似度值;
[0022]采用所述余弦相似度计算所述第二句向量与所述第三句向量之间的语义相似度,得到第二相似度值。
[0023]进一步的,所述方法还包括:
[0024]从所述意图识别库中任意选取两条语句进行语义相似度处理,得到第三相似度值;
[0025]采用所述语言模型将所述两条语句分别转换为第四句向量和第五句向量,计算所述第四句向量和第五句向量之间差的绝对值,得到被选差向量;
[0026]基于所述第四句向量、所述第五句向量与所述被选差向量拼接的拼接向量进行语义相似度处理,得到第四相似度值;
[0027]将所述第三相似度值与所述第四相似度值之间的差值作为所述语言模型的的训练误差,基于所述训练误差,采用优化器对所述语言模型中的参数进行调整,以完成对所述语言模型的更新调整。
[0028]进一步的,所述基于所述第一相似度值、所述第二相似度值之间的比较结果,从所述标准语句、所述相似语句中确定所述文本信息的意图包括:
[0029]将所述第一相似度值与所述第二相似度值进行比较,得到最大相似度值;
[0030]若所述最大相似度值为所述第一相似度值,则将所述第一相似度值对应的第一目标标准语句确定为所述文本信息的意图;
[0031]若所述最大相似度值为所述第二相似度值,则根据所述第二相似度值确定目标相似语句,并基于所述目标相似语句确定扩充的第二目标标准语句,将所述第二目标标准语句确定为所述文本信息的意图。
[0032]依据本专利技术另一个方面,提供了一种意图识别装置,包括:
[0033]信息获取模块,用于获取待识别意图的文本信息;
[0034]相似度处理模块,用于若所述文本信息中未检测到前置匹配项,则将所述文本信息分别与包含目标意图的标准语句以及经各标准语句进行扩充的相似语句进行语义相似度处理,得到第一相似度值、第二相似度值,所述前置匹配项包含不同匹配规则的匹配对象;
[0035]意图确定模块,用于基于所述第一相似度值、所述第二相似度值之间的比较结果,从所述标准语句、所述相似语句中确定所述文本信息的意图。
[0036]依据本专利技术的又一方面,提供了一种存储介质,所述存储介质中存储有至少一可
执行指令,所述可执行指令使处理器执行如上述意图识别方法对应的操作。
[0037]依据本专利技术再一个方面,提供了一种计算机设备,包括处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
[0038]所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上述任一项所述的意图识别方法对应的操作。
[0039]借由上述技术方案,本专利技术实施例提供的技术方案至少具有下列优点:
[0040]本专利技术提供了一种意图识别方法及装置、存储介质、计算机设备,与现有技术中采用意图分类模型,将意图分为预先设定的有限的类别相比,本专利技术通过获取待识别意图的文本信息;若所述文本信息中未检测到前置匹配项,则将所述文本信息分别与包含目标意图的标准语句以及经各标准语句进行扩充的相似语句进行语义相似度处理,得到第一相似度值、第二相似度值,所述前置匹配项包含不同匹配规则的匹配对象;基于所述第一相似度值、所述第二相似度值之间的比较结果,从所述标准语句、所述相似语句中确定所述文本信息的意图,实现了对目标意图知识库的构建,使得识别的意图以构建的目标意图知识库为依据,避免了将意图分类为预先设置的有限的类别中,提高了意图识本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:获取待识别意图的文本信息;若所述文本信息中未检测到前置匹配项,则将所述文本信息分别与包含目标意图的标准语句以及经各标准语句进行扩充的相似语句进行语义相似度处理,得到第一相似度值、第二相似度值,所述前置匹配项包含不同匹配规则的匹配对象;基于所述第一相似度值、所述第二相似度值之间的比较结果,从所述标准语句、所述相似语句中确定所述文本信息的意图。2.根据权利要求1所述的方法,其特征在于,所述获取待识别意图的文本信息之后,所述方法还包括:将所述文本信息进行分词处理,得到所述文本信息中的分词;基于所述前置匹配项中的匹配对象对所述分词进行检测;所述匹配对象包含关键词和/或适用所述匹配规则的词语、字符;所述匹配规则为进行语义匹配的规则;若在所述分词中检测到所述匹配对象,则基于所述分词确定所述文本信息的意图。3.根据权利要求1所述的方法,其特征在于,所述将所述文本信息分别与包含目标意图的标准语句以及经各标准语句进行扩充的相似语句进行语义相似度处理,得到第一相似度值、第二相似度值之前,所述方法还包括:获取目标意图的标准语句,对所述标准语句的语法、语序、词语中的一项或多项进行语义相似扩充,得到多个相似语句;所述相似语句与所述标准语句表征相同的目标意图;基于所述标准语句与所述相似语句,建立目标领域的意图识别库;采用语言模型将所述标准语句和所述相似语句分别转换为第一句向量和第二句向量。4.根据权利要求3所述的方法,其特征在于,所述采用语言模型将所述标准语句和所述相似语句分别转换为第一句向量和第二句向量之前,所述方法还包括:采用文本语料对所述语言模型进行训练,得到用于句向量转换的所述语言模型。5.根据权利要求3所述的方法,其特征在于,所述将所述文本信息分别与包含目标意图的标准语句以及经各标准语句进行扩充的相似语句进行语义相似度处理,得到第一相似度值、第二相似度值包括:采用所述语言模型将所述文本信息转换为第三句向量;采用余弦相似度计算所述第一句向量与所述第三句向量之间的语义相似度,得到第一相似度值;采用所述余弦相似度计算所述第二句向量与所述第三句向量之间的语义相似度,得到第二相似度值。6.根据权利要求3所述的方法,其特征在于,所述方法还...

【专利技术属性】
技术研发人员:徐华韫黄明星王福钋曹富康张航飞董婉沈鹏
申请(专利权)人:北京健康之家科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1