本申请提供了一种意图识别方法、装置、电子设备及存储介质,该意图识别方法包括:对当前会话文本中来源于客户的目标句子进行切词处理,得到至少一个目标词语;确定至少一个目标词语中,是否存在和预设的关键词表中的多个关键词具有相同字的词语,若是,则将具有相同字的词语确定为候选词语;分别计算预设的关键词表中的至少部分关键词和候选词语之间的相似度值,得到至少一个相似度值;在至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定目标句子的上下文信息;根据上下文信息对目标句子进行意图识别得到目标意图标签。本申请的技术方案能够实现意图识别的实时性,同时提高了识别到的意图标签的准确率。同时提高了识别到的意图标签的准确率。同时提高了识别到的意图标签的准确率。
【技术实现步骤摘要】
意图识别方法、装置、电子设备及存储介质
[0001]本申请涉及自然语言处理
,具体涉及一种意图识别方法、装置、电子设备及存储介质。
技术介绍
[0002]在客服与客户进行会话的过程中,客户可能会向客服表达多个意图,在一些情况下,需要准确识别并记录客户所表达的多个意图以供下游工作人员处理或方便后续的其他工作。一般地,可以通过人工记忆的方式记录会话过程中客户所表达的多个意图,但这种方式容易出现记错、漏记的情况。除此之外,也可以利用多意图分类模型对会话内容进行分类以得到多个意图,这种方式对模型的要求高,训练成本高,尤其在会话长度较长时,模型的分类效果差,难以得到准确的多个意图。
技术实现思路
[0003]有鉴于此,本申请实施例提供了一种意图识别方法、装置、电子设备及存储介质,能够实现意图识别的实时性,同时提高了识别到的意图标签的准确率。
[0004]第一方面,本申请的实施例提供了一种意图识别方法,包括:对当前会话文本中来源于客户的目标句子进行切词处理,得到至少一个目标词语;确定至少一个目标词语中,是否存在和预设的关键词表中的多个关键词具有相同字的词语,若是,则将具有相同字的词语确定为候选词语;分别计算预设的关键词表中的至少部分关键词和候选词语之间的相似度值,得到至少一个相似度值;在至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定目标句子的上下文信息,上下文信息包括满足预设数量要求的多个句子;根据上下文信息对目标句子进行意图识别,得到目标句子对应的目标意图标签。
[0005]第二方面,本申请的实施例提供了一种意图识别装置,包括:切词模块,用于对当前会话文本中来源于客户的目标句子进行切词处理,得到至少一个目标词语;第一确定模块,用于确定至少一个目标词语中,是否存在和预设的关键词表中的多个关键词具有相同字的词语,若是,则将具有相同字的词语确定为候选词语;计算模块,用于分别计算预设的关键词表中的至少部分关键词和候选词语之间的相似度值,得到至少一个相似度值;第二确定模块,用于在至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定目标句子的上下文信息,上下文信息包括满足预设数量要求的多个句子;识别模块,用于根据上下文信息对目标句子进行意图识别,得到目标句子对应的目标意图标签。
[0006]第三方面,本申请的实施例提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器,其中,处理器用于执行上述第一方面所述的意图识别方法。
[0007]第四方面,本申请的实施例提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序用于执行上述第一方面所述的意图识别方法。
[0008]第五方面,本申请的实施例提供了一种计算机程序产品,所述计算机程序产品中包括指令,所述指令被计算机设备的处理器执行时,使得所述计算机设备能够执行上述第
一方面所述的意图识别方法。
[0009]本申请实施例提供了一种意图识别方法、装置、电子设备及存储介质,通过确定目标句子中是否存在与关键词表中的关键词相似度高的词语,并在目标句子存在与关键词表中的关键词相似度高的词语时,确定目标句子的上下文信息,进而根据上下文信息对目标句子进行意图识别得到意图标签。由于本申请实施例可以对目标句子进行意图识别,因此可以在会话过程中,实时并持续地对客户所表达的句子进行意图识别,实现意图识别的实时性,进而实现对客服热线下的长文本进行实时的多意图识别。本申请实施例通过确定目标句子对应的目标词语中,是否存在和关键词表中的关键词具有相同字的词语,并在目标词语中存在和关键词表中的关键词具有相同字的词语时,将具有相同字的词语确定为候选词语,这样可以从目标词语中筛选出候选词语,计算候选词语与关键词之间的相似度,如此可以提高意图识别的效率。进一步地,本申请实施例通过计算候选词语与至少部分关键词之间的相似度值,并在相似度值中存在大于或等于第一预设阈值的相似度值时,对目标句子进行意图识别,这样可以提高意图识别方法的泛化性,且可以避免未对包含客户意图的句子进行意图识别的情况,避免遗漏意图标签。此外,本申请实施例通过确定目标句子的上下文信息,并根据上下文信息对目标句子进行意图识别,可以缩短每次进行意图识别的文本长度,降低识别难度,提高最终得到的意图标签的准确率。
附图说明
[0010]图1所示为本申请一示例性实施例提供的意图识别系统的系统架构示意图。
[0011]图2所示为本申请一示例性实施例提供的意图识别方法的流程示意图。
[0012]图3所示为本申请另一示例性实施例提供的意图识别方法的流程示意图。
[0013]图4所示为本申请一示例性实施例提供的意图识别装置的结构示意图。
[0014]图5所示为本申请一示例性实施例提供的用于执行意图识别方法的电子设备的框图。
具体实施方式
[0015]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0016]相关技术
[0017]在客户与客服沟通交流时,客户可能会在一通会话中表达出多个意图。例如,在电销场景中,客户会向客服提出希望“购买”、“签约”、“续订”、“咨询购买条件”等多个意图;在资源获取场景中,客户会向客服提出“提前还款”、“延期还款”、“注销账户”、“利息减免”等多个意图。客服需要根据客户在会话过程中表达的意图,为当前工单记录意图标签供下游工作人员处理。而当会话长度较长,客户表达的意图较多时,通过客服记忆的方式为当前工单记录意图标签,对客服来说难度较大,如对客服的记忆力以及业务知识掌握程度等要求高;而且,通过这种方式记录意图标签容易出错且难以记录全部的意图,即意图标签的准确率难以保证,且容易出现遗漏意图标签的情况。
[0018]除了通过客服记忆的方式记录意图标签外,也可以采用多意图分类模型对整通会话进行分类,以得到多个意图标签,但是这种方式对模型的要求较高。如在一些情况下,整通会话经过语音转文本后的文本长度高达五千字以上,如果采用庞大的深度学习模型作为分类器,训练成本高、推理性能差、提单效率低。
[0019]针对上述技术问题,本申请实施例通过对会话过程中来源于客户的目标句子进行切词处理得到至少一个词语,并在关键词表中对至少一个词语进行检索,当检索到某个词语与某个关键词的相似度满足预设阈值时,根据该词语定位包含目标句子的上下文信息,并根据上下文信息识别目标句子的意图标签。这样可以在会话过程中实时根据局部会话内容识别客户的意图,如此可以提高针对整通会话的多意图识别效率。
[0020]示例性系统
[0021]图1所示为本申请一示例性实施例提供的意图识别系统100的系统架构示意图,如图1所示,系统100包括:用户终端设备110、外呼设备120以及意图识别设备130。
...
【技术保护点】
【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:对当前会话文本中来源于客户的目标句子进行切词处理,得到至少一个目标词语;确定所述至少一个目标词语中,是否存在和预设的关键词表中的多个关键词具有相同字的词语,若是,则将所述具有相同字的词语确定为候选词语;分别计算所述预设的关键词表中的至少部分关键词和所述候选词语之间的相似度值,得到至少一个相似度值;在所述至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定所述目标句子的上下文信息,所述上下文信息包括满足预设数量要求的多个句子;根据所述上下文信息对所述目标句子进行意图识别,得到所述目标句子对应的目标意图标签。2.根据权利要求1所述的意图识别方法,其特征在于,所述预设的关键词表包括多个聚类簇,每个聚类簇包括至少一个关键词分别对应的至少一个第一表示向量;所述分别计算所述预设的关键词表中的至少部分关键词和所述候选词语之间的相似度值,得到至少一个相似度值,包括:确定所述候选词语对应的第二表示向量;分别计算所述多个聚类簇中每个聚类簇的中心表示向量与所述第二表示向量之间的距离,得到多个距离值,其中,所述中心表示向量为所述聚类簇中至少一个第一表示向量的加权和;将所述多个距离值中最小距离值对应的聚类簇确定为目标聚类簇,并将所述目标聚类簇中的至少一个关键词确定为所述至少部分关键词;分别计算所述至少部分关键词对应的第一表示向量与所述第二表示向量之间的相似度值,得到所述至少一个相似度值。3.根据权利要求1所述的意图识别方法,其特征在于,所述确定所述目标句子的上下文信息,包括:对所述当前会话文本中所述目标句子的上M句、所述目标句子以及所述当前会话文本中所述目标句子的下N句进行拼接得到所述上下文信息,其中,M和N为大于或等于1的整数,且M和N的和为第二预设阈值。4.根据权利要求1至3中任一项所述的意图识别方法,其特征在于,所述根据所述上下文信息对所述目标句子进行意图识别,得到所述目标句子对应的目标意图标签,包括:利用意图分类模型中的编码网络对所述上下文信息中的多个句子分别进行编码,得到多个句向量;按照预设规则确定所述多个句向量分别对应的权重值,得到多个权重值,其中,所述预设规则包括所述目标句子对应的句向量的权重值为所述多个权重值中的最大值;根据所述多个权重值对所述多个句向量进行加权求和,得到所述上下文信息的第一文本表示向量;利用所述意图分类模型中的分类网络对所述第一文本表示向量进行分类,得到多个意图标签对应的多个分数,其中,所述多个意图标签为所述分类网络可识别的固定标签;根据所述多个意图标签对应的多个分数确定所述目标句子对应的目标意图标签。5.根据权利要求4所述的意图识别方法,其特征在于,所述根据所述多个意图标签对应
的多个分数确定所述目标句子对应的目标意图标签,包括:利用所述分类网络将所述多个分数中最大分数对应的意图标签,确定为第一待确认意图标签;根据所述多个意图标签对应的多个分数以及预设公式,确定所述第一待确认意图标签对应的熵值,所述熵值越高表明所述第一待确认意图标签的可靠性越低,所述预设公式为n为...
【专利技术属性】
技术研发人员:范智超,蒋宁,夏粉,吴海英,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。