意图识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37608963 阅读：28 留言：0更新日期：2023-05-18 12:00

本申请提供了一种意图识别方法、装置、电子设备及存储介质，该意图识别方法包括：对当前会话文本中来源于客户的目标句子进行切词处理，得到至少一个目标词语；确定至少一个目标词语中，是否存在和预设的关键词表中的多个关键词具有相同字的词语，若是，则将具有相同字的词语确定为候选词语；分别计算预设的关键词表中的至少部分关键词和候选词语之间的相似度值，得到至少一个相似度值；在至少一个相似度值中存在大于或等于第一预设阈值的相似度值时，确定目标句子的上下文信息；根据上下文信息对目标句子进行意图识别得到目标意图标签。本申请的技术方案能够实现意图识别的实时性，同时提高了识别到的意图标签的准确率。同时提高了识别到的意图标签的准确率。同时提高了识别到的意图标签的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
意图识别方法、装置、电子设备及存储介质

[0001]本申请涉及自然语言处理
，具体涉及一种意图识别方法、装置、电子设备及存储介质。

技术介绍

[0002]在客服与客户进行会话的过程中，客户可能会向客服表达多个意图，在一些情况下，需要准确识别并记录客户所表达的多个意图以供下游工作人员处理或方便后续的其他工作。一般地，可以通过人工记忆的方式记录会话过程中客户所表达的多个意图，但这种方式容易出现记错、漏记的情况。除此之外，也可以利用多意图分类模型对会话内容进行分类以得到多个意图，这种方式对模型的要求高，训练成本高，尤其在会话长度较长时，模型的分类效果差，难以得到准确的多个意图。

技术实现思路

[0003]有鉴于此，本申请实施例提供了一种意图识别方法、装置、电子设备及存储介质，能够实现意图识别的实时性，同时提高了识别到的意图标签的准确率。
[0004]第一方面，本申请的实施例提供了一种意图识别方法，包括：对当前会话文本中来源于客户的目标句子进行切词处理，得到至少一个目标词语；确定至少一个目标词语中，是否存在和预设的关键词表中的多个关键词具有相同字的词语，若是，则将具有相同字的词语确定为候选词语；分别计算预设的关键词表中的至少部分关键词和候选词语之间的相似度值，得到至少一个相似度值；在至少一个相似度值中存在大于或等于第一预设阈值的相似度值时，确定目标句子的上下文信息，上下文信息包括满足预设数量要求的多个句子；根据上下文信息对目标句子进行意图识别，得到目标句子对应的目标意图标签。
[0005

【技术保护点】

【技术特征摘要】
1.一种意图识别方法，其特征在于，包括：对当前会话文本中来源于客户的目标句子进行切词处理，得到至少一个目标词语；确定所述至少一个目标词语中，是否存在和预设的关键词表中的多个关键词具有相同字的词语，若是，则将所述具有相同字的词语确定为候选词语；分别计算所述预设的关键词表中的至少部分关键词和所述候选词语之间的相似度值，得到至少一个相似度值；在所述至少一个相似度值中存在大于或等于第一预设阈值的相似度值时，确定所述目标句子的上下文信息，所述上下文信息包括满足预设数量要求的多个句子；根据所述上下文信息对所述目标句子进行意图识别，得到所述目标句子对应的目标意图标签。2.根据权利要求1所述的意图识别方法，其特征在于，所述预设的关键词表包括多个聚类簇，每个聚类簇包括至少一个关键词分别对应的至少一个第一表示向量；所述分别计算所述预设的关键词表中的至少部分关键词和所述候选词语之间的相似度值，得到至少一个相似度值，包括：确定所述候选词语对应的第二表示向量；分别计算所述多个聚类簇中每个聚类簇的中心表示向量与所述第二表示向量之间的距离，得到多个距离值，其中，所述中心表示向量为所述聚类簇中至少一个第一表示向量的加权和；将所述多个距离值中最小距离值对应的聚类簇确定为目标聚类簇，并将所述目标聚类簇中的至少一个关键词确定为所述至少部分关键词；分别计算所述至少部分关键词对应的第一表示向量与所述第二表示向量之间的相似度值，得到所述至少一个相似度值。3.根据权利要求1所述的意图识别方法，其特征在于，所述确定所述目标句子的上下文信息，包括：对所述当前会话文本中所述目标句子的上M句、所述目标句子以及所述当前会话文本中所述目标句子的下N句进行拼接得到所述上下文信息，其中，M和N为大于或等于1的整数，且M和N的和为第二预设阈值。4.根据权利要求1至3中任一项所述的意图识别方法，其特征在于，所述根据所述上下文信息对所述目标句子进行意图识别，得到所述目标句子对应的目标意图标签，包括：利用意图分类模型中的编码网络对所述上下文信息中的多个句子分别进行编码，得到多个句向量；按照预设规则确定所述多个句向量分别对应的权重值，得到多个权重值，其中，所述预设规则包括所述目标句子对应的句向量的权重值为所述多个权重值中的最大值；根据所述多个权重值对所述多个句向量进行加权求和，得到所述上下文信息的第一文本表示向量；利用所述意图分类模型中的分类网络对所述第一文本表示向量进行分类，得到多个意图标签对应的多个分数，其中，所述多个意图标签为所述分类网络可识别的固定标签；根据所述多个意图标签对应的多个分数确定所述目标句子对应的目标意图标签。5.根据权利要求4所述的意图识别方法，其特征在于，所述根据所述多个意图标签对应
的多个分数确定所述目标句子对应的目标意图标签，包括：利用所述分类网络将所述多个分数中最大分数对应的意图标签，确定为第一待确认意图标签；根据所述多个意图标签对应的多个分数以及预设公式，确定所述第一待确认意图标签对应的熵值，所述熵值越高表明所述第一待确认意图标签的可靠性越低，所述预设公式为n为...

【专利技术属性】
技术研发人员：范智超，蒋宁，夏粉，吴海英，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人