一种意图槽位识别方法及装置制造方法及图纸

技术编号:36683674 阅读:11 留言:0更新日期:2023-02-27 19:43
本公开涉及一种意图槽位识别方法及装置,应用于自然语言处理领域,可以提高智能对话系统中语义理解准确率。该方法包括:获取待识别语句对应的第一文本序列;通过第一编码模型对第一文本序列进行编码处理,得到第一文本序列对应的第一字向量;对第一字向量进行平均池化处理,得到第一文本序列对应的目标句向量;通过意图识别模型对目标句向量进行意图识别,识别得到至少一个意图结果;将每个意图结果分别与第一文本序列进行拼接,得到至少一个第二文本序列;通过第二编码模型分别对每个第二文本序列进行编码处理,得到至少一个第二字向量,每个第二字向量对应一个第二文本序列;通过第一槽位识别模型对每个第二字向量进行槽位识别,得到该每个意图结果对应的至少一个槽位结果。果。果。

【技术实现步骤摘要】
一种意图槽位识别方法及装置


[0001]本申请实施例涉及自然语言处理领域。更具体地讲,涉及一种意图槽位识别方法及装置。

技术介绍

[0002]自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。任务型对话属于封闭域的范畴,对话的内容答案是唯一的,是有限制的,是在提问时给对方一个框架,让对方只能在框架里选择回答的。在智能对话系统中,准确的识别用户的意图(intent)然后确定意图下的槽位(slot)是提高对话系统能力的关键。
[0003]现有智能对话系统中语义理解系统功能大多集中于单意图查询识别,即单句用户查询只涉及到单意图。但是现实场景中用户需求较为复杂,可能存在多意图(multi

intent)的查询。传统多意图语义理解模型,很多都只是进行意图的识别,不进行槽位预测和填充,显然这种方法还不能完全满足语言理解的需求,因此需要建立多意图和槽位之间的联系,完善槽位预测填充的功能,以解决现有智能对话系统中语义理解准确率较低的问题。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本申请实施例提供了一种意图槽位识别方法及装置,可以提高智能对话系统中语义理解准确率。
[0005]第一方面,本申请实施例提供了一种意图槽位识别方法,包括:
[0006]获取待识别语句对应的第一文本序列;
[0007]通过第一编码模型对第一文本序列进行编码处理,得到第一文本序列对应的第一字向量;
[0008]对第一字向量进行平均池化处理,得到第一文本序列对应的目标句向量;
[0009]通过意图识别模型对目标句向量进行意图识别,识别得到至少一个意图结果;
[0010]将每个意图结果分别与第一文本序列进行拼接,得到至少一个第二文本序列;
[0011]通过第二编码模型分别对每个第二文本序列进行编码处理,得到至少一个第二字向量,每个第二字向量对应一个第二文本序列;
[0012]通过第一槽位识别模型对每个第二字向量进行槽位识别,得到该每个意图结果对应的至少一个槽位结果。
[0013]本申请一些实施例中,该获取待识别语句对应的第一文本序列,包括:
[0014]接收该待识别语句;
[0015]对该待识别语句进行语音识别,得到该待识别语句中的第三文本序列,第三文本序列中包括多个词语;
[0016]基于显式知识库,对该多个词语中的每个词语分别进行知识库匹配,得到至少一
个分类知识,每个分类知识对应一个词语;
[0017]将该至少一个分类知识分别插入第三文本序列中,得到第一文本序列,在第一文本序列中,每个分类标识位于对应的词语后面,且通过预设分隔符分隔。
[0018]本申请一些实施例中,该通过第一槽位识别模型对每个第二字向量进行槽位识别,得到该每个意图结果对应的至少一个槽位结果之前,该方法还包括:
[0019]标记第三文本序列中的各个词语在第二文本序列中的位置,得到第一位置信息;
[0020]该通过第一槽位识别模型对每个第二字向量进行槽位识别,得到该每个意图结果对应的至少一个槽位结果,包括:
[0021]该通过第一槽位识别模型对每个第二字向量进行槽位识别,得到第二文本序列中该每个意图结果对应的各个槽位结果;
[0022]基于第一位置信息,从该每个意图结果对应的各个槽位结果中,筛选出第三文本序列中该每个意图结果对应的至少一个槽位结果。
[0023]本申请一些实施例中,该对第一字向量进行平均池化处理,得到第一文本序列对应的目标句向量之后,该方法还包括:
[0024]通过领域识别模型对目标句向量进行领域识别,识别得到至少一个领域结果,每个领域结果对应一个意图结果。
[0025]本申请一些实施例中,该将每个意图结果分别与第一文本序列进行拼接,得到至少一个第二文本序列,包括:
[0026]将该每个意图结果和对应的领域结果分别与第一文本序列进行拼接,得到该至少一个第二文本序列。
[0027]本申请一些实施例中,该将每个意图结果分别与第一文本序列进行拼接,得到至少一个第二文本序列之前,该方法还包括:
[0028]确定该至少一个意图结果的数量是否大于1;
[0029]该将每个意图结果分别与第一文本序列进行拼接,得到至少一个第二文本序列,包括:
[0030]在该至少一个意图结果的数量大于1的情况下,将该每个意图结果分别与第一文本序列进行拼接,得到至少一个第二文本序列;
[0031]该方法还包括:
[0032]在该至少一个意图结果的数量等于1的情况下,通过第二槽位识别模型对第一字向量进行槽位识别,得到该每个意图结果对应的至少一个槽位结果。
[0033]本申请一些实施例中,该通过第一槽位识别模型对每个第二字向量进行槽位识别,得到该每个意图结果对应的至少一个槽位结果之后,该方法还包括:
[0034]基于各个意图结果对应的至少一个槽位结果中的特定槽位在第一文本序列中的位置关系,确定该各个意图在第一文本序列中的排列顺序。
[0035]第二方面,本申请实施例提供了一种意图槽位识别装置,包括:
[0036]获取模块,用于获取待识别语句对应的第一文本序列;
[0037]编码模块,用于通过第一编码模型对第一文本序列进行编码处理,得到第一文本序列对应的第一字向量;
[0038]池化模块,用于对第一字向量进行平均池化处理,得到第一文本序列对应的目标
句向量;
[0039]意图识别模块,用于通过意图识别模型对目标句向量进行意图识别,识别得到至少一个意图结果;
[0040]拼接模块,用于将每个意图结果分别与第一文本序列进行拼接,得到至少一个第二文本序列;
[0041]该编码模块,还用于通过第二编码模型分别对每个第二文本序列进行编码处理,得到至少一个第二字向量,每个第二字向量对应一个第二文本序列;
[0042]槽位识别模块,用于通过第一槽位识别模型对每个第二字向量进行槽位识别,得到该每个意图结果对应的至少一个槽位结果。
[0043]本申请一些实施例中,该获取模块,用于接收该待识别语句;
[0044]对该待识别语句进行语音识别,得到该待识别语句中的第三文本序列,第三文本序列中包括多个词语;
[0045]基于显式知识库,对该多个词语中的每个词语分别进行知识库匹配,得到至少一个分类知识,每个分类知识对应一个词语;
[0046]将该至少一个分类知识分别插入第三文本序列中,得到第一文本序列,在第一文本序列中,每个分类标识位于对应的词语后面,且通过预设分隔符分隔。
[0047]本申请一些实施例中,该装置还包括:
[0048]标记模块,用于在该通过第一槽位识别模型对每个第二字向量进行槽位识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图槽位识别方法,其特征在于,包括:获取待识别语句对应的第一文本序列;通过第一编码模型对所述第一文本序列进行编码处理,得到所述第一文本序列对应的第一字向量;对所述第一字向量进行平均池化处理,得到所述第一文本序列对应的目标句向量;通过意图识别模型对所述目标句向量进行意图识别,识别得到至少一个意图结果;将每个意图结果分别与所述第一文本序列进行拼接,得到至少一个第二文本序列;通过第二编码模型分别对每个第二文本序列进行编码处理,得到至少一个第二字向量,每个第二字向量对应一个第二文本序列;通过第一槽位识别模型对每个第二字向量进行槽位识别,得到所述每个意图结果对应的至少一个槽位结果。2.根据权利要求1所述的方法,其特征在于,所述获取待识别语句对应的第一文本序列,包括:接收所述待识别语句;对所述待识别语句进行语音识别,得到所述待识别语句中的第三文本序列,所述第三文本序列中包括多个词语;基于显式知识库,对所述多个词语中的每个词语分别进行知识库匹配,得到至少一个分类知识,每个分类知识对应一个词语;将所述至少一个分类知识分别插入所述第三文本序列中,得到所述第一文本序列,在所述第一文本序列中,每个分类标识位于对应的词语后面,且通过预设分隔符分隔。3.根据权利要求2所述的方法,其特征在于,所述通过第一槽位识别模型对每个第二字向量进行槽位识别,得到所述每个意图结果对应的至少一个槽位结果之前,所述方法还包括:标记所述第三文本序列中的各个词语在所述第二文本序列中的位置,得到第一位置信息;所述通过第一槽位识别模型对每个第二字向量进行槽位识别,得到所述每个意图结果对应的至少一个槽位结果,包括:所述通过第一槽位识别模型对每个第二字向量进行槽位识别,得到所述第二文本序列中所述每个意图结果对应的各个槽位结果;基于所述第一位置信息,从所述每个意图结果对应的各个槽位结果中,筛选出所述第三文本序列中所述每个意图结果对应的至少一个槽位结果。4.根据权利要求1所述的方法,其特征在于,所述对所述第一字向量进行平均池化处理,得到所述第一文本序列对应的目标句向量之后,所述方法还包括:通过领域识别模型对所述目标句向量进行领域识别,识别得到至少一个领域结果,每个领域结果对应一个意图结果。5.根据权利要求4所述的方法,其特征在于,所述将每个意图结果分别与所述第一文本序列进行拼接,得到至少一个第二文本序列,包括:将所述每个意图结果和对应的领域结果分别与所述第一文本序列进行拼接,得到所述至少一个所述第二文本序列。
6.根据权利要求1所述的方法,其特征在于,所述将每个意图结果分别与所述第一文本序列进行拼接,得到至少一个第二文本序列之前,所述方法还包括:确定所述至少一个意图结果的数量是否大于1;所述将每个意图结果分别与所...

【专利技术属性】
技术研发人员:邢敏敏潘程王敏车万翔黎州扬魏福煊
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1