一种问句意图匹配方法及终端组成比例

技术编号:35178516 阅读:31 留言:0更新日期:2022-10-12 17:46
本发明专利技术提供了一种问句意图匹配方法及终端,提取待处理问句中的第一变量槽位和第一关键词;提取标准问句的第二变量槽位及第二关键词;分别匹配所述第一变量槽位和第二变量槽位以及所述第一关键词和第二关键词,得到匹配结果;若所述匹配结果均为匹配成功,则标记所述标准问句为目标问句;根据所述目标问句的问句意图确定所述待处理问句的问句意图;本发明专利技术无需进行模型训练或者人为规定复杂的匹配规则,从而提高了进行问句匹配的效率,将匹配到的标准问句的意图作为待处理问句的意图,无需对所有可能的意图进行枚举,从而能够提高获取待处理问句意图的效率,因标准问句需和待处理问句匹配,故也能保证确定出的意图的正确率。故也能保证确定出的意图的正确率。故也能保证确定出的意图的正确率。

【技术实现步骤摘要】
一种问句意图匹配方法及终端


[0001]本专利技术涉及自然语言识别领域,尤其涉及一种问句意图匹配方法及终端。

技术介绍

[0002]自然语言的语义问答是由用户输入自然语言问句,提取其中的变量槽位,分辨用户的提问意图,再执行对应提问意图的相关知识查询逻辑的过程;其中准确分辨提问意图对是否能够进行准确问答起到关键作用,目前有使用意图分类模型将用户的问句分类到静态的若干意图类别中,也有使用模板规则库识别问句结构并指定为确定的意图。其中,模板规则库的方式一般对每种意图枚举问句中可能出现的变量槽位和关键词的排列组合,使用问句的成分解析结果进行匹配,模板规则库方法仅依靠输入的问句解析标注,对文本上下文信息欠缺利用,容易产生相互冲突的规则或者规则覆盖不足。意图分类模型的方式设计机器学习分类模型,并使用标注的数据训练,需要大量数据训练,且调整意图分类体系需要重新训练。

技术实现思路

[0003]本专利技术所要解决的技术问题是:提供一种问句意图匹配方法及终端,实现高效的问句意图确定。
[0004]为了解决上述技术问题,本专利技术采用的一种技术方案为:
[0005]一种问句意图匹配方法,包括步骤:
[0006]提取待处理问句中的第一变量槽位和第一关键词;
[0007]提取标准问句的第二变量槽位及第二关键词;
[0008]分别匹配所述第一变量槽位和第二变量槽位以及所述第一关键词和第二关键词,得到匹配结果;
[0009]若所述匹配结果均为匹配成功,则标记所述标准问句为目标问句;
[0010]根据所述目标问句的问句意图确定所述待处理问句的问句意图。
[0011]为了解决上述技术问题,本专利技术采用的另一种技术方案为:
[0012]一种终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0013]提取待处理问句中的第一变量槽位和第一关键词;
[0014]提取标准问句的第二变量槽位及第二关键词;
[0015]分别匹配所述第一变量槽位和第二变量槽位以及所述第一关键词和第二关键词,得到匹配结果;
[0016]若所述匹配结果均为匹配成功,则标记所述标准问句为目标问句;
[0017]根据所述目标问句的问句意图确定所述待处理问句的问句意图。
[0018]本专利技术的有益效果在于:先存储标准问句,获取待处理问句之后,提取待处理问句中的第一变量槽位和第一关键词,直接和标准问句中的第二变量槽位和第二关键词进行匹
配判断匹配结果是否均为匹配成功,将匹配成功的标准问句标记为目标问句,则该标准问句对应的问句意图就能够作为待处理问句所对应的问句意图;通过将待处理问句和标准问句都拆分为组成结构,将二者的组成结构进行匹配的方式,无需进行模型训练或者人为规定复杂的匹配规则,从而提高了进行问句匹配的效率,将匹配到的标准问句的意图作为待处理问句的意图,无需对所有可能的意图进行枚举,从而能够提高获取待处理问句意图的效率,因标准问句需和待处理问句匹配,故也能保证确定出的意图的正确率。
附图说明
[0019]图1为本专利技术实施例的一种问句意图匹配方法的步骤流程图;
[0020]图2为本专利技术实施例的一种问句意图匹配终端的结构示意图;
[0021]图3为本专利技术实施例的一种待处理问句的预处理流程示意图;
[0022]标号说明:
[0023]1、一种问句意图匹配终端;2、处理器;3、存储器。
具体实施方式
[0024]为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。
[0025]请参照图1,一种问句意图匹配方法,包括步骤:
[0026]提取待处理问句中的第一变量槽位和第一关键词;
[0027]提取标准问句的第二变量槽位及第二关键词;
[0028]分别匹配所述第一变量槽位和第二变量槽位以及所述第一关键词和第二关键词,得到匹配结果;
[0029]若所述匹配结果均为匹配成功,则标记所述标准问句为目标问句;
[0030]根据所述目标问句的问句意图确定所述待处理问句的问句意图。
[0031]从上述描述可知,本专利技术的有益效果在于:先存储标准问句,获取待处理问句之后,提取待处理问句中的第一变量槽位和第一关键词,直接和标准问句中的第二变量槽位和第二关键词进行匹配判断匹配结果是否均为匹配成功,将匹配成功的标准问句标记为目标问句,则该标准问句对应的问句意图就能够作为待处理问句所对应的问句意图;通过将待处理问句和标准问句都拆分为组成结构,将二者的组成结构进行匹配的方式,无需进行模型训练或者人为规定复杂的匹配规则,从而提高了进行问句匹配的效率,将匹配到的标准问句的意图作为待处理问句的意图,无需对所有可能的意图进行枚举,从而能够提高获取待处理问句意图的效率,因标准问句需和待处理问句匹配,故也能保证确定出的意图的正确率。
[0032]进一步地,所述提取待处理问句中的第一变量槽位包括:
[0033]获取预设正则表达式,判断所述待处理问句中是否存在匹配所述预设正则表达式的第一词组;
[0034]若是,则将所述第一词组在所述待处理标记为第一变量槽位。
[0035]由上述描述可知,因变量通常都具有较为固定的格式,如时间、日期、行政区划等,根据正则式能够较准确地筛选出相应变量,从而确定出变量槽位。
[0036]进一步地,所述提取待处理问句中的第一关键词包括:
[0037]根据预设的AC自动机提取所述待处理问句中的第一关键词。
[0038]由上述描述可知,通过AC自动机进行关键词的提取,在进行字符串的比对时,无需每一次都从根节点出发即无需每一次都从字符串的第一个字符出发进行比较,提高了获取第一关键词的效率。
[0039]进一步地,所述匹配所述第一变量槽位和第二变量槽位之前包括:
[0040]获取所述待处理问句中所有的第一变量槽位,并按照出现顺序排列所述第一变量槽位,得到第一序列;
[0041]获取所述标准问句中所有的第二变量槽位,并按照出现顺序排列所述第二变量槽位,得到第二序列;
[0042]所述匹配所述第一变量槽位和第二变量槽位,得到匹配结果包括:
[0043]判断所述第一序列与所述第二序列是否相同,若是,则所述第一变量槽位与所述第二变量槽位的匹配结果为匹配成功。
[0044]由上述描述可知,将待处理问句中所有变量槽位和标准问句中所有变量槽位进行匹配,二者要完全对应才算为匹配成功,即二者变量槽位的类型和出现顺序都一致才认为是匹配成功,变量通常是问句中限定所问内容的重要部分。
[0045]进一步地,所述匹配所述第一关键词和第二关键词之前包括:
[0046]获取所述待处理问句中所有的第一关键词,并按照出现顺序排列所述第一关键词,得到第三序列;
[0047]获取所述标准问句中所有的第二关键词,并按本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问句意图匹配方法,其特征在于,包括步骤:提取待处理问句中的第一变量槽位和第一关键词;提取标准问句的第二变量槽位及第二关键词;分别匹配所述第一变量槽位和第二变量槽位以及所述第一关键词和第二关键词,得到匹配结果;若所述匹配结果均为匹配成功,则标记所述标准问句为目标问句;根据所述目标问句的问句意图确定所述待处理问句的问句意图。2.根据权利要求1所述的一种问句意图匹配方法,其特征在于,所述提取待处理问句中的第一变量槽位包括:获取预设正则表达式,判断所述待处理问句中是否存在匹配所述预设正则表达式的第一词组;若是,则将所述第一词组在所述待处理标记为第一变量槽位。3.根据权利要求1所述的一种问句意图匹配方法,其特征在于,所述提取待处理问句中的第一关键词包括:根据预设的AC自动机提取所述待处理问句中的第一关键词。4.根据权利要求1所述的一种问句意图匹配方法,其特征在于,所述匹配所述第一变量槽位和第二变量槽位之前包括:获取所述待处理问句中所有的第一变量槽位,并按照出现顺序排列所述第一变量槽位,得到第一序列;获取所述标准问句中所有的第二变量槽位,并按照出现顺序排列所述第二变量槽位,得到第二序列;所述匹配所述第一变量槽位和第二变量槽位,得到匹配结果包括:判断所述第一序列与所述第二序列是否相同,若是,则所述第一变量槽位与所述第二变量槽位的匹配结果为匹配成功。5.根据权利要求1所述的一种问句意图匹配方法,其特征在于,所述匹配所述第一关键词和第二关键词之前包括:获取所述待处理问句中所有的第一关键词,并按照出现顺序排列所述第一关键词,得到第三序列;获取所述标准问句中所...

【专利技术属性】
技术研发人员:陈征宇戴文艳黄炳裕林文国李昱东黄河洪章阳王伟宗
申请(专利权)人:长威信息科技发展股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1