本发明专利技术公开了一种问答系统、问答机器人及其FAQ问答库召回方法,其包括:获取FAQ问答库中的问答话术,问答话术包括一个以上问题和一个答案组成的问答对;对问答话术进行意图识别和命名实体识别,获取问答话术的意图识别结果和命名实体识别结果;将意图识别结果、命名实体识别结果、问答话术拼接形成三元组识别模板;获取访客问题,并对访客问题进行意图识别和命名实体识别,获取访客问题的意图识别结果和命名实体识别结果;将访客问题的意图识别结果和命名实体识别结果与三元组识别模板进行匹配,得到访客问题对应的问答话术,并将该问答话术中对应的答案返回给访客;采用该模板匹配的方式,与传统的语义相似度匹配相比,可以有效的提高FAQ的召回率。有效的提高FAQ的召回率。
【技术实现步骤摘要】
一种问答系统、问答机器人及其FAQ问答库召回方法
[0001]本专利技术涉及智能客服
,特别是一种问答系统、问答机器人及其FAQ问答库召回方法。
技术介绍
[0002]问答系统处理的对象主要包括用户的问题以及答案。根据问题所属的知识领域,问答系统可分为面向限定域的问答系统、面向开放域的问答系统、以及面向常用问题集(Frequently Asked Questions,FAQ)的问答系统。依据答案来源,问答系统可分为基于结构化数据的问答系统如KBQA、基于文本的问答系统如机器阅读理解、以及基于问答对的问答系统如FAQ问答。
[0003]现有的FAQ召回方法通常采用相似问题匹配方案,即,对比访客问题与现有FAQ问答库中问题的相似度,得到与访客问题相似的标准问题,再根据FAQ问答库中的问答对,返回所述标准问题对应的标准答案,作为所述访客问题的答案。
[0004]常用的相似度匹配有两种方案:
[0005]一种是基于词袋模型(Bag of Words,简称BoW),它是通过对句子进行分词处理,将所有词语装进一个袋子里,不考虑其词法和语序的问题,即每个词语都是独立的,把每一个单词都进行统计,同时计算每个单词出现的次数。但是,词袋模型不考虑文本中词与词之间的上下文关系,仅仅只考虑所有词的权重,而权重与词在文本中出现的频率有关。相似度匹配时,基于句子里面的词有哪些是相似或者相等的,通过累加权重来判断两句话是否相似。
[0006]另一种是训练一个语言模型,例如词向量模型word2vec,它是考虑词语位置关系的一种模型,通过大量语料的训练,将每一个词语映射到高维度的向量当中,通过求余弦的方式,判断两个词语之间的相似度。
[0007]但是,采用上述句子句意相似的方案,对相似度模型/相似度算法的准确率要求很高,且大多数时候容易召不回来。因为在机器的认知里,相似除了句意相似,句子的长度也会提供权重。当目标句和库里面相似的问题长度差距很大时,往往召不回来,且容易召到另一句。因此,现有技术中的FAQ召回方法召回率较低,且效率低下。
技术实现思路
[0008]本专利技术的主要目的在于提供了一种FAQ问答库召回方法,以及采用该召回方法的问答系统、问答机器人,旨在解决现有的FAQ问答库召回方法召回率低下的技术问题。
[0009]为实现上述目的,本专利技术提供了一种FAQ问答库召回方法,其包括以下步骤:
[0010]获取FAQ问答库中的问答话术,所述问答话术包括一个以上问题和一个答案组成的问答对;
[0011]对所述问答话术进行意图识别和命名实体识别,获取所述问答话术的意图识别结果和命名实体识别结果;
[0012]将所述意图识别结果、命名实体识别结果、问答话术拼接形成三元组识别模板;
[0013]获取访客问题,并对所述访客问题进行意图识别和命名实体识别,获取所述访客问题的意图识别结果和命名实体识别结果;
[0014]将所述访客问题的意图识别结果和命名实体识别结果与所述三元组识别模板进行匹配,得到所述访客问题对应的问答话术,并将该问答话术中对应的答案返回给访客。
[0015]优选的,所述三元组识别模板的拼接,进一步包括以下步骤:
[0016]获取所述意图识别结果、命名实体识别结果、问答话术中的键值对信息;
[0017]将所述键值对信息按照Json数据格式进行拼接,得到拼接数据;
[0018]将所述拼接数据存储在所述FAQ问答库中或者存储为Json文件。
[0019]进一步的,每个三元组识别模板中包括一个以上的意图识别结果、一个以上的命名实体识别结果、一个问答话术;将所述访客问题的意图识别结果和命名实体识别结果与所述三元组识别模板进行匹配时,匹配规则包括完全匹配规则和择一匹配规则,且所述完全匹配规则优先于所述择一匹配规则,当所述完全匹配规则不符合时,再进一步采用所述择一匹配规则。
[0020]优选的,所述择一匹配规则是指:
[0021]当所述访客问题的意图识别结果与所述三元组识别模板中的意图识别结果中的任一个相匹配,并且,当所述访客问题的命名实体识别结果与所述三元组识别模板中的命名实体识别结果中的任一个相匹配,则返回所述访客问题对应的问答话术;或者,
[0022]当所述访客问题的意图识别结果与所述三元组识别模板中的所有意图识别结果相匹配,并且,当所述访客问题的命名实体识别结果与所述三元组识别模板中的命名实体识别结果中的任一个相匹配,则返回所述访客问题对应的问答话术;或者,
[0023]当所述访客问题的意图识别结果与所述三元组识别模板中的意图识别结果中的任一个相匹配,并且,当所述访客问题的命名实体识别结果与所述三元组识别模板中的所有命名实体识别结果相匹配,则返回所述访客问题对应的问答话术。
[0024]优选的,所述完全匹配规则是指:
[0025]当所述访客问题的意图识别结果与所述三元组识别模板中的所有意图识别结果相匹配,并且,当所述访客问题的命名实体识别结果与所述三元组识别模板中的所有命名实体识别结果相匹配,则返回所述访客问题对应的问答话术。
[0026]优选的,对所述FAQ问答库中的问答话术进行意图识别,是根据所述FAQ问答库中的训练语料进行意图标签的标记;根据所述训练语料和对应的意图标签进行训练,得到意图识别分类器;将所述FAQ问答库中的问答话术输入训练好的意图识别分类器中,所述意图识别分类器返回所述问答话术的意图识别结果;对所述访客问题进行意图识别,是将所述访客问题输入训练好的意图识别分类器中,所述意图识别分类器返回所述访客问题的意图识别结果。
[0027]优选的,对所述问答话术进行命名实体识别,是根据所述FAQ问答库中的训练语料进行类别标签的标记;根据所述训练语料和对应的类别标签进行训练,得到命名实体识别模型;将所述FAQ问答库中的问答话术输入训练好的命名实体识别模型中,所述命名实体识别模型返回对应的类别标签,作为所述问答话术的意图识别结果;对所述访客问题进行命名实体识别,是将所述访客问题输入训练好的命名实体识别模型中,所述命名实体识别模
型返回对应的类别标签,作为所述访客问题的意图识别结果。
[0028]与所述FAQ问答库召回方法相对应的,本专利技术提供一种问答系统,其包括:
[0029]FAQ问答库,用于存储问答话术,所述问答话术包括一个以上问题和一个答案组成的问答对;
[0030]意图识别模块,用于对所述问答话术或所述访客问题进行意图识别,获取所述问答话术或所述访客问题的意图识别结果;
[0031]命名实体识别模块,用于对所述问答话术或所述访客问题进行命名实体识别,获取所述问答话术或所述访客问题的命名实体识别结果;
[0032]模板拼接模块,用于将所述意图识别结果、命名实体识别结果、问答话术拼接形成三元组识别模板;
[0033]数据采集模块,用于获取访客问题;
[0034]答案召回模块,用于将所述访客问题的意图识别结果和本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种FAQ问答库召回方法,其特征在于,包括以下步骤:获取FAQ问答库中的问答话术,所述问答话术包括一个以上问题和一个答案组成的问答对;对所述问答话术进行意图识别和命名实体识别,获取所述问答话术的意图识别结果和命名实体识别结果;将所述意图识别结果、命名实体识别结果、问答话术拼接形成三元组识别模板;获取访客问题,并对所述访客问题进行意图识别和命名实体识别,获取所述访客问题的意图识别结果和命名实体识别结果;将所述访客问题的意图识别结果和命名实体识别结果与所述三元组识别模板进行匹配,得到所述访客问题对应的问答话术,并将该问答话术中对应的答案返回给访客。2.根据权利要求1所述的FAQ问答库召回方法,其特征在于:所述三元组识别模板的拼接,进一步包括以下步骤:获取所述意图识别结果、命名实体识别结果、问答话术中的键值对信息;将所述键值对信息按照Json数据格式进行拼接,得到拼接数据;将所述拼接数据存储在所述FAQ问答库中或者存储为Json文件。3.根据权利要求1所述的FAQ问答库召回方法,其特征在于:每个三元组识别模板中包括一个以上的意图识别结果、一个以上的命名实体识别结果、一个问答话术;将所述访客问题的意图识别结果和命名实体识别结果与所述三元组识别模板进行匹配时,匹配规则包括完全匹配规则和择一匹配规则,且所述完全匹配规则优先于所述择一匹配规则,当所述完全匹配规则不符合时,再进一步采用所述择一匹配规则。4.根据权利要求3所述的FAQ问答库召回方法,其特征在于:所述择一匹配规则是指:当所述访客问题的意图识别结果与所述三元组识别模板中的意图识别结果中的任一个相匹配,并且,当所述访客问题的命名实体识别结果与所述三元组识别模板中的命名实体识别结果中的任一个相匹配,则返回所述访客问题对应的问答话术;或者,当所述访客问题的意图识别结果与所述三元组识别模板中的所有意图识别结果相匹配,并且,当所述访客问题的命名实体识别结果与所述三元组识别模板中的命名实体识别结果中的任一个相匹配,则返回所述访客问题对应的问答话术;或者,当所述访客问题的意图识别结果与所述三元组识别模板中的意图识别结果中的任一个相匹配,并且,当所述访客问题的命名实体识别结果与所述三元组识别模板中的所有命名实体识别结果相匹配,则返回所述访客问题对应的问答话术。5.根据权利要求3所述的FAQ问答库召回方法,其特征在于:所述完全匹配规则是指:当所述访客问...
【专利技术属性】
技术研发人员:陈鑫,肖龙源,廖斌,
申请(专利权)人:厦门快商通科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。