问答知识库的构建方法、智能交互方法及装置制造方法及图纸

技术编号:32582966 阅读:20 留言:0更新日期:2022-03-09 17:14
本公开提供一种问答知识库的构建方法、智能交互方法及装置,涉及人工智能技术领域,包括:获取用于构建问答知识库的语料集合对语料集合中的每一问题文本进行语义解析处理,得到每一问题文本的用户意图,根据各问题文本各自对应的用户意图确定语料集合的问题文本覆盖范围,根据每一问题文本的用户意图对语料集合中的各问题文本进行归类处理,得到各问题文本各自对应的类别属性,根据语料集合的问题文本覆盖范围、各问题文本各自对应的类别属性构建问答知识库,问答知识库用于对用户发起的交互消息进行反馈,实现了构建问答知识库的自动化和智能化,提高了基于问答知识库对用户的问题进行答复时的准确性和有效性。进行答复时的准确性和有效性。进行答复时的准确性和有效性。

【技术实现步骤摘要】
问答知识库的构建方法、智能交互方法及装置


[0001]本公开涉及人工智能
,尤其涉及一种问答知识库的构建方法、智能交互方法及装置。

技术介绍

[0002]问答系统广泛应用于如电商智能客服、聊天机器、智能语音助手等领域,问答知识库是问答系统中重要构成部分之一。问答知识库为问答系统提供常见问题解答(Frequently Asked Questions,FAQ),其构建效率和质量对问答系统的效果有着重要的影响。
[0003]在现有技术中,问答知识库的构建方法包括:知识库维护人员通过excel表格收集或编辑数据,然后人工筛选出自己心目认为用户可能或者日常提出的问题,通过维护模块编辑录入存储器,从而得到问答知识库。
[0004]然而,采用上述人工的方式构建问答知识库,存在效率低且准确性偏低的问题。

技术实现思路

[0005]本公开实施例提供一种问答知识库的构建方法、智能交互方法及装置,用以解决构建问答知识库的效率低的问题。
[0006]第一方面,本公开实施例提供一种问答知识库的构建方法,包括:
[0007]获取用于构建问答知识库的语料集合,其中,所述语料集合中的每一语料包括问题文本、以及与问题文本对应的答案文本;
[0008]对所述语料集合中的每一问题文本进行语义解析处理,得到每一问题文本的用户意图,根据各问题文本各自对应的用户意图确定所述语料集合的问题文本覆盖范围,并根据每一问题文本的用户意图对所述语料集合中的各问题文本进行归类处理,得到各问题文本各自对应的类别属性;
[0009]根据所述语料集合的问题文本覆盖范围、各问题文本各自对应的类别属性构建所述问答知识库,其中,所述问答知识库包括粗分类器和至少一个细分类器,所述粗分类器用于确定所述问答知识库的问题文本覆盖范围,所述至少一个细分类器用于确定各问题文本各自对应的类别属性,所述问答知识库用于对用户发起的交互消息进行反馈。
[0010]在一些实施例中,对所述语料集合中的每一问题文本进行语义解析处理,得到每一问题文本的用户意图,包括;
[0011]对每一问题文本进行关键词提取处理,得到每一问题文本的关键词,并对每一问题文本进行实体词识别且合并处理,得到每一问题文本的实体词;
[0012]根据每一问题文本的关键词、每一问题文本的实体词确定每一问题文本的用户意图。
[0013]在一些实施例中,对每一问题文本进行关键词提取处理,得到每一问题文本的关键词,并对每一问题文本进行实体词识别且合并处理,得到每一问题文本的实体词,包括:
[0014]对每一问题文本进行分词处理,得到每一问题文本的各分词,确定每一分词的词性信息;
[0015]根据各分词的词性信息从各分词中进行关键词提取处理,得到每一问题文本的关键词,并根据各分词的词性信息对各分词进行实体词识别且合并处理,得到每一问题文本的实体词。
[0016]在一些实施例中,根据各问题文本各自对应的用户意图确定所述语料集合的问题文本覆盖范围,包括:
[0017]根据每一问题文本对应的用户意图确定每一问题文本所表征的所述问答知识库的性能属性,并根据各问题文本各自所表征的所述问答知识库的性能属性确定所述语料集合的问题文本覆盖范围。
[0018]在一些实施例中,还包括:
[0019]接收更新所述问答知识库的语料,其中,更新所述知识库的语料中包括问题更新文本;
[0020]若根据所述粗分类器确定所述问题更新文本的覆盖范围被包含于所述问答知识库的问题文本覆盖范围,则根据每一细分类器预测所述问题更新文本属于每一细分类器的类别属性置信度,并根据各类别属性置信度对所述问答知识库的细分类器进行更新。
[0021]在一些实施例中,细分类器中包括问题文本列表;根据各类别属性置信度对所述问答知识库的细分类器进行更新,包括:
[0022]从各类别属性置信度中确定最高类别属性置信度,并从所述最高类别属性置信度的细分类器中,确定并输出与所述问题更新文本的相似度大于预设相似度阈值的问题文本列表、以及确定出的问题文本列表的答案文本;
[0023]响应于接收到针对输出的与所述问题更新文本的相似度大于预设相似度阈值的问题文本列表、以及确定出的问题文本列表的答案文本的确认指示,将所述问题更新文本添加至所述最高类别属性置信度的细分类器的问题文本列表,以对所述问答知识库的细分类器进行更新。
[0024]在一些实施例中,所述最高类别属性置信度的细分类器的问题文本列表包括相似问题文本列表和非相似性问题文本列表;将所述问题更新文本添加至所述最高类别属性置信度的细分类器的问题文本列表中,包括:
[0025]将所述问题更新文本与所述相似问题文本列表中的问题文本进行相似性比对,得到比对结果;
[0026]若所述比对结果表征所述问题更新文本与所述相似性文本列表中的问题文本的相似性大于预设的相似性阈值,则将所述问题更新文本添加至所述相似性文本列表;
[0027]若所述比对结果表征所述问题更新文本与所述相似性文本列表中的问题文本的相似性小于或等于所述相似性阈值,则将所述问题更新文本添加至所述非相似性文本列表;
[0028]其中,所述相似性文本和所述非相似性文本用于更新所述问题知识库。
[0029]第二方面,本公开实施例提供了一种智能交互方法,包括:
[0030]接收用户发起的交互消息,其中,所述交互消息中携带问题信息;
[0031]从预设问答知识库中确定与所述问题信息对应的答案文本,并根据所述答案问题
生成并输出与所述交互消息对应的反馈消息,其中,所述问题知识库是基于如第一方面所述的方法构建的。
[0032]第三方面,本公开实施例提供了一种问答知识库的构建装置,包括:
[0033]获取单元,用于获取用于构建问答知识库的语料集合,其中,所述语料集合中的每一语料包括问题文本、以及与问题文本对应的答案文本;
[0034]解析单元,用于对所述语料集合中的每一问题文本进行语义解析处理,得到每一问题文本的用户意图;
[0035]第一确定单元,用于根据各问题文本各自对应的用户意图确定所述语料集合的问题文本覆盖范围;
[0036]归类单元,用于根据每一问题文本的用户意图对所述语料集合中的各问题文本进行归类处理,得到各问题文本各自对应的类别属性;
[0037]构建单元,用于根据所述语料集合的问题文本覆盖范围、各问题文本各自对应的类别属性构建所述问答知识库,其中,所述问答知识库包括粗分类器和至少一个细分类器,所述粗分类器用于确定所述问答知识库的问题文本覆盖范围,所述至少一个细分类器用于确定各问题文本各自对应的类别属性,所述问答知识库用于对用户发起的交互消息进行反馈。
[0038]在一些实施例中,所述解析单元,包括:
[0039]提取子单元,用于对每一问题文本进行关键词提取处理,得到每一问题文本的关键词;
[0040]识别子单元,用于对每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答知识库的构建方法,包括:获取用于构建问答知识库的语料集合,其中,所述语料集合中的每一语料包括问题文本、以及与问题文本对应的答案文本;对所述语料集合中的每一问题文本进行语义解析处理,得到每一问题文本的用户意图,根据各问题文本各自对应的用户意图确定所述语料集合的问题文本覆盖范围,并根据每一问题文本的用户意图对所述语料集合中的各问题文本进行归类处理,得到各问题文本各自对应的类别属性;根据所述语料集合的问题文本覆盖范围、各问题文本各自对应的类别属性构建所述问答知识库,其中,所述问答知识库包括粗分类器和至少一个细分类器,所述粗分类器用于确定所述问答知识库的问题文本覆盖范围,所述至少一个细分类器用于确定各问题文本各自对应的类别属性,所述问答知识库用于对用户发起的交互消息进行反馈。2.根据权利要求1所述的方法,其中,对所述语料集合中的每一问题文本进行语义解析处理,得到每一问题文本的用户意图,包括;对每一问题文本进行关键词提取处理,得到每一问题文本的关键词,并对每一问题文本进行实体词识别且合并处理,得到每一问题文本的实体词;根据每一问题文本的关键词、每一问题文本的实体词确定每一问题文本的用户意图。3.根据权利要求2所述的方法,其中,对每一问题文本进行关键词提取处理,得到每一问题文本的关键词,并对每一问题文本进行实体词识别且合并处理,得到每一问题文本的实体词,包括:对每一问题文本进行分词处理,得到每一问题文本的各分词,确定每一分词的词性信息;根据各分词的词性信息从各分词中进行关键词提取处理,得到每一问题文本的关键词,并根据各分词的词性信息对各分词进行实体词识别且合并处理,得到每一问题文本的实体词。4.根据权利要求1所述的方法,其中,根据各问题文本各自对应的用户意图确定所述语料集合的问题文本覆盖范围,包括:根据每一问题文本对应的用户意图确定每一问题文本所表征的所述问答知识库的性能属性,并根据各问题文本各自所表征的所述问答知识库的性能属性确定所述语料集合的问题文本覆盖范围。5.根据权利要求1

4中任一项所述的方法,还包括:接收更新所述问答知识库的语料,其中,更新所述知识库的语料中包括问题更新文本;若根据所述粗分类器确定所述问题更新文本的覆盖范围被包含于所述问答知识库的问题文本覆盖范围,则根据每一细分类器预测所述问题更新文本属于每一细分类器的类别属性置信度,并根据各类别属性置信度对所述问答知识库的细分类器进行更新。6.根据权利要求5所述的方法,其中,细分类器中包括问题文本列表;根据各类别属性置信度对所述问答知识库的细分类器进行更新,包括:从各类别属性置信度中确定最高类别属性置信度,并从所述最高类别属性置信度的细分类器中,确定并输出与所述问题更新文本的相似度大于预设相似度阈值的问题文本列表、以及确定出的问题文本列表的答案文本;
响应于接收到针对输出的与所述问题更新文本的相似度大于预设相似度阈值的问题文本列表、以及确定出的问题文本列表的答案文本的确认指示,将所述问题更新文本添加至所述最高类别属性置信度的细分类器的问题文本列表,以对所述问答知识库的细分类器进行更新。7.根据权利要求6所述的方法,其中,所述最高类别属性置信度的细分类器...

【专利技术属性】
技术研发人员:潘宏程强黄青君马波李刚
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1