基于知识图谱的开放领域问答方法及相关设备技术

技术编号:35933843 阅读:11 留言:0更新日期:2022-12-14 10:20
本申请提供了一种基于知识图谱的开放领域问答方法及相关设备,该方法通过多种匹配方法对问题描述的实体和属性进行提取得到实体属性候选集,能够有效提升实体属性抽取的召回率,避免漏掉问题描述中的隐层信息。基于实体属性候选集进行路径挖掘以得到初始路径,再对初始路径进行组合和筛选以得到带有限制条件的限制组合路径,能够有效降低无效路径的召回,针对多限制问题描述进行精确路径建模,进而降低后续针对路径的算力成本。通过分类模型输出限制组合路径和问题描述的相似度得分,将相似度得分得分最高的限制组合路径对应的知识图谱子图作为推荐答案数据,提升用户的体验感。感。感。

【技术实现步骤摘要】
基于知识图谱的开放领域问答方法及相关设备


[0001]本申请涉及知识图谱
,尤其涉及一种基于知识图谱的开放领域问答方法及相关设备。

技术介绍

[0002]随着互联网的迅速发展,数据量呈爆炸性的增长。网络数据正在从只包含网页之间文本数据的文档万维网转变为包含大量描述实体之间丰富关系的数据万维网。而知识图谱能够形式化地描述现实世界中的事物及其相互之间的关系,是以图的形式存储人类知识的大规模语义网络。目前,基于知识图谱的问答技术侧重于单次抽取的精度,抽取时尽可能减少实体和属性值的数量,导致抽取结果难以覆盖完全。此外,在路径查询时,使用固定模板进行查询且缺乏限制条件,导致获取路径不完全且及包含较多的无效路径,进而影响问答结果的准确性。

技术实现思路

[0003]有鉴于此,本申请的目的在于提出一种基于知识图谱的开放领域问答方法及相关设备。
[0004]基于上述目的,本申请提供了一种基于知识图谱的开放领域问答方法,包括:
[0005]获取用户输入的问题描述;
[0006]采用匹配方法对所述问题描述中的实体和属性进行提取,以得到实体属性候选集;
[0007]基于所述实体属性候选集中的实体和属性,在预先构建的知识图谱中进行路径挖掘,以得到多个初始路径;
[0008]对全部所述初始路径进行组合,得到多个组合路径;
[0009]对全部所述组合路径进行筛选,以得到多个限制组合路径;
[0010]将每个所述限制组合路径与所述问题描述输入至经过预训练的分类模型中进行分类预测,得到所述限制组合路径与所述问题描述的相似度分数;
[0011]将最大所述相似度分数对应的所述限制组合路径在所述知识图谱中匹配的子图作为所述问题描述的推荐答案数据。
[0012]进一步的,所述采用匹配方法对所述问题描述中的实体和属性进行提取,以得到实体属性候选集,包括:
[0013]通过精确匹配方法和模糊匹配方法分别对所述问题描述中的实体和属性进行提取,以得到所述实体属性候选集。
[0014]进一步的,所述实体属性候选集包括第一候选集和第二候选集,所述通过精确匹配方法和模糊匹配方法分别对所述问题描述中的实体和属性进行提取,以得到所述实体属性候选集,包括:
[0015]将所述问题描述与预先构建的字典树进行匹配,以得到所述第一候选集;
[0016]分别采用倒排索引方法和命名实体识别方法对所述问题描述中的实体进行提取,分别采用Duckling数值抽取方法和Lucene索引方法对所述问题描述中的属性进行提取,以得到所述第二候选集。
[0017]进一步的,所述对全部所述初始路径进行组合,得到多个组合路径,包括:
[0018]将具有相同答案节点的所述初始路径进行组合,得到所述组合路径。
[0019]进一步的,所述对全部所述组合路径进行筛选,以得到多个限制组合路径,包括:
[0020]基于所述问题描述确定与其关联的推理变量以及约束条件;
[0021]根据推理变量的数值大小对全部所述组合路径进行排序,将满足所述约束条件的所述组合路径作为所述限制组合路径。
[0022]进一步的,所述预训练,包括:
[0023]构建正样本训练集和负样本训练集;
[0024]将所述正样本训练集和负样本训练集划分为多组正样本子训练集和负样本子训练集,每组正样本子训练集和负样本子训练集对应所述预训练的多轮训练中的一轮训练;
[0025]对于所述多轮训练中的每轮训练,
[0026]基于正样本子训练集和负样本子训练集,采用交叉熵损失函数对所述分类模型进行训练;
[0027]从所述负样本训练集中随机选取N条负样本对经过当前轮训练的所述分类模型进行测试,得到测试结果,其中,N为正整数;
[0028]将不符合预设阈值的测试结果对应的所述负样本添加至下一轮训练对应的负样本子训练集中;
[0029]响应于达到所述预训练的预设截止条件时,停止所述预训练。
[0030]进一步的,所述分类模型至少包括BERT模型、ERNIE模型、BERT

wwm模型和RoBERTa

wwn分模型。
[0031]本申请还提供了一种基于知识图谱的开放领域问答装置,包括:
[0032]获取模块,被配置为获取用户输入的问题描述;
[0033]提取模块,被配置为采用匹配方法对所述问题描述中的实体和属性进行提取,以得到实体属性候选集;
[0034]初始路径挖掘模块,被配置为基于所述实体属性候选集中的实体和属性,在预先构建的知识图谱中进行路径挖掘,以得到多个初始路径;
[0035]组合模块,被配置为对全部所述初始路径进行组合,得到多个组合路径;
[0036]筛选模块,被配置为对全部所述组合路径进行筛选,以得到多个限制组合路径;
[0037]分类预测模块,被配置为将每个所述限制组合路径与所述问题描述输入至经过预训练的分类模型中进行分类预测,得到所述限制组合路径与所述问题描述的相似度分数;
[0038]推荐模块,被配置为将最大所述相似度分数对应的所述限制组合路径在所述知识图谱中匹配的子图作为所述问题描述的推荐答案数据。
[0039]本申请还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如上所述的方法。
[0040]本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介
质存储计算机指令,所述计算机指令用于使计算机执行如上所述的方法。
[0041]从上面所述可以看出,本申请提供的基于知识图谱的开放领域问答方法及相关设备,该方法通过多种匹配方法对问题描述的实体和属性进行提取得到实体属性候选集,能够有效提升实体属性抽取的召回率,避免漏掉问题描述中的隐层信息。基于实体属性候选集进行路径挖掘以得到初始路径,再对初始路径进行组合和筛选以得到带有限制条件的限制组合路径,能够有效降低无效路径的召回,针对多限制问题描述进行精确路径建模,进而降低后续针对路径的算力成本。通过分类模型输出限制组合路径和问题描述的相似度得分,将相似度得分得分最高的限制组合路径对应的知识图谱子图作为推荐答案数据,提升用户的体验感。
附图说明
[0042]为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0043]图1为本申请实施例的基于知识图谱的开放领域问答方法的流程图;
[0044]图2为本申请实施例的组合路径筛选方法的流程图;
[0045]图3为本申请实施例的预训练的方法流程图;
[0046]图4为本申请实施例的基于知识图谱的开放领本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的开放领域问答方法,其特征在于,包括:获取用户输入的问题描述;采用匹配方法对所述问题描述中的实体和属性进行提取,以得到实体属性候选集;基于所述实体属性候选集中的实体和属性,在预先构建的知识图谱中进行路径挖掘,以得到多个初始路径;对全部所述初始路径进行组合,得到多个组合路径;对全部所述组合路径进行筛选,以得到多个限制组合路径;将每个所述限制组合路径与所述问题描述输入至经过预训练的分类模型中进行分类预测,得到所述限制组合路径与所述问题描述的相似度分数;将最大所述相似度分数对应的所述限制组合路径在所述知识图谱中匹配的子图作为所述问题描述的推荐答案数据。2.根据权利要求1所述的方法,其特征在于,所述采用匹配方法对所述问题描述中的实体和属性进行提取,以得到实体属性候选集,包括:通过精确匹配方法和模糊匹配方法分别对所述问题描述中的实体和属性进行提取,以得到所述实体属性候选集。3.根据权利要求2所述的方法,其特征在于,所述实体属性候选集包括第一候选集和第二候选集,所述通过精确匹配方法和模糊匹配方法分别对所述问题描述中的实体和属性进行提取,以得到所述实体属性候选集,包括:将所述问题描述与预先构建的字典树进行匹配,以得到所述第一候选集;分别采用倒排索引方法和命名实体识别方法对所述问题描述中的实体进行提取,分别采用Duckling数值抽取方法和Lucene索引方法对所述问题描述中的属性进行提取,以得到所述第二候选集。4.根据权利要求1所述的方法,其特征在于,所述对全部所述初始路径进行组合,得到多个组合路径,包括:将具有相同答案节点的所述初始路径进行组合,得到所述组合路径。5.根据权利要求1所述的方法,其特征在于,所述对全部所述组合路径进行筛选,以得到多个限制组合路径,包括:基于所述问题描述确定与其关联的推理变量以及约束条件;根据推理变量的数值大小对全部所述组合路径进行排序,将满足所述约束条件的所述组合路径作为所述限制组合路径。6.根据权利要求1所述的方法,其特征在于,所述预训练,包括:构建正样本训练集和负样本训练集;...

【专利技术属性】
技术研发人员:贾勇哲马国宁王林徐大为
申请(专利权)人:天津泰凡科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1