基于知识图谱的开放领域问答方法及相关设备技术

技术编号：35933843 阅读：11 留言：0更新日期：2022-12-14 10:20

本申请提供了一种基于知识图谱的开放领域问答方法及相关设备，该方法通过多种匹配方法对问题描述的实体和属性进行提取得到实体属性候选集，能够有效提升实体属性抽取的召回率，避免漏掉问题描述中的隐层信息。基于实体属性候选集进行路径挖掘以得到初始路径，再对初始路径进行组合和筛选以得到带有限制条件的限制组合路径，能够有效降低无效路径的召回，针对多限制问题描述进行精确路径建模，进而降低后续针对路径的算力成本。通过分类模型输出限制组合路径和问题描述的相似度得分，将相似度得分得分最高的限制组合路径对应的知识图谱子图作为推荐答案数据，提升用户的体验感。感。感。

全部详细技术资料下载

【技术实现步骤摘要】
基于知识图谱的开放领域问答方法及相关设备

[0001]本申请涉及知识图谱
，尤其涉及一种基于知识图谱的开放领域问答方法及相关设备。

技术介绍

[0002]随着互联网的迅速发展，数据量呈爆炸性的增长。网络数据正在从只包含网页之间文本数据的文档万维网转变为包含大量描述实体之间丰富关系的数据万维网。而知识图谱能够形式化地描述现实世界中的事物及其相互之间的关系，是以图的形式存储人类知识的大规模语义网络。目前，基于知识图谱的问答技术侧重于单次抽取的精度，抽取时尽可能减少实体和属性值的数量，导致抽取结果难以覆盖完全。此外，在路径查询时，使用固定模板进行查询且缺乏限制条件，导致获取路径不完全且及包含较多的无效路径，进而影响问答结果的准确性。

技术实现思路

[0003]有鉴于此，本申请的目的在于提出一种基于知识图谱的开放领域问答方法及相关设备。
[0004]基于上述目的，本申请提供了一种基于知识图谱的开放领域问答方法，包括：
[0005]获取用户输入的问题描述；
[0006]采用匹配方法对所述问题描述中的实体和属性进行提取，以得到实体属性候选集；
[0007]基于所述实体属性候选集中的实体和属性，在预先构建的知识图谱中进行路径挖掘，以得到多个初始路径；
[0008]对全部所述初始路径进行组合，得到多个组合路径；
[0009]对全部所述组合路径进行筛选，以得到多个限制组合路径；
[0010]将每个所述限制组合路径与所述问题描述输入至经过预训练的分类模型中进行...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的开放领域问答方法，其特征在于，包括：获取用户输入的问题描述；采用匹配方法对所述问题描述中的实体和属性进行提取，以得到实体属性候选集；基于所述实体属性候选集中的实体和属性，在预先构建的知识图谱中进行路径挖掘，以得到多个初始路径；对全部所述初始路径进行组合，得到多个组合路径；对全部所述组合路径进行筛选，以得到多个限制组合路径；将每个所述限制组合路径与所述问题描述输入至经过预训练的分类模型中进行分类预测，得到所述限制组合路径与所述问题描述的相似度分数；将最大所述相似度分数对应的所述限制组合路径在所述知识图谱中匹配的子图作为所述问题描述的推荐答案数据。2.根据权利要求1所述的方法，其特征在于，所述采用匹配方法对所述问题描述中的实体和属性进行提取，以得到实体属性候选集，包括：通过精确匹配方法和模糊匹配方法分别对所述问题描述中的实体和属性进行提取，以得到所述实体属性候选集。3.根据权利要求2所述的方法，其特征在于，所述实体属性候选集包括第一候选集和第二候选集，所述通过精确匹配方法和模糊匹配方法分别对所述问题描述中的实体和属性进行提取，以得到所述实体属性候选集，包括：将所述问题描述与预先构建的字典树进行匹配，以得到所述第一候选集；分别采用倒排索引方法和命名实体识别方法对所述问题描述中的实体进行提取，分别采用Duckling数值抽取方法和Lucene索引方法对所述问题描述中的属性进行提取，以得到所述第二候选集。4.根据权利要求1所述的方法，其特征在于，所述对全部所述初始路径进行组合，得到多个组合路径，包括：将具有相同答案节点的所述初始路径进行组合，得到所述组合路径。5.根据权利要求1所述的方法，其特征在于，所述对全部所述组合路径进行筛选，以得到多个限制组合路径，包括：基于所述问题描述确定与其关联的推理变量以及约束条件；根据推理变量的数值大小对全部所述组合路径进行排序，将满足所述约束条件的所述组合路径作为所述限制组合路径。6.根据权利要求1所述的方法，其特征在于，所述预训练，包括：构建正样本训练集和负样本训练集；...

【专利技术属性】
技术研发人员：贾勇哲，马国宁，王林，徐大为，
申请(专利权)人：天津泰凡科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人