【技术实现步骤摘要】
知识图谱融合方法及系统
[0001]本专利技术涉及知识图谱融合领域,尤其是涉及一种知识图谱融合方法及装置
。
技术介绍
[0002]聚类与推理的缺点在于对于语义复杂或跨领域的知识
,
其类别划分难以准确进行
,
影响推理的效果
。
主要原因在于现有的聚类方法大多基于实体或关系的表面特征进行类别划分
,
难以深入理解语义概念
。
而迁移学习的缺点在于
Embedding
空间的构建离不开大量训练数据
,
但真实世界的知识图谱数据有限
,
影响模型的泛化能力
。
多任务学习的缺点在于共享
Embedding
的需求下
,
不同任务的特征差异难以在同一空间表达
,
导致任务间干扰
。
真实知识图谱关注领域差异大
,
语义表达方式也不同
,
在共享
embedding
下导致难以兼顾各任务之间差异
。
人工校验的缺点在于需要大量人工参与
,
成本高
、
效率低
,
难以处理大规模知识图谱
。
而且人工判断的知识面有限
,
缺乏全面覆盖广泛知识的能力
,
导致校验效率较低
。
技术实现思路
[0003]本专利技术的目的在于提供一种知识
【技术保护点】
【技术特征摘要】
1.
一种知识图谱融合方法,其特征在于,包括:
S1、
获取两个知识图谱中的实体
、
关系和属性信息得到两组知识三元组,基于两组知识三元组获取知识对齐结果;
S2、
基于知识对齐结果进行差异判断,对存在差异的知识进行准确性和权威判断,根据判断结果进行知识选择;
S3、
将知识选择后的知识进行融合得到图谱
。2.
根据权利要求1所述的方法,其特征在于,所述
S1
具体包括:两张知识图谱中抽取出实体
、
关系与属性信息形成两组知识三元组,采用映射规则与语义相似度算法
,
判断两组知识三元组中的实体与关系是否描述相同事件要素
,
获得知识对齐结果
。3.
根据权利要求2所述的方法,其特征在于,所述
S2
具体包括:对未对齐的实体或关系进行对比
,
判断两张图谱的表达方式或信息是否存在差异,如果差异未超过事先设定好的阈值,则采取对应表达方式进行整合;如果差异超过阈值,则借助额外的信息源,对存在差异的知识进行取舍或者将存在差异的融合,最终完成对应位置实体和关系的对齐
。4.
根据权利要求3所述的方法,其特征在于,所述
S3
具体包括:将知识选择后的知识生成相应的知识补充方案
,
包括:添加属性或关系
、
修改属性值和调整关系结构;将对齐的知识与选择的差异知识进行融合
,
统一表达方式
,
并在属性或语义上进行关联
,
形成融合后的知识集;将融合后的知识集存储到图数据库中
,
构建知识融合后的事件知识图谱
。5.
根据权利要求4所述的方法,其特征在于,所述
S3
进一步包括:对知识图谱中的...
【专利技术属性】
技术研发人员:田志宏,马冰琦,刘园,李默涵,鲁辉,仇晶,孙彦斌,苏申,徐光侠,
申请(专利权)人:广州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。