当前位置: 首页 > 专利查询>广州大学专利>正文

知识图谱融合方法及系统技术方案

技术编号:39813161 阅读:8 留言:0更新日期:2023-12-22 19:30
本发明专利技术公开了一种知识图谱融合方法及系统,包括:

【技术实现步骤摘要】
知识图谱融合方法及系统


[0001]本专利技术涉及知识图谱融合领域,尤其是涉及一种知识图谱融合方法及装置


技术介绍

[0002]聚类与推理的缺点在于对于语义复杂或跨领域的知识
,
其类别划分难以准确进行
,
影响推理的效果

主要原因在于现有的聚类方法大多基于实体或关系的表面特征进行类别划分
,
难以深入理解语义概念

而迁移学习的缺点在于
Embedding
空间的构建离不开大量训练数据
,
但真实世界的知识图谱数据有限
,
影响模型的泛化能力

多任务学习的缺点在于共享
Embedding
的需求下
,
不同任务的特征差异难以在同一空间表达
,
导致任务间干扰

真实知识图谱关注领域差异大
,
语义表达方式也不同
,
在共享
embedding
下导致难以兼顾各任务之间差异

人工校验的缺点在于需要大量人工参与
,
成本高

效率低
,
难以处理大规模知识图谱

而且人工判断的知识面有限
,
缺乏全面覆盖广泛知识的能力
,
导致校验效率较低


技术实现思路

[0003]本专利技术的目的在于提供一种知识图谱融合方法及装置,旨在解决知识图谱融合

[0004]本专利技术提供一种知识图谱融合方法,包括:
[0005]S1、
获取两个知识图谱中的实体

关系和属性信息得到两组知识三元组,基于两组知识三元组获取知识对齐结果;
[0006]S2、
基于知识对齐结果进行差异判断,对存在差异的知识进行准确性和权威判断,根据判断结果进行知识选择;
[0007]S3、
将知识选择后的知识进行融合得到图谱

[0008]本专利技术还提供一种知识图谱融合系统,包括:
[0009]获取模块,用于获取两个知识图谱中的实体

关系和属性信息得到两组知识三元组,基于两组知识三元组获取知识对齐结果;
[0010]判断模块:用于基于知识对齐结果进行差异判断,对存在差异的知识进行准确性和权威判断,根据判断结果进行知识选择;
[0011]融合模块
:
用于将知识选择后的知识进行融合得到图谱

[0012]采用本专利技术实施例,知识图谱融合

[0013]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的

特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式

附图说明
[0014]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的
附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0015]图1是本专利技术实施例的知识图谱融合方法的流程图;
[0016]图2是本专利技术实施例的知识图谱融合系统的示意图

具体实施方式
[0017]下面将结合实施例对本专利技术的技术方案进行清楚

完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围

[0018]方法实施例
[0019]根据本专利技术实施例,提供了一种知识图谱融合方法,图1是本专利技术实施例的知识图谱融合方法的流程图,如图1所示,具体包括:
[0020]S1、
获取两个知识图谱中的实体

关系和属性信息得到两组知识三元组,基于两组知识三元组获取知识对齐结果;
[0021]S2、
基于知识对齐结果进行差异判断,对存在差异的知识进行准确性和权威判断,根据判断结果进行知识选择;
[0022]S3、
将知识选择后的知识进行融合得到图谱

[0023]S1
具体包括:两张知识图谱中抽取出实体

关系与属性信息形成两组知识三元组,采用映射规则与语义相似度算法
,
判断两组知识三元组中的实体与关系是否描述相同事件要素
,
获得知识对齐结果

[0024]S2
具体包括:对未对齐的实体或关系进行对比
,
判断两张图谱的表达方式或信息是否存在差异,如果差异未超过事先设定好的阈值,则采取对应表达方式进行整合;如果差异超过阈值,则借助额外的信息源,对存在差异的知识进行取舍或者将存在差异的融合,最终完成对应位置实体和关系的对齐

[0025]S3
具体包括:将知识选择后的知识生成相应的知识补充方案
,
包括:添加属性或关系

修改属性值和调整关系结构;将对齐的知识与选择的差异知识进行融合
,
统一表达方式
,
并在属性或语义上进行关联
,
形成融合后的知识集;将融合后的知识集存储到图数据库中
,
构建知识融合后的事件知识图谱

[0026]S3
进一步包括:对知识图谱中的知识进行反馈,根据反馈结果补充知识图谱

[0027]具体实施方法如下:
[0028]知识抽取与对齐
:
从两张知识图谱中抽取出实体

关系与属性信息
,
形成两组知识三元组

这里的知识采用主语

谓语

宾语的三元组形式表示

以网络攻击事件为例
,
可以抽取出如下知识
:
知识图谱
a:{
黑客
,
利用
,
漏洞
}{APT3,
控制
,
木马程序
}{
木马程序
,
发起
,DDoS
攻击
}
;知识图谱
b:{
攻击者
,
利用
,
系统缺陷
}{
威胁组织
,
操控
,
恶意程序
}{
恶意程序
,
...

【技术保护点】

【技术特征摘要】
1.
一种知识图谱融合方法,其特征在于,包括:
S1、
获取两个知识图谱中的实体

关系和属性信息得到两组知识三元组,基于两组知识三元组获取知识对齐结果;
S2、
基于知识对齐结果进行差异判断,对存在差异的知识进行准确性和权威判断,根据判断结果进行知识选择;
S3、
将知识选择后的知识进行融合得到图谱
。2.
根据权利要求1所述的方法,其特征在于,所述
S1
具体包括:两张知识图谱中抽取出实体

关系与属性信息形成两组知识三元组,采用映射规则与语义相似度算法
,
判断两组知识三元组中的实体与关系是否描述相同事件要素
,
获得知识对齐结果
。3.
根据权利要求2所述的方法,其特征在于,所述
S2
具体包括:对未对齐的实体或关系进行对比
,
判断两张图谱的表达方式或信息是否存在差异,如果差异未超过事先设定好的阈值,则采取对应表达方式进行整合;如果差异超过阈值,则借助额外的信息源,对存在差异的知识进行取舍或者将存在差异的融合,最终完成对应位置实体和关系的对齐
。4.
根据权利要求3所述的方法,其特征在于,所述
S3
具体包括:将知识选择后的知识生成相应的知识补充方案
,
包括:添加属性或关系

修改属性值和调整关系结构;将对齐的知识与选择的差异知识进行融合
,
统一表达方式
,
并在属性或语义上进行关联
,
形成融合后的知识集;将融合后的知识集存储到图数据库中
,
构建知识融合后的事件知识图谱
。5.
根据权利要求4所述的方法,其特征在于,所述
S3
进一步包括:对知识图谱中的...

【专利技术属性】
技术研发人员:田志宏马冰琦刘园李默涵鲁辉仇晶孙彦斌苏申徐光侠
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1