一种基于实体关系挖掘的知识图谱构建方法技术

技术编号:38822519 阅读:14 留言:0更新日期:2023-09-15 20:01
本发明专利技术公开一种基于实体关系挖掘的知识图谱构建方法,首先利用用户

【技术实现步骤摘要】
一种基于实体关系挖掘的知识图谱构建方法
[0001]技术邻域
[0002]本专利技术涉及知识图谱构建
,尤其是一种基于实体关系挖掘的知识图谱构建方法。

技术介绍

[0003]知识图谱是一种用于描述实体之间关系的语义网络结构,它被广泛应用于自然语言处理、信息检索和推荐系统等领域。知识图谱中的关系是描述实体之间相互作用的基本单元,但是在实际应用中,由于数据稀疏性的影响,知识图谱中的关系通常是不完整的,关系信息过于稀少,不能很好地描述物品本身。为了解决这个问题,现有的方法主要是通过增加数据量、融合多源信息等手段来填充缺失的关系,但是需要大量的数据和计算资源且存在着一定的风险和局限性。

技术实现思路

[0004]本专利技术是为了解决现有技术所存在的上述技术问题,提供一种基于实体关系挖掘的知识图谱构建方法。
[0005]本专利技术的技术解决方案是:一种基于实体关系挖掘的知识图谱构建方法,按照如下步骤进行:
[0006]步骤1:获取用户

物品二部图G1={(u,r0,i)|u∈U,i∈I},U和I分别表示用户集和项目集,r0为决定关系,所述I={i1,i2,i3…
i
N
},U={u1,u2,u3…
u
M
},r0=1表示用户u和项目i之间有交互,否则r0=0;获取知识图谱G2={(h,r,t)|h,t∈V,r∈R},V和R分别表示知识图谱中的实体集和关系集,其中V={v1,v2,v3…
v
L
},R={r1,r2,r3…
r
K
},三元组(h,r,t)表示实体h和实体t之间存在r关系;根据G1、G2生成协同知识图G={(h,r,t)|h,t∈V

,r∈R

},其中V

=VUU,R

=R∪r0;
[0007]步骤2:根据获得的协同知识图G,为每个用户建立一个决策表,决策表的第一列为项目I,决策表的第一行由条件关系R和决定关系r0组成,决策表中元素为实体v
l
,定义实体v
l
为一个表示项目i
N
在关系r
k
下所对应的实体的函数ρ(i
n
,r
k
),l∈L,若没有对应的实体,则用0填充;
[0008]步骤3:根据决策表中的每两个关系生成新关系:
[0009]步骤3.1:根据决策表,在条件关系r
x
和条件关系r
y
对应的实体之间,定义新关系其中x,y∈K且x≠y,表示r
x
关系下的实体集,表示r
y
关系下的实体集,定义R

(r
x
,r
y
)为对r
x
和r
y
的相互关系的支持集,用下式表示:
[0010][0011]由此定义可以将两个关系r
x
,r
y
之间的相互关系表示为新关系R

xy

[0012]步骤3.2:对所有项目进行如下三个步骤的分割:
[0013]步骤3.2.1基于决定关系r0定义一种分割D,将项目分为两类,一类是与用户有交
互,另一类是与用户没有交互;
[0014]步骤3.2.2从由两个条件关系组成的集合{r
x
,r
y
}的不可识别关系中得到项目的分割为
[0015]步骤3.2.3从由两个条件关系组成的集合{r
x
,r
y
}中,根据关系R

xy
的取值方式构成分割即在关系成立的情况下,由其支持集和补集构成的分割:
[0016][0017]步骤3.3:定义评价指标sim,分别计算和D之间的相似度:
[0018]步骤3.3.1通过计算分割与D分割之间的相似度,评价两个条件关系r
x
,r
y
对用户选择项目的影响力大小:
[0019][0020]其中,和|D|是集合的基数;
[0021]当大于时,进行步骤3.3.2,否则认为这两个条件关系r
x
,r
y
对用户选择项目的影响力太小而直接舍弃;
[0022]步骤3.3.2通过计算分割与D分割之间的相似度,以评价新生成的关系R,并对新关系进行取舍,
[0023][0024]选择使与D相似度最大的关系R

xy
作为最终确定的新关系,若相似度相等,选择集合中元素较少的关系R

xy
作为最终确定的新关系;
[0025]步骤3.4:基于得到的新关系R

xy
,决策表中各项目在新关系R

xy
下的值如下:
[0026][0027]步骤4:将新关系R

xy
连接到协同知识图G相应的项目节点i中,即若ρ(i,R

xy
)=1,则项目节点i构建一个新的三元组(i,R

xy
,v

),v

是创建的一个新的虚拟实体。
[0028]本专利技术首先利用用户

物品交互二部图和知识图谱构建协同知识图谱;再根据获取到的协同知识图谱为每个用户建立一个决策表,其中每行表示物品,每列表示关系,表格中的值表示对应物品与关系之间的实体;根据定义的分割方法,分别从已有的两个关系中生成一种新关系;将新生成的关系融合到协同知识图谱中。可丰富物品的属性信息,使知识图谱中的信息更加丰富,有效改善知识图谱中关系稀少的现象,无需大量的数据和计算资源,解决了现有技术为此所存在的一定风险和局限性。
附图说明
[0029]图1为本专利技术实施例所获取的用户

项目二部图谱G1。
[0030]图2为本专利技术实施例所获取的物品

实体知识图谱G2。
[0031]图3为本专利技术实施例所获取的协同知识图谱G。
[0032]图4为本专利技术实施例所获取的加入新关系后的协同知识图谱。
具体实施方式
[0033]本专利技术的一种基于实体关系挖掘的知识图谱构建方法,按照如下步骤进行:
[0034]步骤1:获取如图1所示的用户

物品二部图G1={(u,r0,i)|u∈U,i∈I},U和I分别表示用户集和项目集,r0为决定关系,所述I={i1,i2,i3…
i
N
},U={u1,u2,u3…
u
M
},r0=1表示用户u和项目i之间有交互,否则r0=0;获取入图2所示的知识图谱G2={(h,r,t)|h,t∈V,r∈R},V和R分别表示知识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于实体关系挖掘的知识图谱构建方法,其特征在于按照如下步骤进行:步骤1:获取用户

物品二部图G1={(u,r0,i)|u∈U,i∈I},U和I分别表示用户集和项目集,r0为决定关系,所述I={i1,i2,i3...i
N
},U={u1,u2,u3...u
M
},r0=1表示用户u和项目i之间有交互,否则r0=0;获取知识图谱G2={(h,r,t)|h,t∈V,r∈R},V和R分别表示知识图谱中的实体集和关系集,其中V={v1,v2,v3...v
L
},R={r1,r2,r3...r
K
},三元组(h,r,t)表示实体h和实体t之间存在r关系;根据G1、G2生成协同知识图G={(h,r,t)|h,t∈V

,r∈R

},其中V

=V∪U,R

=R∪r0;步骤2:根据获得的协同知识图G,为每个用户建立一个决策表,决策表的第一列为项目I,决策表的第一行由条件关系R和决定关系r0组成,决策表中元素为实体v
l
,定义实体v
l
为一个表示项目i
N
在关系r
k
下所对应的实体的函数ρ(i
n
,r
k
),l∈L,若没有对应的实体,则用0填充;步骤3:根据决策表中的每两个关系生成新关系:步骤3.1:根据决策表,在条件关系r
x
和条件关系r
y
对应的实体之间,定义新关系其中x,y∈K且x≠y,表示r
x
关系下的实体集,表示r
y
关系下的实体集,定义R

(r
x
,r
y
)为对r
x
和r
y
的相互关系的支持集,用下式表示:由此定义可以将两个关系r
x<...

【专利技术属性】
技术研发人员:张志鹏王安琪张宇航周平磊张尧任永功
申请(专利权)人:辽宁师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1