当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于类比推理的增强知识图谱补全方法技术

技术编号:37057961 阅读:8 留言:0更新日期:2023-03-29 19:34
本发明专利技术公开了一种基于类比推理的增强知识图谱补全方法,在电商知识图谱的三元组的链接预测和补全领域中,为嵌入模型设计了一个类比推理方式,利用三元组间潜在的表示交互信息和语义信息来增强现有嵌入模型的类比推理能力并使得原本嵌入模型的归纳推理和类比推理相互补充,增强了嵌入模型的推理能力,进而提升了对电商知识图谱的三元组链接预测能力,提升了电商知识图谱的补全效率和准确性。提供的类比推理方式具有通用性,对于当前主流的任何嵌入模型都能适用并且增强了嵌入模型的类比推理能力,对于电商知识图谱补全任务的准确率有较为明显的提升。有较为明显的提升。有较为明显的提升。

【技术实现步骤摘要】
一种基于类比推理的增强知识图谱补全方法


[0001]本专利技术属于电商知识图谱推理
,具体涉及一种基于类比推理的增强知识图谱补全方法。

技术介绍

[0002]在传统的知识图谱中,知识通常以三元组[头实体,关系,尾实体](简称(h,r,t))的形式来进行表示,使用关系(relation)链接头实体(head entity)和尾实体(tail entity)来组成三元组。目前工业界已经开发了非常多的知识图谱项目,比如FreeBase,YAGO和WordNet。它们在推荐系统、知识问答和语义搜索等领域发挥了重要的作用。
[0003]知识图谱最大的特点是它通过一种结构化的方式存储了大量的信息。其中最重要的两种信息是文本信息和结构信息。文本信息是指在知识图谱中实体和关系的文本描述的语义信息,结构信息是指实体通过关系和其他实体存在的某种联系,通常一个实体并不只与一个关系链接。而实体的多关系现象又提供了很多潜在的信息。但是这种潜在信息并没有被充分利用,这导致知识图谱往往是不完整的,因此在现有的知识图谱中预测缺失的三元组,即知识图谱补全(KGC)任务具有很重要的意义。
[0004]在知识图谱中,利用三元组表示知识并采用独热(one

hot)向量对实体和关系进行建模。但当知识图谱数据量增多时会导致维度过大。当两个实体和关系很接近时,独热向量往往无法有效地对实体进行区分。因此受到Word2Vec模型的启发,学术界逐渐提出了建模实体和关系的方法。如TransE,RotatE等。这些模型通常被称为平移模型,其基本思想是通过对知识图谱三元组结构的学习,使用低维稠密向量来表示头实体、关系和尾实体。例如在TransE中,其思想就是让头实体向关系向量方向进行平移使得其表示更接近尾实体。这种方法相比独热向量的表示方法更为有效,适用于知识图谱的补全,但是存在可解释性差,对关系建模能力不强等问题。
[0005]在电商领域,商家有时会根据商品的相似关系,为用户进行关联推荐。一方面,推荐相关的产品会给消费者提供更多的选择空间,带来更加良好的购物体验,另一方面商家也可以获取更高的利润。例如,当养猫的消费者在购买猫粮时,如果为其提供与养猫相关的商品推荐,往往会被一并购买。但是由于电商场景中,物品标签众多,靠人工去为标签之间的相似关系进行标注会消耗大量的人力物力。因此如果能提出一种检索商品之间类似关系的方法,在用户购买其中一个商品时,自动检索与这个商品的相似商品为其进行推荐。会给顾客带来更加良好的购物体验,也会使商家获得更高的利润。

技术实现思路

[0006]鉴于上述,本专利技术的目的是提供一种基于类比推理的增强知识图谱补全方法,使得现有知识图谱嵌入模型在实体的链接预测任务中有了更好的表现,提升电商知识图谱的实体预测的准确性,利于电商知识图谱的补全。
[0007]为实现上述专利技术目的,实施例提供的一种基于类比推理的增强知识图谱补全方
法,包括以下步骤:
[0008]步骤1,提取电商知识图谱的原始三元组,利用嵌入模型学习原始三元组的原始态嵌入表示;
[0009]步骤2,将三元组划分为实体层次、关系层次以及三元组层次这三个类比层次,并基于原始态嵌入表示通过类比映射函数映射得到三个类比层次的类比态嵌入表示;
[0010]步骤3,根据原始三元组生成三个类比层次的多个类比对象,计算每个类比层次对应的多个类比对象的原始态嵌入表示,并通过聚合多个类比对象的原始态嵌入表示以得到每个类比层次的理想态嵌入表示;
[0011]步骤4,针对每个类比层次,依据类比态嵌入表示和理想态嵌入表示计算相似度得分和嵌入模型的模型得分以及损失权重,根据相似度得分和模型得分构建类比损失后,以损失权重对类比损失加权来构建综合三个类比层次的综合损失;
[0012]步骤5,利用综合损失优化类比映射函数的参数,使得类比态嵌入表示更加接近于理想态嵌入表示;
[0013]步骤6,针对电商知识图谱中的缺失三元组,提取电商知识图谱所有实体与缺失三元组组成新三元组,针对每个新三元组,利用嵌入模型得到原始态嵌入表示,并根据该原始态嵌入表示通过参数优化的类比映射函数映射得到新三元组对应的实体层次和关系层次的类比态嵌入表示;
[0014]步骤7,针对每个新三元组,依据原始态嵌入表示和类比态嵌入表示计算新三元组和三个类比层对应的类比对象在嵌入模型的模型得分,依据三个类比层次对应的语义信息计算得分权重,依据得分权重对模型得分进行加权求和,以得到新三元组的综合得分;
[0015]步骤8,所有新三元组的综合得分筛选得分高的新三元组作为缺失三元组的补全三元组,实现对电商知识图谱的增强补全。
[0016]优选地,步骤2中,类比映射函数包含关系映射向量、实体映射向量和关系转移矩阵M
trans
,应用该类比映射函数,实现的三个类比层次的映射,表示为:
[0017]实体层次的映射:
[0018]关系层次的映射:
[0019]三元组层次的映射:z
a
=g
r
(h
a
,r
a
)
[0020]其中,h
a
表示实体层次的类比态嵌入表示,h表示原始三元组中实体的原始态嵌入表示,r表示原始三元组中关系的原始态嵌入表示,r
a
表示关系层次的类比态嵌入表示,z
a
表示三元组层次的类比态嵌入表示,g
r
(
·
)表示三元组函数,由嵌入模型针对原始三元组的评分函数转换得到,λ为关系转移矩阵的比例系数为超参数,符号ο表示元素相乘。
[0021]优选地,步骤3中,针对实体层次,利用电商知识图谱中所有实体替换原始三元组的头实体得到类比对象,计算类比对象在嵌入模型的模型得分f
r
(h
i
,r,t),并选择其中模型得分f
r
(h
i
,r,t)最高的N
e
个实体组成类比实体集合,根据得分f
r
(h
i
,r,t)的激活值确定加权权重,依据加权权重和类比对象中头实体的原始态嵌入表示进行聚合,得到实体层次的理想态嵌入表示
[0022]针对关系层次,利用电商知识图谱中所有关系替换原始三元组的关系得到类比对
象,计算类比对象在嵌入模型对应模型得分f
r
(h,r
i
,t),并选择其中模型得分f
r
(h,r
i
,t)最高的N
r
个关系组成类比关系集合,根据得分f
r
(h,r
i
,t)的激活值确定加权权重,依据加权权重和类比对象中关系的原始态嵌入表示进行聚合,得到关系层次的理想态嵌入表示入表示
[0023]针对三元组层次,利用电商知识图谱中实体和关系组成的实体关系对替换原始三元组的实体和关系得到类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于类比推理的增强知识图谱补全方法,其特征在于,包括以下步骤:步骤1,提取电商知识图谱的原始三元组,利用嵌入模型学习原始三元组的原始态嵌入表示;步骤2,将三元组划分为实体层次、关系层次以及三元组层次这三个类比层次,并基于原始态嵌入表示通过类比映射函数映射得到三个类比层次的类比态嵌入表示;步骤3,根据原始三元组生成三个类比层次的多个类比对象计算每个类比层次对应的多个类比对象的原始态嵌入表示,并通过聚合多个类比对象的原始态嵌入表示以得到每个类比层次的理想态嵌入表示;步骤4,针对每个类比层次,依据类比态嵌入表示和理想态嵌入表示计算相似度得分和嵌入模型的模型得分以及损失权重,根据相似度得分和模型得分构建类比损失后,以损失权重对类比损失加权来构建综合三个类比层次的综合损失;步骤5,利用综合损失优化类比映射函数的参数,使得类比态嵌入表示更加接近于理想态嵌入表示;步骤6,针对电商知识图谱中的缺失三元组,提取电商知识图谱所有实体与缺失三元组组成新三元组,针对每个新三元组,利用嵌入模型得到原始态嵌入表示,并根据该原始态嵌入表示通过参数优化的类比映射函数映射得到新三元组对应的实体层次和关系层次的类比态嵌入表示;步骤7,针对每个新三元组,依据原始态嵌入表示和类比态嵌入表示计算新三元组和三个类比层对应的类比对象在嵌入模型的模型得分,依据三个类比层次对应的语义信息计算得分权重,依据得分权重对模型得分进行加权求和,以得到新三元组的综合得分;步骤8,所有新三元组的综合得分筛选得分高的新三元组作为缺失三元组的补全三元组,实现对电商知识图谱的增强补全。2.根据权利要求1所述的基于类比推理的增强知识图谱补全方法,其特征在于,步骤2中,类比映射函数包含关系映射向量实体映射向量和关系转移矩阵M
trans
,应用该类比映射函数,实现的三个类比层次的映射,表示为:实体层次的映射:关系层次的映射:三元组层次的映射:z
a
=g
r
(h
a
,r
a
)其中,h
a
表示实体层次的类比态嵌入表示,h表示原始三元组中实体的原始态嵌入表示,r表示原始三元组中关系的原始态嵌入表示,r
a
表示关系层次的类比态嵌入表示,z
a
表示三元组层次的类比态嵌入表示,g
r
(
·
)表示三元组函数,由嵌入模型针对原始三元组的评分函数转换得到,λ为关系转移矩阵的比例系数为超参数,符号表示元素相乘。3.根据权利要求1所述的基于类比推理的增强知识图谱补全方法,其特征在于,步骤3中,针对实体层次,利用电商知识图谱中所有实体替换原始三元组的头实体得到类比对象,计算类比对象在嵌入模型的模型得分f
r
(h
i
,r,t),并选择其中模型得分f
r
(h
i
,r,t)最高的N
e
个实体组成类比实体集合根据得分f
r
(h
i
,r,t)的激活值确定加权权重依据加权权重和类比对象中头实体的原始态嵌入表示进行聚合,得到实体层次的理想态嵌入表
示针对关系层次,利用电商知识图谱中所有关系替换原始三元组的关系得到类比对象,计算类比对象在嵌入模型对应模型得分f
r
(h,r
i
,t),并选择其中模型得分f
r
(h,r
i
,t)最高的N
r
个关系组成类比关系集合根据得分f
r
(h,r
i
,t)的激活值确定加权权重依据加权权重和类比对象中关系的原始态嵌入表示进行聚合,得到关系层次的理想态嵌入表示示针对三元组层次,利用电商知识图谱中实体和关系组成的实体关系对替换原始三元组的实体和关系得到类比对象,计算类比对象在嵌入模型的模型得分f
r
(h
i
,r
i
,t),并选择其中模型得分f
r
(h
i
,r
i
,t)最高的N
t
个实体关系对组成类比实体关系对集合根据得分f
r
(h
i
,r
i
,t)的激活值确定加权权重依据加权权重和类比对象中实体的原始态嵌入表示进行聚合,得到理想态嵌入表示依据加权权重和类比对象中关系的原始态嵌入表示进行聚合,得到理想态嵌入表示然后和通过三元组函数g
r
(
·
)计算得到三元组层次的理想态嵌入表示4.根据权利要求3所述的基于类比推理的增强知识图谱补全方法,其特征在于,加权权重加权权重加权权重加权权重其中,Softmax(
·
)表示Softmax函数。5.根据权利要求1所述的基于类比推理的增强知识图谱补全方法,其特征在于,步骤4中,针对实体层次,构建的类比损失L
E
,表示为;L
E
=logσ(γ||h
a

h
+
||2‑
f
r
(h
a
,r,t))针对关系层次,构建的类比损失L
R
,表示为:L
R
=logσ(γ||r
a

r
+<...

【专利技术属性】
技术研发人员:陈华钧姚祯张文
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1