当前位置: 首页 > 专利查询>深圳大学专利>正文

知识图谱嵌入模型训练方法、装置、电子设备及介质制造方法及图纸

技术编号:31679340 阅读:16 留言:0更新日期:2022-01-01 10:24
本申请实施例公开了一种知识图谱嵌入表示模型训练方法。该方法包括:获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。以上技术方案中从多维度选择节点的邻接节点,并将节点与其邻接节点之间的关联信息进行聚合作为节点的向量表示,使模型在训练时可以学习到更丰富的信息,从而使得到的节点的嵌入式表示具有更优的空间和文本辨别能力。别能力。别能力。

【技术实现步骤摘要】
知识图谱嵌入模型训练方法、装置、电子设备及介质


[0001]本申请实施例涉及知识图谱嵌入
,尤其涉及一种知识图谱嵌入表示模型训练方法、装置、电子设备及介质。

技术介绍

[0002]所谓知识图谱(Knowledge Graph,KG),即揭示实体之间关系的语义网络,它利用图结构形式化的描述并存储现实世界复杂的事物及其相互关系。目前,许多大型知识图谱都采用(头实体,关系,尾实体)形式的三元组来描述事物和关系。虽然这种表示方式可以有效地表示结构化数据,而且易于人们理解,但是,随着知识图谱规模的不断扩大,三元组的符号性却使得直接操作知识图谱变得困难。为了能高效地操作和使用知识图谱,研究人员尝试将实体和关系表示为低维连续向量,从而方便计算机理解和计算。
[0003]为了得到表达能力更强的嵌入表示,研究人员将知识图谱中的附加信息加入实体的嵌入式表示中。但现有技术依然存在一个不足:目前得到的实体嵌入表示无法同时保留实体的空间信息和文本信息,也就意味着,人们无法利用这些嵌入表示来同时从空间和文本的角度区分不同的实体。

技术实现思路

[0004]本申请实施例提供一种知识图谱嵌入表示模型训练方法、装置、电子设备及介质,可以使模型生成的嵌入表示能同时从空间和文本的角度将知识图谱中不同的实体区分开来。
[0005]在一个实施例中,本申请实施例提供了一种知识图谱嵌入表示模型训练方法,所述方法包括:获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体;通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
[0006]在一个实施例中,本申请实施例提供了一种知识图谱嵌入表示模型训练装置,其特征在于,该装置包括:第一关联向量确定装置,用于获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体;第一聚合结果确定模块,用于通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;
第一模型训练模块,用于将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
[0007]在一个实施例中,本申请实施例提供了一种电子设备,其特征在于,所述电子设备包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现如本申请任一实施例所述的知识图谱嵌入表示模型训练方法。
[0008]在一个实施例中,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请任一实施例所述的知识图谱嵌入表示模型训练方法。
[0009]本申请实施例通过以下方法得到了节点的嵌入式表示:获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体; 通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。以上技术方案中从多维度选择节点的邻接节点,并将节点与其邻接节点之间的关联信息进行聚合作为节点的向量表示,使模型在训练时可以学习到更丰富的信息,从而使得到的节点的嵌入式表示具有更优的空间和文本辨别能力,从而更准确的从空间和文本的角度将不同实体区分开来。
附图说明
[0010]图1是本申请实施例提供的实体空间位置示意图;图2是本申请实施例提供的实体向量表示示意图;图3是本申请一种实施例提供的知识图谱嵌入表示模型训练方法流程图;图4是本申请另一种实施例提供的知识图谱嵌入表示模型训练方法流程图;图5是本申请又一种实施例提供的知识图谱嵌入表示模型训练方法流程图;图6是本申请一种实施例提供的知识图谱嵌入表示模型训练装置结构框图;图7是本申请一种实施例提供的电子设备的结构示意图。
具体实施方式
[0011]下面结合附图和实施例对本申请在实施例中作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
[0012]在描述实施例之前,先对现有技术的缺陷进行说明。以图1和图2为例。图1是本申请实施例提供的实体空间位置示意图。如图1所示,图1中圆圈和方框所示的四个实体的空间相对位置是摘取自DBpedia数据集的实体在地图中的位置。其中实体p1, p2, p3均为学校,属于同类实体,实体 p4则为车站。
[0013]图2是本申请实施例提供的实体向量表示示意图。从图2可以看出,p1和p4的向量
表示是通过多个方框表示,p2和p3的向量表示是通过多个圆圈表示的,而实际上p1, p2, p3为同一类实体,p4为另一类实体,所以可以看出现有技术得到的向量表示不能有效划分不同类别的实体。正是因为有些实体(如p3和p4)地理(空间)相距较近但文本差异大,有些实体(如p1和p3)文本相似但在地理(空间)上相距相远,想要准确的区分这些实体,就必须要求实体嵌入表示具备空间

文本感知能力。所以本申请实施例提供了一种知识图谱嵌入表示模型用于解决上述问题。
[0014]图3是本申请一种实施例提供的知识图谱嵌入表示模型训练方法流程图,本实施例可适用于根据实体的嵌入表示将地理位置相距较远、文本描述不相关的实体区分开,尤其是具备空间坐标的实体。该方法可以由本申请实施例所提供的知识图谱嵌入表示模型训练装置执行,该装置可以由软件和/或硬件的方式来实现,并可集成于电子设备中。
[0015]如图3所示,本申请实施例中提供的知识图谱嵌入表示模型训练方法可包括以下步骤:S310、获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体。
[0016]在知识图谱中通常通过节点表征实体,节点与节点之间的连线表征实体与实体之间的关系。所以本申请实施例中用节点来表示知识图谱中的实体。
[0017]知识图谱中有多个节点,当前节点可以是从多个节点中随机选出的一个节点,所有节点都遍历一遍。
[0018]本申请实施例中,当前节点的邻接节点,可以是知识图谱结构中与当前节点直接相连的邻接节点,也可以是在空间地理位置上与当前节点距离最近的预设数量的邻接节点,也可以是二者的组合。
[0019]其中,在空间地理位置上与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱嵌入表示模型训练方法,其特征在于,所述方法包括:获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体;通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。2.根据权利要求1所述的方法,其特征在于,所述将所述第一关联聚合结果作为当前节点的更新向量表示之后,还包括:根据当前节点和邻接节点的更新向量表示,确定当前节点和邻接节点之间的第二关联向量;通过聚合函数将所述第二关联向量进行聚合,得到当前节点与所有邻接节点之间的第二关联聚合结果,并将所述第二关联聚合结果作为当前节点的最终向量表示;将所述最终向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。3.根据权利要求1或2所述的方法,其特征在于,所述当前节点的邻接节点,包括在知识图谱结构中与当前节点直接相连的邻接节点,和/或,在空间地理位置上与当前节点距离最近的预设数量的邻接节点。4.根据权利要求1所述的方法,其特征在于,所述根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量,包括:将当前节点和邻接节点的初始向量表示进行拼接,得到第一拼接向量;根据当前节点和邻接节点之间的空间邻近度和文本相似度,确定当前节点和邻接节点之间的关联信息;将所述关联信息与所述第一拼接向量相乘,得到当前节点和邻接节点之间的第一关联向量。5.根据权利要求2所述的方法,其特征在于,所述根据当前节点和邻接节点的更新向量表示,确定当前节点和邻接节点之间的第二关联向量,包括:将当前节点和邻接节点的更新向量表示进行拼接,得到第二拼接向量;根据当前节点和邻接节点之间的空间邻近度和文本相似度,确定当前节点和邻接节点之间的关联信息;将所述关联信息与所述第二拼接向量相乘,得到当前节点和邻接节点之间的第二...

【专利技术属性】
技术研发人员:吴定明周钰棋陆克中詹金颖
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1