一种基于层次注意力的知识图谱嵌入方法技术

技术编号：30324061 阅读：16 留言：0更新日期：2021-10-09 23:57

本发明专利技术公开一种基于层次注意力的知识图谱嵌入方法，首先对多个实体和关系连接而成的关系路径依据关系连接跳数分层，然后将不同层次下的多个实体和关系构造为多阶三元组，再通过图注意力机制对每一个三元组分配注意力权重，最后中心节点汇聚来自各阶三元组包含的多层次信息，从而提升知识图谱嵌入效果。从而提升知识图谱嵌入效果。从而提升知识图谱嵌入效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于层次注意力的知识图谱嵌入方法

[0001]本专利技术涉及知识图谱
，具体涉及一种基于层次注意力的知识图谱嵌入方法。

技术介绍

[0002]知识工程作为人工智能的重要分支，是指计算机借助知识推理解决各类计算问题。知识图谱是知识工程的最新成果，资源描述框架(resource description framwork，RDF)中定义了三元组作为知识单元，三元组彼此相连形成庞大的知识图谱。随着工业界百科图谱和垂直领域图谱的不断完善，知识图谱已经从研究阶段走向应用领域，为人工智能应用如信息检索、推荐系统、智能问答等提供了技术支撑。
[0003]图嵌入技术通过学习知识图谱中节点和属性边的特征，将其表示为低维稠密向量。知识图谱嵌入(knowledge graph embedding，KGE)有利于知识的加工和使用。知识图谱嵌入的研究主要集中在对三元组内实体和关系的建模。当前的研究工作通常用一种相似性理论刻画实体和关系间的联系。目前，常用的图嵌入模型主要有张量分解模型、词向量翻译模型和卷积神经网络模型等。
[0004]张量分解模型如DistMult、ComplEx、SimplE，采用双线性积来描述实体和关系相似性，该类模型由于对所有潜在的三元组打分，故计算的时间复杂度较高。部分模型通过设置约束条件以简化计算量，但降低了嵌入效果。
[0005]词向量翻译模型如TransE、TransH、TransG是利用同一关系在向量空间中的平移不变性。该类模型将三元组解释为词空间中的三个词向量，头实体向量h在某...

【技术保护点】

【技术特征摘要】
1.一种基于层次注意力的知识图谱嵌入方法，该知识图谱的节点对应实体，节点相连的有向边对应关系；其特征是，包括步骤如下：步骤1、根据知识图谱的多阶三元组构建实体嵌入向量X；即：步骤1.1、计算知识图谱的每个多阶三元组的向量表示步骤1.1、计算知识图谱的每个多阶三元组的向量表示步骤1.2、计算知识图谱的每个多阶三元组的注意力值步骤1.2、计算知识图谱的每个多阶三元组的注意力值步骤1.3、利用softmax归一化函数对知识图谱的每个多阶三元组的注意力值进行归一化，得到知识图谱的每个多阶三元组的注意力归一化值步骤1.4、计算知识图谱的每个实体的嵌入表示步骤1.4、计算知识图谱的每个实体的嵌入表示步骤1.5、将知识图谱的所有实体的嵌入表示组成实体嵌入向量X；步骤2、令初始的迭代次数t＝0，并采用正态分布随机初始化的方式构建初始的实体向量X0，其中初始的实体向量X0的维度与实体嵌入向量X的维度相同；步骤3、令迭代次数t加1，并计算第t次迭代的实体向量X
t
；X
t
＝W3X+X
t
‑1步骤4、计算第t次迭代的实体向量X
t
的最小化损失函数的最小化损失函数步骤5、判断最小化损失函数是否收敛：如果收敛，则第t次迭代的实体向量X
t
即为所求的知识图谱的最终实体向量；否则，转至步骤3；式中，表示知识图谱中第i个实体的向量表示，表示知识图谱中第j个实体的向量表示，表示知识图谱中第k个层次深度为n的多阶关系的向量表示；表示多阶三元组的三元组向量表示，表示多阶三元组的注意力值，表示多阶三元组的注意力归一化值，表示第i个实体的嵌入表示；X表示实体嵌入向量；X
t
表示第t次迭代的实体向量，X
t
‑1表示第t
‑
1次迭代的实体向量；||表示向量拼接，W1表示给...

【专利技术属性】
技术研发人员：李凤英，范伟豪，董荣胜，
申请(专利权)人：桂林电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人