System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于知识图谱领域,涉及一种基于复空间循环相关关系模型的知识图谱嵌入中链接预测方法以及用于知识图嵌入中链接预测的复空间循环相关关系模型。
技术介绍
1、知识图谱(kgs)作为图形结构的知识库,积累和存储关于现实世界的结构化实例,这些实例体现了来自文学、历史和专业领域的大量知识,与wordnet[1]、dbpedia[2]、freebase[3],knowledge vault[4]和openkg.cn1等项目集成,其中节点描述实体,边表示关系。它们在自然语言处理[5]中日益流行,例如知识库问答[6],推荐系统[7]和语音识别[8],它们在人工智能(ai)实现中起着至关重要的作用[9]。上述标准数据库包含事实三元组,表示两个实体之间的关系(存在于世界上并且可以彼此区分的事物)。任何事实三元组(eh,er,et)都传达了头实体eh和尾实体et通过关系er的语义相关联的信息。这种类型的语义信息可用于解释事件和推断新的事实[10]。考虑到kgs包含各种各样的事实,当前kgs的完整性仍然远远不能令人满意[11],这限制了人工智能应用的进展。从数据结构的角度来看,关系学习系统可以利用给定kgs中包含的事实三元组,以最大的概率自动意识到实体之间最可能缺失的链接:这一关键挑战通常被称为链接预测或知识图谱完[12]。
2、在过去的十年中,研究人员投入了大量的精力来探索用于实体和关系建模的统计关系学习[13]。在这方面,一种新的关系学习方法,即知识图嵌入,旨在将实体和关系映射到连续k维函数空间中的向量中。这种被称为嵌入的向量必须
3、关系学习中有两类模型,这取决于它们是否需要额外的关系上下文[18]。一组是纯粹基于嵌入的,它可以细分为三种类型。首先是翻译模型,它的关系被看作是实体之间的转换,例如transe[19]和rotate[20]。第二个是双线性模型,它应用张量分解来匹配嵌入向量空间的三元组的潜在语义,例如complex[21]和quate[22]。最后一个是神经网络模型(convkb[23],interacte[24]),它的典型特征将矢量化的三元组提供给多层卷积层[12]。另一组是基于混合嵌入。此类模型的示例包括类型为路径模型的ptranse[25]和类型为上下文模型的a2n[26]或complex-nne_aer[27],它们将通过建模实体之间的某些路径或上下文获得的规则与用于知识表示的三元组嵌入相结合。与上述实体和关系的组合相比,可以明显看出,最先进的关系嵌入模型,其中这些项目的特征嵌入可以很好地体现它们的语义[12]并使它们的信息更具交互性[24]。在训练中,通过一些算子增加交互次数,并采用负抽样技术对模型进行优化是必不可少的。然而,这些模型都没有充分考虑到带有语义的负样本生成器在训练过程中的重要性,捕获交互信息的能力有限。
4、complex将嵌入域扩展到一个复杂的域,从而带来更广泛的表示。hole[29]在实域中重新定义了两个互反卷积算子,可以相对有效地提高信息交互的频率。根据complex和hole等价于常数因子的模型结构[30],将卷积算子扩展到复空间是很有意义的。考虑具有以下属性的模型,首先,循环相关模型的框架从实域推广到特定的复空间,其中卷积模式为输入实体和关系之间的交互建模。将嵌入域扩展到复杂域,在保持计算效率的同时,可以捕获比实数域更丰富的三元组之间的交互。此外,生成对抗网络最近被应用于负采样技术,以达到期望的训练进度[31]。kbgan[32]中有一个生成式对抗学习框架,rotate中也有一个改进的自对抗负采样器。然而,前者在训练模型时计算量大,后者忽略了负样本的语义信息。
技术实现思路
1、为了解决模型在预测组合关系时更加准确的问题,本专利技术提出如下技术方案:一种基于复空间循环相关关系模型的知识图谱嵌入中链接预测方法,所述模型circulare包括特征提取层、循环相关网络层以及自适应对抗负抽样层,其中,所述预测方法包括:
2、s10.特征提取层将知识库中的结构化数据扩展到复数域空间并抓取初始特征,包括头实体的初始特征、尾实体的初始特征以及关系的初始特征;
3、s20.循环相关网络层将复数域中的循环相关算子应用于复空间,通过循环相关算子对头实体的初始特征、尾实体的初始特征以及关系的初始特征进行距离测量量规计算;
4、s30.自适应对抗负抽样层通过距离测量量规获得打分函数,根据打分函数获得正样本为真的可能性以及负样本被选中的可能性;
5、s40.通过优化函数对模型circulare进行训练,得到优化的模型circulare;
6、s50.对于给定三元组头实体和关系的前提下,优化的模型circulare评估得分最高的尾实体。
7、本专利技术的有益效果:本专利技术的更新的关系模型循环相关知识图谱嵌入框架,并将其命名为circulare。它属于主要受rotate、compex和hole启发的纯嵌入的模型。与仅在真实空间中嵌入hole模板的范围相比,该模型能够将循环相关算子扩展到复杂空间。在这个算子的帮助下,它获得了比rotate更多的信息交换。该模型利用三元组作为变量的概率语义和kgs结构来生成自适应对抗性负采样方案。同时,通过来自复域的循环相关算子,在一定程度上增加了向量中元素的交互性。值得一提的是,这种不确定性使模型在预测组合关系时更加准确。
本文档来自技高网...【技术保护点】
1.一种基于复空间循环相关关系模型的知识图谱嵌入中链接预测方法,其特征在于,所述模型CircularE包括特征提取层、循环相关网络层以及自适应对抗负抽样层,其中,所述预测方法包括:
2.根据权利要求1所述的基于复空间循环相关关系模型的知识图谱嵌入中链接预测方法,其特征在于,步骤S10中初始特征由如下公式表示:式中:hi表示头实体的初始特征,hj表示头实体结构化数据的向量,rehj表示hj的实部,imhj表示hj的虚部,i表示复数单位;ri表示尾实体的初始特征,rj表示尾实体结构化数据的向量,rerj表示rj的实部,imhj表示rj的虚部,i表示复数单位;ti表示关系的初始特征,tj表示关系结构化数据的向量,retj表示tj的实部,imtj表示tj的虚部,表示复数单位。
3.根据权利要求1所述的基于复空间循环相关关系模型的知识图谱嵌入中链接预测方法,其特征在于,步骤S20中循环相关网络层将复数域中的循环相关算子应用于复空间,通过循环相关算子对头实体的初始特征、尾实体的初始特征以及关系的初始特征进行距离测量量规计算,由如下公式表示:
4.根据权利要
5.根据权利要求1所述的基于复空间循环相关关系模型的知识图谱嵌入中链接预测方法,其特征在于,步骤S40中通过优化函数对模型CircularE进行训练,自适应负优化的交叉熵损失表示为:
...【技术特征摘要】
1.一种基于复空间循环相关关系模型的知识图谱嵌入中链接预测方法,其特征在于,所述模型circulare包括特征提取层、循环相关网络层以及自适应对抗负抽样层,其中,所述预测方法包括:
2.根据权利要求1所述的基于复空间循环相关关系模型的知识图谱嵌入中链接预测方法,其特征在于,步骤s10中初始特征由如下公式表示:式中:hi表示头实体的初始特征,hj表示头实体结构化数据的向量,rehj表示hj的实部,imhj表示hj的虚部,i表示复数单位;ri表示尾实体的初始特征,rj表示尾实体结构化数据的向量,rerj表示rj的实部,imhj表示rj的虚部,i表示复数单位;ti表示关系的初始特征,tj表示关系结构化数据的向量,retj表示tj的实部,imtj表示tj的虚部,表示复数单位。
3.根据权利要求1所述的基...
【专利技术属性】
技术研发人员:方岩,刘晓东,卢伟,孙清超,孙伟,孙长海,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。