System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及知识图谱关系识别领域,尤其涉及一种基于深度学习的关系自动识别方法及系统。
技术介绍
1、近年来,基于图神经网络的方法在知识图谱关系识别任务中取得了显著的进展。这些方法能够利用图数据的拓扑结构和节点特征来学习实体之间的关系,一些研究利用迁移学习和预训练模型(如bert)来提升关系识别的性能,通过在大规模文本数据上进行预训练,然后在知识图谱上进行微调。
2、而电力系统知识图谱的数据种类繁多,关系复杂,知识图谱中的实体和关系数据通常是稀疏的,导致模型难以充分学习到所有实体之间的关系,而且现有方法难以处理知识图谱的动态更新和变化。
技术实现思路
1、为了解决上述问题,本专利技术的目的在于提供一种基于深度学习的关系自动识别方法及系统,能够更深入地学习节点间的隐藏层次关系,有助于捕捉更加复杂的关系模式,提高识别的精度和可靠性。
2、为实现上述目的,本专利技术采用以下技术方案:
3、一种基于深度学习的关系自动识别方法,包括以下步骤:
4、步骤s1:收集电力系统知识图谱数据,包括实体和它们之间的关系,将知识图谱数据转换为为图数据格式,其中实体被表示为图中的节点,实体间的关系表示为边,然后使用节点特征矩阵和邻接矩阵表示,其中节点特征矩阵编码了每个节点的属性,邻接矩阵描述了节点间的连接情况,得到待识别电力系统知识图谱数据集;
5、步骤s2:结合gat和gcn,构建多层次的图神经网络模型,所述多层次的图神经网络模型包括若干层,其中
6、对于节点i,gat的输出是:
7、
8、其中,是通过注意力机制计算的权重,w(l)是该层的权重矩阵,σ是非线性激活函数,是节点j在上一层的表示,n(i)是节点i的邻居节点集合;
9、对于节点i,gcn的输出是:
10、
11、其中,deh(i)和deh(j)分别是节点i和j的度数;
12、将gat层和gcn层的输出融合,作为最终输出:
13、
14、步骤s3:基于历史电力系统知识图谱数据训练多层次的图神经网络模型,通过最小化预测的关系类型和真实关系类型之间的差异来调整模型参数,得到关系自动识别模型;
15、步骤s4:结合知识图谱中的实体特征和拓扑结构信息,使用训练好的多层次图神经网络模型对待识别电力系统知识图谱数据集进行关系识别,通过节点表示学习实体之间的关系,预测实体之间的关系类型;
16、步骤s5:对于新加入的实体,采用动态图神经网络进行动态关系识别。
17、进一步的,步骤s1具体为:
18、步骤s11::收集电力系统知识图谱数据,包括实体和它们之间的关系;
19、步骤s12:将实体的属性转换为数值型特征向量,对于类别属性,使用嵌入技术将其转换为稠密向量;对于数值属性,进行标准化处理;为每种关系类型分配唯一的标识符将其转换为向量表示;
20、步骤s13:用于表示图中节点间的连接关系,对于电力系统知识图谱,如果节点i和节点j之间存在连接,则在邻接矩阵a中aij=1,否则aij=0;设有n个节点,每个节点有f个特征,则节点特征矩阵x∈rn×f;
21、步骤s14:利用构建的节点特征矩阵和邻接矩阵,将每个实体及其关系对应的特征和连接情况作为输入,将实体间的关系类型作为标签,构建训练集。
22、进一步的,基于训练集训练多层次的图神经网络模型,通过最小化预测的关系类型和真实关系类型之间的差异来调整模型参数,具体为:
23、定义损失函数为;
24、lreg=l+λ∑w∈w||w||2;
25、
26、其中,yi是节点i的真实标签,是模型预测的标签,λ是正则化系数,w是所有模型权重的集合;
27、使用adam优化算法更新模型参数:
28、
29、其中,θ表示模型参数,η是学习率;
30、获取最优模型参数,得到关系自动识别模型。
31、进一步的,使用adam优化算法更新模型参数,具体如下:
32、在训练开始之前,初始化模型参数θ,并且为adam算法设置以下变量:
33、学习率η,一阶矩估计和二阶矩估计的指数衰减率β1和β2,预设常量ep;同时,初始化一阶矩估m0=0和二阶矩估计v0=0,以及时间步长t=0);
34、对于每次迭代,执行以下步骤:
35、前向传播:计算模型输出和损失lreg;
36、反向传播:计算损失lreg关于模型参数θ的梯度u;
37、更新时间步长:(t=t+1);
38、更新一阶矩估计:
39、mt=β1·mt-1+(1-β1)·u;
40、更新二阶矩估计:
41、vt=β2·vt-1+(1-β2)·u;
42、校正一阶矩估计偏差:
43、
44、校正二阶矩估计偏差:
45、
46、更新参数:
47、
48、重复上述步骤直到达到最大迭代次数或损失下降到一个预定的阈值以下。
49、进一步的,所述步骤s5具体为:
50、步骤s51:将新实体的特征向量加入到现有的节点特征矩阵中,如果新实体与现有实体之间存在关系,则在邻接矩阵中添加相应的边;
51、步骤s52:使用gcn或gat层聚合新实体的邻居特征,以获得其邻居的综合信息,结合新实体自身的特征和其邻居的聚合特征,使用gat中的注意力机制或gcn的卷积操作更新新实体的特征表示;
52、步骤s53:使用更新后的特征表示,通过图神经网络模型预测新实体与现有实体之间可能存在的关系;对于预测存在关系的实体对,进一步使用分类器确定关系的类型;
53、步骤s54:根据模型预测的结果,更新知识图谱的图结构,包括添加新的边以反映新实体与现有实体之间的关系。
54、进一步的,所述步骤s52使用gcn层来聚合邻居特征并更新新实体的特征表示,具体如下:
55、将新实体自身的特征向量与所有邻居节点的特征向量进行聚合,然后取平均值,得到新实体的邻居节点特征的综合信息;
56、将新实体节点的自身特征向量与其邻居节点特征的综合信息进行拼接,形成一个新的特征向量,
57、接着,使用权重矩阵对拼接后的特征向量进行线性变换,将其映射到一个新的特征空间中,
58、然后,对线性变换后的特征向量应用一个非线性激活函数,以引入非线性变换,得到最终更新后的新实体特征表示。
59、进一步的,所述步骤s53具体为:使用更新后的新实体特征表示作为输入,结合现有实体的特征表示,通过关系自动识别模型进行关系预测,通过将新实体特征与现有实体特征本文档来自技高网...
【技术保护点】
1.一种基于深度学习的关系自动识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于深度学习的关系自动识别方法,其特征在于,所述步骤S1具体为:
3.根据权利要求1所述的一种基于深度学习的关系自动识别方法,其特征在于,所述基于训练集训练多层次的图神经网络模型,通过最小化预测的关系类型和真实关系类型之间的差异来调整模型参数,具体为:
4.根据权利要求3所述的一种基于深度学习的关系自动识别方法,其特征在于,所述使用Adam优化算法更新模型参数,具体如下:
5.根据权利要求1所述的一种基于深度学习的关系自动识别方法,其特征在于,所述步骤S5具体为:
6.根据权利要求5所述的一种基于深度学习的关系自动识别方法,其特征在于,所述步骤S52使用GCN层来聚合邻居特征并更新新实体的特征表示,具体如下:
7.根据权利要求5所述的一种基于深度学习的关系自动识别方法,其特征在于,所述步骤S53具体为:使用更新后的新实体特征表示作为输入,结合现有实体的特征表示,通过关系自动识别模型进行关系预测,通过将新实体特征与现
8.一种基于深度学习的关系自动识别系统,其特征在于,包括处理器、存储器以及存储在所述存储器上的计算机程序,所述处理器执行所述计算机程序时,具体执行如权利要求1-7任一项所述的一种基于深度学习的关系自动识别方法中的步骤。
...【技术特征摘要】
1.一种基于深度学习的关系自动识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于深度学习的关系自动识别方法,其特征在于,所述步骤s1具体为:
3.根据权利要求1所述的一种基于深度学习的关系自动识别方法,其特征在于,所述基于训练集训练多层次的图神经网络模型,通过最小化预测的关系类型和真实关系类型之间的差异来调整模型参数,具体为:
4.根据权利要求3所述的一种基于深度学习的关系自动识别方法,其特征在于,所述使用adam优化算法更新模型参数,具体如下:
5.根据权利要求1所述的一种基于深度学习的关系自动识别方法,其特征在于,所述步骤s5具体为:
6.根据权利要求5所述的一种基于深度学习的关系自动...
【专利技术属性】
技术研发人员:张毅琦,刘青,陈智鹏,黄怡,王金发,吴国猛,陈严炜,
申请(专利权)人:国网信通亿力科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。