System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种电网运行态势知识图谱的三元组补全方法技术_技高网

一种电网运行态势知识图谱的三元组补全方法技术

技术编号:42821180 阅读:2 留言:0更新日期:2024-09-24 20:59
本发明专利技术提供了一种电网运行态势知识图谱的三元组补全方法,包括:根据知识图谱中的三元组训练三元组区分模型,通过三元组区分模型获取知识图谱中的实体和关系的嵌入表示;从知识图谱中提取缺失三元组并进行补全获得初始三元组,根据知识图谱中的实体和关系的嵌入表示构建问答式连接预测判断初始三元组是否成立用于得到缺失三元组的补全结果,实现对知识图谱的三元组补全。应用该方法通过电网运行态势知识图谱得到其中的三元组的实体和关系的嵌入表示,该嵌入表示包含丰富的语义信息从而使得实体和关系在低维向量空间能够合理地关联起来,应用实体和关系在低维向量空间的关联进行知识图谱的三元组补全,从而提高三元组补全效率和准确率。

【技术实现步骤摘要】

本专利技术涉及电网知识图谱补全,尤其涉及一电网运行态势知识图谱的三元组补全方法


技术介绍

1、电力领域文本有以下特点:专业性强,通常包含大量的专业术语和概念;结构化与非结构化数据并存,不仅包括结构化的表格数据,还包括非结构化的文本报告、故障描述、操作日志等;多源数据融合,数据来自不同的来源,如设备监测数据、维护记录、事故报告等,这些数据类型多样,需要综合分析。

2、随着知识图谱研究的深入应用,在电力领域出现了构建电网运行态势知识图谱用于电网运行态势检测等情况的方法。

3、现有技术中,通常应用通用大语言模型进行对电网运行态势知识图谱的构建,但基于电力领域文本的特点,通用大型语言模型(llms)直接使用于电力领域文本理解存在以下问题:参数多、内存占用大、训练时间长、预测速度慢;直接使用通用大型语言模型训练实际电力生产数据存在敏感数据上传云端被泄露的风险;通用大型语言模型缺乏电力领域特定的知识,效果不佳;通用大型语言模型需要的计算资源大,成本高。

4、通过现有技术构建得到的电网运行态势知识图谱通常存在三元组信息缺失且补全难度大的问题。

5、因此,有必要提供一种能够针对电力领域文本的特点进行处理的能够准确地对电网运行态势知识图谱进行补全的方法。


技术实现思路

1、本专利技术的目的在于提供一种电网运行态势知识图谱的三元组补全方法,用以改善现有技术难以处理电力领域文本进行电网态势知识图谱补全的问题。

2、第一方面,本专利技术提供的电网运行态势知识图谱的三元组补全方法包括:根据知识图谱中的三元组训练三元组区分模型,通过三元组区分模型获取知识图谱中的实体和关系的嵌入表示;从知识图谱中提取缺失三元组,对缺失三元组进行补全获得初始三元组,根据知识图谱中的实体和关系的嵌入表示构建问答式连接预测判断初始三元组是否成立用于得到缺失三元组的补全结果,实现对知识图谱的三元组补全。

3、本专利技术提供的电网运行态势知识图谱的三元组补全方法的有益效果在于:通过电网运行态势知识图谱得到其中的三元组的实体和关系的嵌入表示,该嵌入表示包含丰富的语义信息从而使得实体和关系在低维向量空间能够合理地关联起来,应用实体和关系在低维向量空间的关联进行知识图谱的三元组补全,从而提高三元组补全效率和准确率。

4、一种可能的实施例中,三元组区分模型包括嵌入层,dropout层和输出层;其中,嵌入层用于将知识图谱的三元组进行转化得到对应三元组的表示向量;dropout层用于根据三元组的表示向量得到三元组的嵌入表示;输出层用于根据三元组的嵌入表示构建所述初始三元组的问题向量和答案向量,计算问题向量和答案向量的相似度。

5、另一种可能的实施例中,根据知识图谱中的三元组训练三元组区分模型,包括:获取知识图谱中的三元组作为正样本,根据正样本生成负样本;将正样本和所述负样本作为训练集输入待训练的三元组区分模型进行迭代训练,当训练的损失函数最小化后得到训练完成的三元组区分模型,损失函数满足如下公式:,其中,表示正样本中的头实体向量,表示负样本中的头实体向量,表示正样本中的尾实体向量,表示负样本中的尾实体向量,表示关系向量,表示样本集合,表示损失值,表示超参数。

6、其它可能的实施例中,从知识图谱中提取缺失三元组,对缺失三元组进行补全获得初始三元组,包括:从知识图谱中提取缺失三元组,判断缺失三元组的类型;当缺失三元组为缺失尾实体的三元组时,从知识图谱中随机提取实体作为缺失三元组的尾实体以完成补全获得初始三元组;当缺失三元组为缺失头实体的三元组时,从知识图谱中随机提取实体作为缺失三元组的头实体以完成补全获得初始三元组。

7、通过问答式连接预测判断所述初始三元组是否成立,包括:当缺失三元组为缺失尾实体的三元组时,将初始三元组的头实体的嵌入表示和关系的嵌入表示相加获得问题向量,将初始三元组的尾实体的嵌入表示作为答案向量;当缺失三元组为缺失头实体的三元组时,将初始三元组的尾实体的嵌入表示和关系的嵌入表示相减获得问题向量,将初始三元组的头实体的嵌入表示作为答案向量;计算问题向量和所述答案向量的相似度,判断相似度是否大于设定的相似度阈值;当所述相似度大于等于相似度阈值时,判断初始三元组成立,当相似度小于相似度阈值时,判断初始三元组不成立。

8、知识图谱中包括x组缺失三元组,x>1;从知识图谱中提取缺失三元组,对缺失三元组进行补全获得初始三元组,根据知识图谱中的实体和关系的嵌入表示构建问答式连接预测判断初始三元组是否成立用于得到缺失三元组的补全结果,包括:从知识图谱中提取一组缺失三元组,对缺失三元组进行补全获得初始三元组,通过问答式连接预测判断初始三元组是否成立,当初始三元组不成立时,丢弃初始三元组,重新对缺失三元组进行补全获得新的初始三元组并通过问答式连接预测判断初始三元组是否成立,直至初始三元组成立,将成立的初始三元组添加至知识图谱中替换对应的缺失三元组以完成对一组缺失三元组的补全;重复执行从知识图谱中提取一组缺失三元组以得到下一组缺失三元组,对缺失三元组进行补全获得初始三元组并通过问答式连接预测判断初始三元组是否成立用于得到缺失三元组的补全结果,直至提取x组缺失三元组并完成对缺失三元组的补全,实现对知识图谱的三元组补全。

9、第二方面,本专利技术还提供了一种电网运行态势知识图谱的三元组补全装置,所述装置包括:训练单元,用于根据知识图谱中的三元组训练三元组区分模型,通过三元组区分模型获取知识图谱中的实体和关系的嵌入表示。

10、补全单元,用于从知识图谱中提取缺失三元组,对缺失三元组进行补全获得初始三元组,根据知识图谱中的实体和关系的嵌入表示构建问答式连接预测判断初始三元组是否成立用于得到缺失三元组的补全结果,实现对知识图谱的三元组补全。

11、第三方面,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述电网运行态势知识图谱的三元组补全方法。

12、第四方面,本专利技术还提供了一种电子设备,包括:处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于执行所述存储器存储的计算机程序,以使所述电子设备执行上述电网运行态势知识图谱的三元组补全方法。

13、关于上述第二方面至第四方面的有益效果可以参见上述第一方面的描述。

本文档来自技高网...

【技术保护点】

1.一种电网运行态势知识图谱的三元组补全方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述三元组区分模型包括嵌入层,Dropout层和输出层;

3.根据权利要求1所述的方法,其特征在于,根据知识图谱中的三元组训练三元组区分模型,包括:

4.根据权利要求1所述的方法,其特征在于,从所述知识图谱中提取缺失三元组,对所述缺失三元组进行补全获得初始三元组,包括:

5.根据权利要求1所述的方法,其特征在于,通过问答式连接预测判断所述初始三元组是否成立,包括:

6.根据权利要求1所述的方法,其特征在于,所述知识图谱中包括x组缺失三元组,x>1;

7.一种电网运行态势知识图谱的三元组补全装置,其特征在于,所述装置包括:

8.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的电网运行态势知识图谱的三元组补全方法。

9.一种电子设备,其特征在于,包括:处理器及存储器;

【技术特征摘要】

1.一种电网运行态势知识图谱的三元组补全方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述三元组区分模型包括嵌入层,dropout层和输出层;

3.根据权利要求1所述的方法,其特征在于,根据知识图谱中的三元组训练三元组区分模型,包括:

4.根据权利要求1所述的方法,其特征在于,从所述知识图谱中提取缺失三元组,对所述缺失三元组进行补全获得初始三元组,包括:

5.根据权利要求1所述的方法,其特征在于,通过问答式连接...

【专利技术属性】
技术研发人员:于仕黄欣金紫嫣李盛盛曹远龙彭鸿钊查梦郑锦坤
申请(专利权)人:国网江西省电力有限公司信息通信分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1