一种基于多视图学习的变电站知识图谱构建及优化方法技术

技术编号:39814593 阅读:7 留言:0更新日期:2023-12-22 19:32
本发明专利技术提供了一种基于多视图学习的变电站知识图谱构建方法,包括:对全区域

【技术实现步骤摘要】
一种基于多视图学习的变电站知识图谱构建及优化方法


[0001]本专利技术涉及变电站数据协同与运维管理
,具体涉及一种基于多视图学习的变电站站知识图谱构建及优化方法


技术介绍

[0002]目前变电站的调度自动化系统与集控站系统主要是面向一次设备运行的,其系统模型主要为变电站一次设备与电网拓扑关系的描述,并不带二次设备

辅助设备和巡视设备等,难以实现面向变电站设备的统一关联模型

[0003]除此之外,变电站各类设备产生的数据在数量上呈指数级增长,在关系上存在非物理连接关系,在种类上呈多源异构数据类型,例如存在多种非结构化数据文件

这些数据表现出数量大

种类多

差异大

关系复杂等特点,使得原始系统模型难以涵盖

因此,传统的电力系统模型无法完整关联变电站设备及其产生的运行数据,传统的关系型数据库效率低下

查询困难

[0004]知识图谱,是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系

其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性值对,实体间通过关系相互联结,构成网状的知识结构

知识图谱本身是一个具有属性的实体通过关系链接而成的网状知识库,从图的角度来看,知识图谱在本质上是一种概念网络,其中的节点表示物理世界的实体(或概念),而实体间的各种语义关系则构成网络中的边

由此,知识图谱是对物理世界的一种符号表达

知识图谱的应用价值在于,它能够改变现有的信息检索方式,一方面通过推理实现概念检索;另一方面以图形化方式向用户展示经过分类整理的结构化知识

[0005]为了可以进行变电站运行态势全面感知,本专利技术设计了一种电力系统全域模型,并使用知识图谱技术实现


技术实现思路

[0006]为解决上述问题,本专利技术提出一种基于多视图学习的变电站知识图谱构建及优化方法,运用文本信息提取技术,将来自变电站庞大繁复的数据转换为具有不同维度属性的结构化数据,并利用知识图谱技术对这些数据进行关联,形成可以覆盖整体变电站的异构模型,完成对全域设备的运维管理

[0007]本专利技术通过以下方案实现:一种基于多视图学习的变电站知识图谱构建方法,所述方法包括,步骤
S1
,对全区域
A
范围内变电站的多源异构数据进行分析与描述;步骤
S2
,运用文本信息提取技术,将全区域
A
范围内的全部结构化数据整合成为专家知识库;步骤
S3
,从结构化数据中提取实体

属性和连接关系,构建知识图谱的数据层;步骤
S4
,构建关系视图和;
[0008]步骤
S5
,数据二次分层再融合,并构建标签视图;
[0009]步骤
S6
,建立电力系统实体关系库,构建外部和内部知识图谱;步骤
S7
,基于
Neo4j
图数据库,对变电站外部和内部的知识图谱进行知识存储;根据关系视图和实体命名的唯一性,将电力系统实体关系库融合为一个大型知识图谱

[0010]进一步地,所述实体对象包括变电站一次设备和二次设备

[0011]更进一步地,所述二次设备包括辅助设备

巡视设备

[0012]进一步地,步骤
S1
包括:
S11
,人工梳理分析全区域
A
范围内所有变电站实体对象之间的物理连接关系

非物理连接关系与深层次逻辑关系,创建全区域
A
范围内全部实体对象的文本信息数据;
S12
,分析全区域
A
范围内所有变电站的运行数据,将非结构化数据转化为结构化数据

[0013]进一步地,所述运行数据包括图形文件

[0014]更进一步地,人工将图形中包含的实体以及实体关系转化为结构化的文本数据

[0015]更进一步地,所述图形文件包括电力拓扑图

[0016]进一步地,步骤
S2
中,文本信息提取技术包括关键词分词

特征分析

知识抽取

数据去重处理

[0017]进一步地,步骤
S3
包括:
S31、
识别变电站和设备实际名称作为待处理实体,并将所述待处理实体组成实体对;
S32、
根据待处理实体的属性和类型,为每个待处理实体做标记;
S33
,结构化数据初步分层,将待处理实体划分为外部实体和内部实体

[0018]更进一步地,以待处理实体的标记作为划分为外部实体和内部实体的标准

[0019]进一步地,步骤
S4
包括:定义第个实体为;
[0020]从
S3
步骤的数据层中提取两个实体之间的物理连接关系,得到两个实体之间的关系视图向量,其中,
N
为自然数;
[0021]进一步地,步骤
S4
还包括:对于实体,从
S3
步骤的数据层中学习每个实体和每段关系的物理特征,利用属性抽取的方法识别出属性名和属性值,设计出不同维度的属性特征,得到长度为的第个实体的属性视图向量为
[0022];
[0023]对于关系属性,先从
S3
步骤的数据层中识别出关系名称,再经过分词

实体匹配和唯一性确认后扩充成为两个实体名称

一个路径名称和对应的关系属性特征,得到长度为的第段关系的属性视图向量为
[0024],与对应

[0025]进一步地,步骤
S5
包括,利用实体的属性视图二次分层:根据步骤4所得实体的属性向量计算内部实体间的亲密度,得到亲密度矩阵为
[0026];
[0027];
[0028]利用亲密度矩阵进行聚类,得到所有实体设备的二次分层结果

[0029]更进一步地,定义二次分层后外部实体的标签视图为变电站

[0030]进一步地,步骤
S6
包括:由区域
A
范围内全部的外部实体

内部实体组成实体对,构建电力系统实体关系库

[0031]进一步地,步骤
S6
还包括:使用标签视图变电站的外部实体构建变电站外部知识图谱;
[0032]将从结构化数据中经过知识抽取得到的区本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于多视图学习的变电站知识图谱构建方法,其特征在于,所述方法包括,步骤
S1
,对全区域
A
范围内变电站的多源异构数据进行分析与描述;步骤
S2
,运用文本信息提取技术,将全区域
A
范围内的全部结构化数据整合成为专家知识库;步骤
S3
,从结构化数据中提取实体

属性和连接关系,构建知识图谱的数据层;步骤
S4
,构建关系视图和;步骤
S5
,数据二次分层再融合,并构建标签视图;步骤
S6
,建立电力系统实体关系库,构建外部和内部知识图谱;步骤
S7
,基于
Neo4j
图数据库,对变电站外部和内部的知识图谱进行知识存储;根据关系视图和实体命名的唯一性,将电力系统实体关系库融合为一个大型知识图谱
。2.
根据权利要求1所述的知识图谱构建方法,其特征在于,所述实体对象包括变电站一次设备和二次设备
。3.
根据权利要求2所述的知识图谱构建方法,其特征在于,所述二次设备包括辅助设备

巡视设备
。4.
根据权利要求1或3所述的知识图谱构建方法,其特征在于,步骤
S1
包括:
S11
,人工梳理分析全区域
A
范围内所有变电站实体对象之间的物理连接关系

非物理连接关系与深层次逻辑关系,创建全区域
A
范围内全部实体对象的文本信息数据;
S12
,分析全区域
A
范围内所有变电站的运行数据,将非结构化数据转化为结构化数据
。5.
根据权利要求4所述的知识图谱构建方法,其特征在于,所述运行数据包括图形文件
。6.
根据权利要求5所述的知识图谱构建方法,其特征在于,人工将图形中包含的实体以及实体关系转化为结构化的文本数据
。7.
根据权利要求5或6所述的知识图谱构建方法,其特征在于,所述图形文件包括电力拓扑图
。8.
根据权利要求4所述的知识图谱构建方法,其特征在于,步骤
S2
中,文本信息提取技术包括关键词分词

特征分析

知识抽取

数据去重处理
。9.
根据权利要求4所述的知识图谱构建方法,其特征在于,步骤
S3
包括:
S31、
识别变电站和设备实际名称作为待处理实体,并将所述待处理实体组成实体对;
S32、
根据待处理实体的属性和类型,为每个待处理实体做标记;
S33
,结构化数据初步分层,将待处理实体划分为外部实体和内部实体
。10.
根据权利要求9所述的知识图谱构建方法,其特征在于,以待处理实体的标记作为划分为外部实体和内部实体的标准
。11.
根据权利要求9所述的知识图谱构建方法,其特征在于,步骤
S4
包括:定义第个实体为;

S3
步骤的数据层中提取两个实体之间的物理连接关系,得到两个实体之间的关系视图向量,其中,
N
为自然数
。12.
根据...

【专利技术属性】
技术研发人员:王丽媛曹永进吴绍卿赵大兴吴东徐元孚马剑皮涛王瑶许雷
申请(专利权)人:国网天津市电力公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1