一种基于知识图谱的电网综合评价指标处理方法及系统技术方案

技术编号:37600738 阅读:28 留言:0更新日期:2023-05-18 11:51
本发明专利技术公开了一种基于知识图谱的电网综合评价指标处理方法及系统。该方法包括以下步骤:以各项电网评价指标的影响因子作为基准,对所述电网评价指标进行分类,得到初始化的电网评价指标数据,并将其构成知识图谱;对所述知识图谱进行规范化处理,将所述初始化的电网评价指标数据转换为规范化的电网评价指标数据;对所述规范化处理后的知识图谱内的数据指标进行容错处理;对电网评价指标中的波形数据进行安全转码处理;实施数据清洗,对各项电网评价指标数据通过线性回归模型进行数据填补;对电网综合评价指标进行数据核查。本发明专利技术结合多个电网评价指标,提供两次不同清洗方法,还采用容错处理、安全转码等操作,提高了整体健壮性。壮性。壮性。

【技术实现步骤摘要】
一种基于知识图谱的电网综合评价指标处理方法及系统


[0001]本专利技术属于知识图谱数据清洗
,具体涉及一种基于知识图谱的电网综合评价指标处理方法及系统。
技术背景
[0002]区域电网的充裕性、协调性、可靠性、安全性、经济性等五个性能是电网建设水平以及电网运行调控水平的综合体现,可从五个性能中精准把控所述区域电网的网架结构、地理条件、运行管理、设备配置等因素产生的影响,因此对区域电网的综合性能评估应形成一个科学、完善、综合的指标体系。
[0003]知识图谱(Knowledge Graph),是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,解决了传统数据库信息表达能力不足,无法有效支撑大多数电力系统后台数据服务需求的问题。
[0004]由于电网综合评价指标数据量大,数据来源广泛,数据类型不一致问题,而且构建知识图谱的过程往往是自动化地以避免人为的监督,从而不可避免地引入各种错误,包括模糊、冲突、错误和冗余信息。而知识图谱的质量保证是各种知识驱动应用的前提。因此,如何合理设计一种通用的、高效的基于知识图谱的电网综合评价指标处理方法及系统,实现对知识图谱架构中的各项电网综合评价指标的规范化处理、容错处理、安全转码、指标清洗以及数据核查等一系列操作处理,提高电网综合评价体系知识图谱的稳定性、可靠性、健壮性等,已经成为目前电力企业的迫切需求。

技术实现思路

[0005]本专利技术提供一种基于知识图谱的电网综合评价指标处理方法及系统,方便工作人员学习和掌握电网综合评价知识体系,能够全方位感知区域电网运行状况,将传统电网综合评价方法与具有互联性、开放性、结构化和形象化刻画知识的知识图谱技术相结合。
[0006]本专利技术提供一种基于知识图谱的电网综合评价指标处理方法,包括以下步骤:
[0007]以各项电网评价指标的影响因子作为基准,对所述电网评价指标进行分类,实现对电网评价指标的区别处理,得到初始化的电网评价指标数据,并将其构成知识图谱;
[0008]对所述知识图谱进行规范化处理,将所述初始化的电网评价指标数据转换为规范化的电网评价指标数据;
[0009]对所述规范化的电网评价指标数据进行容错处理,再通过填补函数对缺失值进行回归填补;
[0010]对所述经过回归填补的电网评价指标数据中的波形数据进行安全转码处理;
[0011]对经过所述安全转码处理的各项电网评价指标数据实施数据清洗,然后核验数据清洗结果,直至所述知识图谱的训练模型和三元组分类模型均完全收敛,再通过线性回归模型进行数据填补;
[0012]对所述知识图谱构建中涉及的区域电网综合评价指标进行数据核查;
[0013]将完成所述数据核查的电网综合评价指标的知识图谱存储至图形数据库。
[0014]进一步地,所述电网评价指标至少包括电网的充裕性、协调性、可靠性、安全性和经济性中的一种。
[0015]进一步地,在进行所述容错处理后,通过填补函数对缺失的数据进行自动回填,继而得到电网综合评价体系中相对完整的数据。
[0016]进一步地,所述安全转码处理包括:
[0017]对电网综合评价指标波形数据使用Hilbert

Huang变换平滑滤波,并利用配置文件找到波形数据间的关联,进行波形并行绘制,形成图形化的波形文件。
[0018]进一步地,所述数据清洗和核验数据清洗结果包括:
[0019]获取未清洗的待清洗知识图谱,所述待清洗知识图谱包括电网综合评价指标数据构成的实体,及其对应的实体属性和关系属性,其中对应的每一组实体与实体属性以及它们之间的关系组成一条三元组;
[0020]对待处理的电网综合评价指标数据进行第一次清洗,利用肖维勒准则剔除其中的无效值和异常值;
[0021]在基于知识图谱的电网综合评价指标处理系统中搭载预设的知识图谱训练模型和三元组分类模型;
[0022]通过系统预设的知识图谱训练模型和三元组分类模型进行训练分析,进行第二次清洗,筛选出错误三元组并剔除;
[0023]使用线性回归模型,将剔除后的数据进行缺失值填补处理;
[0024]对清洗后的电网综合评价指标进行双累积分析检验,若检验结果满足预定值,即可结束数据清洗;反之继续迭代数据,重复进行所述第一次清洗、第二次清洗和缺失值填补处理,直至检验结果满足预定值。
[0025]进一步地,所述第一次清洗包括:
[0026]利用肖维勒准则将全部电网评价指标作为样本构建成一个数据集,并确定一个以正态分布均值为中心的概率带,任何未处在所述概率带之内的样本数据值将会被所述判定为异常值,并从所述数据集中剔除;
[0027]所述肖维勒准则的计算公式为:
[0028][0029]其中,D
max
为设定的最大偏差值,x为可疑异常值,μ为样本均值,δ为样本标准差。
[0030]进一步地,所述第二次清洗包括:
[0031]将所有三元组输入Trans

E训练模型,使用随机负采样训练噪声感知的知识图谱模型;
[0032]在所述Trans

E模型中预设有三元组得分公式,根据训练后的各项三元组得分情况,将所有三元组输入所述三元组分类模型中训练,训练结束后刷新每一条三元组的置信度,其中不同的三元组置信度不同;
[0033]预设的置信度阈值,即当三元组的置信度大于预定阈值时,判定该三元组是正确的,则保留;当三元组的置信度小于预定阈值时,判定该三元组的错误的,则剔除;
[0034]所述三元组分类模型中采用Sigmoid函数将分类器的输出约束在0

1;
[0035]将所述Trans

E模型和所述三元组分类模型结合迭代训练,直至所述知识图谱训练模型和所述三元组分类模型均完全收敛。
[0036]进一步地,所述通过线性回归模型填补包括:
[0037]将线性回归模型的数学表达式转换为向量表达式:
[0038]所述线性回归模型的数学表达式为:
[0039][0040]将上述数学表达式转变为如下向量表达式:
[0041][0042]其中,x为含有缺失值的电网评价指标;y为不含缺失值的电网评价指标;k为全部所述电网评价指标个数;n为电网综合评价性能类别数;a
k
为各项评价指标在某一项电网性能评估项的影响因子;b为常数项,作为电网评价指标缺失值判断阈值。
[0043]进一步地,所述对所述知识图谱构建中涉及的区域电网综合评价指标进行数据核查包括下列步骤:
[0044]核查各项电网评价指标的数据量是否正确;
[0045]核查数据格式类型是否正确;
[0046]通过所述不同电网评价指标之间的关联来确定各项电网评价指标的关系属性是否对应;
[0047]核查在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的电网综合评价指标处理方法,其特征在于,包括以下步骤:以各项电网评价指标的影响因子作为基准,对所述电网评价指标进行分类,实现对电网评价指标的区别处理,得到初始化的电网评价指标数据,并将其构成知识图谱;对所述知识图谱进行规范化处理,将所述初始化的电网评价指标数据转换为规范化的电网评价指标数据;对所述规范化的电网评价指标数据进行容错处理,再通过填补函数对缺失值进行回归填补;对所述经过回归填补的电网评价指标数据中的波形数据进行安全转码处理;对经过所述安全转码处理的各项电网评价指标数据实施数据清洗,然后核验数据清洗结果,直至所述知识图谱的训练模型和三元组分类模型均完全收敛,再通过线性回归模型进行数据填补;对所述知识图谱构建中涉及的区域电网综合评价指标进行数据核查;将完成所述数据核查的电网综合评价指标的知识图谱存储至图形数据库。2.按照权利要求1所述的一种基于知识图谱的电网综合评价指标处理方法,其特征在于:所述电网评价指标至少包括电网的充裕性、协调性、可靠性、安全性和经济性中的一种。3.按照权利要求1所述的一种基于知识图谱的电网综合评价指标处理方法,其特征在于:在进行所述容错处理后,通过填补函数对缺失的数据进行自动回填,继而得到电网综合评价体系中相对完整的数据。4.按照权利要求1所述的一种基于知识图谱的电网综合评价指标处理方法,其特征在于,所述安全转码处理包括:对电网综合评价指标波形数据使用Hilbert

Huang变换平滑滤波,并利用配置文件找到波形数据间的关联,进行波形并行绘制,形成图形化的波形文件。5.按照权利要求1所述的一种基于知识图谱的电网综合评价指标处理方法,其特征在于,所述数据清洗和核验数据清洗结果包括:获取未清洗的待清洗知识图谱,所述待清洗知识图谱包括电网综合评价指标数据构成的实体,及其对应的实体属性和关系属性,其中对应的每一组实体与实体属性以及它们之间的关系组成一条三元组;对待处理的电网综合评价指标数据进行第一次清洗,利用肖维勒准则剔除其中的无效值和异常值;在基于知识图谱的电网综合评价指标处理系统中搭载预设的知识图谱训练模型和三元组分类模型;通过系统预设的知识图谱训练模型和三元组分类模型进行训练分析,进行第二次清洗,筛选出错误三元组并剔除;使用线性回归模型,将剔除后的数据进行缺失值填补处理;对清洗后的电网综合评价指标进行双累积分析检验,若检验结果满足预定值,即可结束数据清洗;反之继续迭代数据,重复进行所述第一次清洗、第二次清洗和缺失值填补处理,直至检验结果满足预定值。6.按照权利要求5所述的一种基于知识图谱的电网综合评价指标处理方法,其特征在于,所述第一次清洗包括:
利用肖维勒准则将全部电网评价指标作为样本构建成一个数据集,并确定一个以正态分布均值为中心的概率带,任何未处在所述概率带之内的样本数据值将会被所述判定为异常值,并从所述数据集中剔除;所述肖维勒准则的计算公式为:其中,D
max
为设定的最大偏差值,x为可疑异常值,μ为样...

【专利技术属性】
技术研发人员:余晓伟凌煦刘天斌冯晓霞李悝李锴周晓刚李泰军刘兵汪辰王慧来
申请(专利权)人:中国电力工程顾问集团中南电力设计院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1