一种电网遥测跳变数据筛选方法及系统技术方案

技术编号:36954185 阅读:56 留言:0更新日期:2023-03-22 19:14
本发明专利技术公开了一种电网遥测跳变数据筛选方法及系统,包括如下步骤:获取电网遥测采集数据,识别电网遥测采集数据的遥测类型;若电网遥测采集数据处于遥测类型对应的数据区间范围内,则认定为有效遥测数据;反之则认定为待筛选的跳变数据;其中,数据区间范围的计算包括如下步骤:获取电网历史遥测数据的数据集;根据电网历史遥测数据的数据集,采用近邻传播算法进行聚类分析,得到不同遥测类型的聚类关联性数据;计算不同遥测类型的关联性数据的均值和标准偏差,得到不同遥测类型对应的数据区间范围。从电网历史遥测数据中获取数据区间范围,基于数据本身的特性,进行分析筛选后续的电网遥测采集数据是否是跳变数据,具有很强的普适性和扩展性。强的普适性和扩展性。强的普适性和扩展性。

【技术实现步骤摘要】
一种电网遥测跳变数据筛选方法及系统


[0001]本专利技术涉及一种电网遥测跳变数据筛选方法及系统,属于数据筛选


技术介绍

[0002]随着智能化和信息化的发展,电网中信息化和智能化已是必然趋势,其中电网调度自动化、无人值守电站已在电网中被广泛使用,在此背景下,电网遥测数据的显得尤为重要。遥测合格率不仅是电网准确调度的直接依据,也是电网节能降损的关键指标。同时继电保护整定的相关计算,线损、无功补偿、负荷预测、负荷调整以及运行方式调节等,均需要遥测数据的支撑。在获取遥测数据的过程中,由于配电化终端多、分布广,并且部分配电终端所处的环境恶劣,工况复杂,数据在采集筛选的过程中不可避免的存在误差。
[0003]公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域普通技术人员所公知的现有技术。

技术实现思路

[0004]本专利技术的目的在于克服现有技术中的不足,提供一种电网遥测跳变数据筛选方法及系统,能够实现对数据的自动筛选,且筛选的依据是基于历史遥测数据得到的,提高了数据筛选的准确度。
[0005]为达到上述目的,本专利技术是采用下述技术方案实现的:一方面,本专利技术公开了一种电网遥测跳变数据筛选方法,包括如下步骤:获取电网遥测采集数据,识别所述电网遥测采集数据的遥测类型;若所述电网遥测采集数据处于所述遥测类型对应的数据区间范围内,则认定为有效遥测数据;若所述电网遥测采集数据不处于所述遥测类型对应的数据区间范围内,则认定为待筛选的跳变数据;其中,所述数据区间范围的计算包括如下步骤:获取电网历史遥测数据的数据集;根据所述电网历史遥测数据的数据集,采用近邻传播算法进行聚类分析,得到不同遥测类型的聚类关联性数据;计算不同遥测类型的关联性数据的均值和标准偏差,得到不同遥测类型对应的数据区间范围。
[0006]进一步的,所述获取电网历史遥测数据的数据集,包括:获取电网历史遥测数据;对所述电网历史遥测数据进行清洗和维度分解,得到电网历史遥测数据的数据集;其中,所述电网历史遥测数据的数据集包括基于采样时间维度的电网历史遥测数据和基于遥测类型维度的电网历史遥测数据。
[0007]进一步的,对所述网历史遥测数据进行清洗,所述清洗的步骤包括数据完整性检查、数据错误值检查、重复数据的检测和消除,以及不一致数据的检测。
[0008]进一步的,所述聚类分析中的参考度设置为相似矩阵的中位数;阻尼系数设置为0.77

0.79。
[0009]进一步的,得到不同遥测类型的聚类关联性数据,包括如下步骤:根据所述电网历史遥测数据的数据集,采用近邻传播算法进行聚类分析,得到不同遥测类型的聚类数据;计算电网历史遥测数据和相对应的遥测类型的聚类数据的中心点的距离,得到不同遥测类型的聚类关联性数据。
[0010]进一步的,所述不同遥测类型的聚类关联性数据呈现近似正态分布且遵循拉依达准则。
[0011]进一步的,所述数据区间范围的表达式为(μ

3σ, μ+3σ),其中,μ为聚类数据集合的均值;σ为聚类数据集合的标准偏差。
[0012]另一方面,本专利技术公开了一种电网遥测跳变数据筛选系统,包括处理器和存储设备,所述存储设备中存储有多条指令,用于所述处理器加载并执行上述方法的步骤。
[0013]与现有技术相比,本专利技术所达到的有益效果:本专利技术的电网遥测跳变数据筛选方法,从电网历史遥测数据中获取数据区间范围,基于数据本身的特性,进行分析筛选后续的电网遥测采集数据是否是跳变数据,具有很强的普适性和扩展性。
[0014]本专利技术采用近邻传播算法,用来为计算聚类数据集合提供遥测数据的边界,所以针对近邻传播算法的复杂度缺陷,并不会对数据筛选产生影响,提高了可行性和稳定性。近邻传播算法适应电网遥测数据,具有普适性。
[0015]本专利技术通过对电网历史遥测数据的清洗和维度分解,实现了对电网历史遥测数据的回测和对参数的修正,一方面,提高了电网历史遥测数据的准确性;另一方面,保证了数据的完整性分析的同时,也保证了此种分析方法的普适性,进一步提高了本专利技术的筛选方法的准确性。
附图说明
[0016]图1是一种电网遥测跳变数据筛选方法的流程图。
具体实施方式
[0017]下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0018]实施例1本实施例1公开了一种电网遥测跳变数据筛选方法,包括如下步骤:获取电网遥测采集数据,识别电网遥测采集数据的遥测类型;若电网遥测采集数据处于遥测类型对应的数据区间范围内,则认定为有效遥测数据;若电网遥测采集数据不处于遥测类型对应的数据区间范围内,则认定为待筛选的
跳变数据;其中,数据区间范围的计算包括如下步骤:获取电网历史遥测数据的数据集;根据电网历史遥测数据的数据集,采用近邻传播算法进行聚类分析,得到不同遥测类型的聚类关联性数据;计算不同遥测类型的聚类关联性数据的均值和标准偏差,得到不同遥测类型对应的数据区间范围。
[0019]本专利技术的技术构思为:首先,整理电网历史遥测数据的数据集,提高数据的正确性。其次,采用近邻传播算法进行聚类分析,近邻传播算法是用来为计算聚类关联性数据提供遥测数据的边界,所以针对近邻传播算法的复杂度缺陷,并不会对数据筛选产生影响,提高了可行性和稳定性。最后,基于数据本身的特性获取的数据区间范围,用来进行分析筛选后续的电网遥测采集数据是否是跳变数据,具有很强的普适性和扩展性。
[0020]具体步骤如下:步骤SS1:首先对所有的电网历史遥测数据进行数据清洗。本实施例中,历史遥测数据的准确直接关系到后续过程中,分类聚类分析的计算结果和分类的有效数据范围的有效性,因此,提出如下的数据清洗的方法:1、检查数据完整历史遥测数据在时间维度上应该线性、完整的,所以可以依据此特征,对历史遥测数据进行数据完整性检查。如果某个线性时间上缺少数据,则将此时间记录,人工进行数据补全。数据补全的方法可以采用多数据源比对、或业务逻辑相关性计算等。
[0021]2、检查历史遥测数据错误值历史遥测数据的错误值检查,本实施例中采用z

score方法进行检查,即以标准差为单位去度量每个数据偏离平均数的距离。在每个遥测数据减去z

score后,取两个极值正负2%的数据,作为潜在错误数据。这些数据并非直接作为错误数据直接抛弃,而是采用多数据源对比和业务逻辑相关性的办法进行二次确认。如果确认为错误数据值,则抛弃。抛弃后,数据需要进行人工补全。
[0022]3、重复数据检测和消除重复数据判定也采用时间维度进行过滤。同一个分类的遥测数据在一个时间维度上,只有一个数据值,如果出现多于一个,则采用是多数据源比对、或业务逻辑相关性计算等方法,将重复的不正确数据去除。
[0023]4、不一致数据检测不一致数据检测的方法主要通过多数据源比对、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电网遥测跳变数据筛选方法,其特征是,包括如下步骤:获取电网遥测采集数据,识别所述电网遥测采集数据的遥测类型;若所述电网遥测采集数据处于所述遥测类型对应的数据区间范围内,则认定为有效遥测数据;若所述电网遥测采集数据不处于所述遥测类型对应的数据区间范围内,则认定为待筛选的跳变数据;其中,所述数据区间范围的计算包括如下步骤:获取电网历史遥测数据的数据集;根据所述电网历史遥测数据的数据集,采用近邻传播算法进行聚类分析,得到不同遥测类型的聚类关联性数据;计算不同遥测类型的关联性数据的均值和标准偏差,得到不同遥测类型对应的数据区间范围。2.根据权利要求1所述的电网遥测跳变数据筛选方法,其特征是,所述获取电网历史遥测数据的数据集,包括:获取电网历史遥测数据;对所述电网历史遥测数据进行清洗和维度分解,得到电网历史遥测数据的数据集;其中,所述电网历史遥测数据的数据集包括基于采样时间维度的电网历史遥测数据和基于遥测类型维度的电网历史遥测数据。3.根据权利要求2所述的电网遥测跳变数据筛选方法,其特征是,对所述网历史遥测数据进行清洗,所述清洗的步骤包括数据完整性检查、数据错误值检查、重复数据的检测和消除,以...

【专利技术属性】
技术研发人员:于丽丹季玮施广德金舒蔡雷鸣孙常浩徐苏君徐衍高翔虞发桐戚付涛
申请(专利权)人:国电南京自动化股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1