风电机组异常数据清洗方法和装置制造方法及图纸

技术编号:35851746 阅读:19 留言:0更新日期:2022-12-07 10:35
本发明专利技术提供了一种风电机组异常数据清洗方法和装置,涉及风电大数据处理技术领域,所述方法包括:对风电机组数据进行预处理以得到预处理数据;基于改进粒子群算法对半径参数及邻域密度阈值进行参数优化;基于优化后的半径参数及邻域密度阈值参数通过密度聚类算法对预处理数据进行二次清洗,得到异常数据清洗后的风电机组数据。本发明专利技术通过改进粒子群算法对半径参数及邻域密度阈值进行参数优化,可以提升密度聚类算法对风电数据清洗的精确性,另外通过两次清洗可以进一步提高数据清洗的精确性,还可以提高清洗效率,整个过程人工干预程度低,清洗效率高且对处理器资源利用率高。清洗效率高且对处理器资源利用率高。清洗效率高且对处理器资源利用率高。

【技术实现步骤摘要】
风电机组异常数据清洗方法和装置


[0001]本专利技术涉及风电大数据处理
,尤其涉及一种风电机组异常数据清洗方法和装置。

技术介绍

[0002]风力发电行业近年来获得了长足的发展,装机容量逐年攀升,在能源中所占的比重也不断增加。在风电场长期的运行中积累了海量的数据,其中包含了风电场及风电机组的运行、故障、检修等全环节的关键信息,需要借助大数据和人工智能技术,深挖数据价值,实现运行与消纳分析、故障诊断、功率预测、精益化运维等应用,助力风电行业的技术进步。但由于目前数据的质量参差不齐,若直接进行工程应用会对精度带来一定的影响,因此要先根据应用场景的需求进行异常数据的识别与清洗,提升数据质量。
[0003]现有的风电数据异常数据清洗方法对特定类别下的异常数据清洗效果不明显,且清洗过程需依赖人工干预,数据清洗步骤较为繁琐,耗费处理器资源高。

技术实现思路

[0004]有鉴于此,本专利技术提供一种风电机组异常数据清洗方法和装置,以解决上述提及的至少一个问题。
[0005]为了实现上述目的,本专利技术采用以下方案:
[0006]本专利技术实施例提供了一种风电机组异常数据清洗方法,所述方法包括:对风电机组数据进行预处理以得到预处理数据;基于改进粒子群算法对半径参数(Eps)及邻域密度阈值(Minpts)进行参数优化;基于优化后的Eps及Minpts参数通过密度聚类算法(DBSCAN)对所述预处理数据进行二次清洗,得到异常数据清洗后的风电机组数据。
[0007]根据本专利技术实施例所述方法的一个进一步的方面,对风电机组数据进行预处理包括:通过风电机组出现的异常运行状态位,降低不能正常运行的状态所对应数据的密度。
[0008]根据本专利技术实施例所述方法的另一个进一步的方面,对风电机组数据进行预处理还包括:使用最小二乘法进行突变点检测来过降低突变点所对应的中部堆积数据及离散型异常数据的密度。
[0009]根据本专利技术实施例所述方法的另一个进一步的方面,所述使用最小二乘法进行突变点检测来过降低突变点所对应的中部堆积数据及离散型异常数据的密度包括:
[0010]将风电机组功率数据按照风速划分为n个区间,组成功率数据P={P1,P2,

,P
n
},其中P
i
={p
i1
,p
i2
,

,p
im
}表示该风电机组在第i个风速区段所对应的功率散点值,其中m表示第i个风速区段内功率散点的数量,每个区段内的功率值根据风速值升序排列;
[0011]取功率方差的变化量U
i
={u
i2
,u
i3
,

,u
im
}作为变点识别的对象,其中:
[0012][0013]为第i个风速区段的平均风速值;
[0014]通过最小二乘法进行突变点识别,则样本U
i
的方差可表示为:
[0015][0016]若存在位置o(o<m),其方差变化量的值存在:
[0017][0018]S
o
=min(S2,...,S
k
,...,S
m
)
[0019]其中:
[0020][0021]则位置o为方差变化量U
i
序列的突变点,过滤掉位置o对应的数据。
[0022]根据本专利技术实施例所述方法的另一个进一步的方面,所述基于改进粒子群算法对半径参数及邻域密度阈值进行参数优化之前还包括:在风电场中选取一代表风电机组,获得所述代表风电机组的风电数据;根据所述风电数据构建所述代表风电机组的标准化功率曲线;进行原始数据清洗及数据标幺化;所述基于改进粒子群算法对半径参数及邻域密度阈值进行参数优化包括:以所述标准化功率曲线为基准,基于改进粒子群算法对半径参数及邻域密度阈值进行参数优化,使得通过密度聚类算法清洗后的数据所生成的功率曲线与所述标准化功率曲线的相似度最高。
[0023]根据本专利技术实施例所述方法的另一个进一步的方面,所述基于优化后的Eps及Minpts参数通过密度聚类算法对所述预处理数据进行二次清洗包括:基于优化后的半径参数及邻域密度阈值参数,对同一风电场内与所述代表机组相同型号的风电机组预处理数据,通过密度聚类算法进行二次清洗。
[0024]本专利技术实施例还提供了一种风电机组异常数据清洗装置,所述装置包括:预处理单元,用于对风电机组数据进行预处理以得到预处理数据;参数优化单元,用于基于改进粒子群算法对Eps及Minpts进行参数优化;二次清洗单元,用于基于优化后的Eps及Minpts参数通过DBSCAN聚类算法对所述预处理数据进行二次清洗,得到异常数据清洗后的风电机组数据。
[0025]根据本专利技术实施例所述装置的一个进一步的方面,所述预处理单元对风电机组数据进行预处理包括:通过风电机组出现的异常运行状态位,降低不能正常运行的状态所对应数据的密度。
[0026]根据本专利技术实施例所述装置的另一个进一步的方面,所述预处理单元对风电机组
数据进行预处理还包括:使用最小二乘法进行突变点检测来突变点所对应的中部堆积数据及离散型异常数据的密度。
[0027]根据本专利技术实施例所述装置的另一个进一步的方面,所述使用最小二乘法进行突变点检测来突变点所对应的中部堆积数据及离散型异常数据的密度包括:
[0028]将风电机组功率数据按照风速划分为n个区间,组成功率数据P={P1,P2,

,P
n
},其中P
i
={p
i1
,p
i2
,

,p
im
}表示该风电机组在第i个风速区段所对应的功率散点值,每个区段内的功率值根据风速值升序排列;
[0029]取功率方差的变化量U
i
={u
i2
,u
i3
,

,u
im
}作为变点识别的对象,其中:
[0030][0031]为第i个风速区段的平均风速值;
[0032]通过最小二乘法进行突变点识别,则样本U
i
的方差可表示为:
[0033][0034]若存在位置o(o<m),其方差变化量的值存在:
[0035][0036]S
o
=min(S2,...,S
k
,...,S
m
)
[0037]其中:
[0038][0039]则位置o为方差变化量U
i
序列的突变点,过滤掉位置o对应的数据。
[0040]根据本专利技术实施例所述装置的另一个进一步的方面,所述装置还包括:代表数据获取单元,用于在风电场中选取一代表风电机组,获得所述代表风电机组的风电数据;功率曲线构建本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风电机组异常数据清洗方法,其特征在于,所述方法包括:对风电机组数据进行预处理以得到预处理数据;基于改进粒子群算法对半径参数及邻域密度阈值进行参数优化;基于优化后的半径参数及邻域密度阈值参数通过密度聚类算法对所述预处理数据进行二次清洗,得到异常数据清洗后的风电机组数据。2.如权利要求1所述的风电机组异常数据清洗方法,其特征在于,对风电机组数据进行预处理包括:通过风电机组出现的异常运行状态位,降低不能正常运行的状态所对应数据的密度。3.如权利要求2所述的风电机组异常数据清洗方法,其特征在于,对风电机组数据进行预处理还包括:使用最小二乘法进行突变点检测来过降低突变点所对应的中部堆积数据及离散型异常数据的密度。4.如权利要求3所述的风电机组异常数据清洗方法,其特征在于,所述使用最小二乘法进行突变点检测来过降低突变点所对应的中部堆积数据及离散型异常数据的密度包括:将风电机组功率数据按照风速划分为n个区间,组成功率数据P={P1,P2,

,P
n
},其中P
i
={p
i1
,p
i2
,

,p
im
}表示该风电机组在第i个风速区段所对应的功率散点值,其中m表示第i个风速区段内功率散点的数量,每个区段内的功率值根据风速值升序排列;取功率方差的变化量U
i
={u
i2
,u
i3
,

,u
im
}作为变点识别的对象,其中:}作为变点识别的对象,其中:为第i个风速区段的平均风速值;通过最小二乘法进行突变点识别,则样本U
i
的方差可表示为:若存在位置o(o<m),其方差变化量的值存在:S
o
=min(S2,...,S
k
,...,S
m
)其中:则位置o为方差变化量U
i
序列的突变点,过滤掉位置o对应的数据。5.如权利要求1所述的风电机组异常数据清洗方法,其特征在于,所述基于改进粒子群算法对半径参数及邻域密度阈值进行参数优化之前还包括:在风电场中选取一代表风电机组,获得所述代表风电机组的风电数据;
根据所述风电数据构建所述代表风电机组的标准化功率曲线;进行原始数据清洗及数据标幺化;所述基于改进粒子群算法对半径参数及邻域密度阈值进行参数优化包括:以所述标准化功率曲线为基准,基于改进粒子群算法对半径参数及邻域密度阈值进行参数优化,使得通过密度聚类算法清洗后的数据所生成的功率曲线与所述标准化功率曲线的相似度最高。6.如权利要求5所述的风电机组异常数据清洗方法,其特征在于,所述基于优化后的Eps及Minpts参数通过密度聚类算法对所述预处理数据进行二次清洗包括:基于优化后的半径参数及邻域密度阈值参数,对同一风电场内与所述代表风电机组相同型号的风电机组预处理数据,通过密度聚类算法进行二次清洗。7.一种风电机组异常数据清洗装置,其特征在于,所述装置包括:预处理单元,用于对风电机组数据进行预处理以得到预处理数据;参数优化单元,用于基于改进粒子群算法...

【专利技术属性】
技术研发人员:王玙张扬帆杨伟新吴林林梁恺巩宇付雪姣
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1