一种基于机器学习的风电场站运行数据异常识别方法技术

技术编号:32570243 阅读:27 留言:0更新日期:2022-03-09 16:57
本发明专利技术公开了一种基于机器学习的风电场站运行数据异常识别方法,包括:收集风电场站的历史风速数据和对应的功率运行数据;确定历史风速数据和对应的功率运行数据中的正常运行数据和异常运行数据;构建深度学习算法模型,将分别带有相应标签的正常运行数据和异常运行数据,对深度学习算法模型进行学习、训练和测试,获得最优模型;将待识别风电场站的风速数据和对应的功率运行数据,通过最优模型,输出异常运行数据的识别结果;通过该方法能够对大规模风电场站运行数据的异常识别算法进行优化,提高提高风电场站运行数据异常识别的准确性、快速性和通用性。快速性和通用性。快速性和通用性。

【技术实现步骤摘要】
一种基于机器学习的风电场站运行数据异常识别方法


[0001]本专利技术属于大数据异常检测
,特别是一种基于机器学习的风电场站运行数据异常识别方法。

技术介绍

[0002]风电场站的数据量庞大、数据种类较多,涵盖风电场生产的方方面面,接入工作比较繁琐且精细化要求高,数据在储存、处理、传输等过程中面临各种各样的风险。随之而来对场站的管控和监控的要求也越来越严峻,不可避免地含有缺失、重复、漏数、错数等各类问题,给风电场站的安全生产和调度精细化管理带来了新的挑战。同时随着电力交易的改革,新能源跨省跨区现货交易的开展,以及省内新能源新货交易的推进,对新能源的实时性、准确性都提出了更高的要求。
[0003]风电场站的运行数据主要包括场站的气象预报数据、功率预测数据、理论功率数据、可用功率数据。风场场站数据的质量直接影响新能源场站的功率预测精度,并对电网的运行调度计划和新能源最大消纳能力产生重要影响。
[0004]目前,针对风电场站大数据异常识别的研究较少。文献《风电场输出功率异常数据识别与重构方法研究》(朱倩文等,电力系统保护与控制,2015)采用四分位算法的数学模型对风电场输出功率异常数据进行识别,并采用基于临近风电场出力模型和三次样条插值的方法去重构缺失的数据。同时,针对风电场的弃风异常数据簇,文献《风电场弃风异常数据簇的特征及处理方法》(赵永宁等,电力系统自动化,2014)提出一种四分位和聚类分析的异常数据组合筛选模型,利用四分位法剔除常规的分散性异常数据,再使用k

means聚类算法剔除堆积型数据集,但k

means聚类算法需要提前确定聚类个数k。此外,文献《风电场有功功率异常运行数据重构方法》(张东英等,电力系统自动化,2014)采用分段判定的方法识别风电场有功功率异常运行数据,并利用风电场之间的出力数据的延时相关性还原重构缺失性数据;对于风电自身出力数据,采用基于自回归滑动平均模型重构完整的时间序列。然而,针对以上方法,仅是从数理统计和无监督聚类算法的角度对风电场站的异常运行数据进行识别。
[0005]因此,考虑以上研究方法的缺点和有监督机器学习算法的快速发展,为了进一步提高提高风电场站运行数据异常识别的准确性、快速性和通用性,如何对大规模风电场站运行数据的异常识别算法进行优化,成为当前研究的关键问题。

技术实现思路

[0006]鉴于上述问题,本专利技术提供一种至少解决上述部分技术问题的一种基于机器学习的风电场站运行数据异常识别方法,该方法能够对大规模风电场站运行数据的异常识别算法进行优化,提高提高风电场站运行数据异常识别的准确性、快速性和通用性。。
[0007]本专利技术实施例提供了一种基于机器学习的风电场站运行数据异常识别方法,包括:
[0008]S1、收集风电场站的历史风速数据和对应的功率运行数据;
[0009]S2、确定所述历史风速数据和对应的功率运行数据中的正常运行数据和异常运行数据;
[0010]S3、构建深度学习算法模型,将分别带有相应标签的正常运行数据和异常运行数据,对所述深度学习算法模型进行学习、训练和测试,获得最优模型;
[0011]S4、将待识别风电场站的风速数据和对应的功率运行数据,通过所述最优模型,输出异常运行数据的识别结果。
[0012]进一步地,所述S2中的异常运行数据,包括:
[0013]普通异常数据点、离散型异常数据点和堆积型异常数据点。
[0014]进一步地,所述S2具体包括:
[0015]S21、根据物理机理识别所述普通异常数据点;
[0016]S22、采用横纵四分位法识别所述离散型异常数据点;
[0017]S23、采用近邻传播聚类算法识别所述堆积型异常数据点。
[0018]进一步地,所述S21具体包括:
[0019]所述历史风速数据和对应的功率运行数据中,如果在任一时刻下满足预设条件,则为所述普通异常数据点:
[0020]所述预设条件包括以下一种或多种:
[0021](1)当所述历史风速数据和对应的功率运行数据中,任意一个小于或等于0;
[0022](2)所述历史风速数据和对应的功率运行数据中,当所述历史风速数据小于切入风速且所述功率运行数据大于0;
[0023](3)所述历史风速数据和对应的功率运行数据中,当所述历史风速数据大于切出风速且所述功率运行数据大于0;
[0024](4)所述历史风速数据和对应的功率运行数据中,当所述功率运行数据大于1.2倍的额定功率。
[0025]进一步地,所述S22具体包括:
[0026]对历史风速数据进行等间隔划分,获得多个区间的历史风速数据;采用四分位算法依次对每个区间内所述历史风速数据对应的功率运行数据的离散型异常数据点进行识别;
[0027]对功率运行数据进行等间隔划分,获得多个区间的功率运行数据;采用四分位算法依次对每个区间内所述功率运行数据对应的风速数据的离散型异常数据点进行识别。
[0028]进一步地,所述S23具体包括:
[0029]将所述历史风速数据和对应的功率运行数据作为潜在的聚类中心,根据不同时刻下所述历史风速数据和对应的功率运行数据的相似度,构建相似度矩阵;
[0030]采用近邻传播聚类算法对所述相似度矩阵进行迭代计算,实现对历史风速数据和对应的功率运行数据的聚类,基于此识别所述堆积型异常数据点。
[0031]与现有技术人相比,本专利技术记载的一种基于机器学习的风电场站运行数据异常识别方法,具有如下有益效果:
[0032]采用基于物理机理、横纵四分位法和近邻传播聚类的联合方法,可以识别出部分风电场站的正常运行数据和异常运行数据。在此基础上,对正常数据和异常数据点进行打
标签,可以将运行数据异常识别问题转化为二分类问题。进一步,利用深度学习算法学习以上场站数据的分布规律和故障特征,利用完成训练的深度学习算法模型去识别风电场站实际运行数据中的异常数据,可以加快异常数据识别速度和精度,实现新能源场站发电功率的精准预测和电网调度中心辅助决策优化。
[0033]本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0034]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
附图说明
[0035]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:
[0036]图1为本专利技术实施例提供的一种基于机器学习的风电场站运行数据异常识别方法流程图。
[0037]图2为本专利技术实施例提供的基于物理机理识别普通异常数据点结果图。
[0038]图3为本专利技术实施例提供的四分位法的示意图
[0039]图4为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的风电场站运行数据异常识别方法,其特征在于,包括:S1、收集风电场站的历史风速数据和对应的功率运行数据;S2、确定所述历史风速数据和对应的功率运行数据中的正常运行数据和异常运行数据;S3、构建深度学习算法模型,将分别带有相应标签的正常运行数据和异常运行数据,对所述深度学习算法模型进行学习、训练和测试,获得最优模型;S4、将待识别风电场站的风速数据和对应的功率运行数据,通过所述最优模型,输出异常运行数据的识别结果。2.如权利要求1所述的一种基于机器学习的风电场站运行数据异常识别方法,其特征在于,所述S2中的异常运行数据,包括:普通异常数据点、离散型异常数据点和堆积型异常数据点。3.如权利要求2所述的一种基于机器学习的风电场站运行数据异常识别方法,其特征在于,所述S2具体包括:S21、根据物理机理识别所述普通异常数据点;S22、采用横纵四分位法识别所述离散型异常数据点;S23、采用近邻传播聚类算法识别所述堆积型异常数据点。4.如权利要求3所述的一种基于机器学习的风电场站运行数据异常识别方法,其特征在于,所述S21具体包括:所述历史风速数据和对应的功率运行数据中,如果在任一时刻下满足预设条件,则为所述普通异常数据点:所述预设条件包括以下一种或多种:(1)当所述历史风速数据和对应的功率...

【专利技术属性】
技术研发人员:马天东耿天翔李峰钟海亮
申请(专利权)人:国网宁夏电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1