基于改进深度随机森林算法的变桨系统故障预测方法技术方案

技术编号:22239400 阅读:101 留言:0更新日期:2019-10-09 19:07
一种基于改进深度随机森林算法的变桨系统故障预测方法,其中,深度森林算法包括多个级联模块,每个级联模块包括并行设置的完全随机森林模块和随机森林模块,且均采用决策树进行决策,上述故障预测方法包括如下步骤:搭建基于改进深度随机森林算法的变桨系统的故障预测模型;利用故障预测模型对风电变桨系统进行故障预测;基于改进深度随机森林算法的变桨系统故障预测方法实现风电机组异常状态的早期识别,变故障驱动维修为主动维修,减少设备故障率和停机时间,保证经济效益最大化。

Fault prediction method for pitch control system based on improved depth stochastic forest algorithm

【技术实现步骤摘要】
基于改进深度随机森林算法的变桨系统故障预测方法
本专利技术属于风力发电设备与技术监控领域,主要涉及风电变桨系统状态的检测,具体是一种基于改进深度随机森林算法的变桨系统故障预测方法。
技术介绍
风力发电机组的变速变桨系统是风力发电机组中故障率较高的子系统。如果出现故障停机,从检修到恢复正常运行,需要较长的时间。如果在风速较好的时间段发生了故障停机,将大大影响风机的发电量,从而给企业造成巨大的经济损失。如果能在风机故障发生前时,通过风电机组的状态监测技术,对变桨系统的运行参数进行监测和分析后对故障进行预测,将会大大提高风机的可利用率。基于以上因素,对风力发电机组进行故障预测,对提高风电场运行的经济性和安全性有积极重要的意义。目前,风电场常用的数据采集与监视控制(SupervisoryControlandDataAcquisition,SCADA)系统,可以对现场的运行设备进行监视和控制,实现数据采集,设备控制,参数调节以及各类信号报警等功能。但是此并不能对故障进行预警,只能在故障发生后进行报警,且该故障信息往往包含多个故障原因,所以无法准确地定位故障类别和原因,导致检修时间较长,降低发电量。随着风力发电机组的装机容量的增加,风力发电公司对发电效率的要求越来越高,因此建立快速有效的故障预警方法是必然之举。
技术实现思路
本专利技术的目的是针对现有技术的不足而设计一种基于改进深度随机森林算法的变桨系统故障预测方法。一种基于改进深度随机森林算法的变桨系统故障预测方法,其中,深度森林算法包括多个级联模块,每个级联模块包括并行设置的完全随机森林模块和随机森林模块,且均采用决策树进行决策,上述故障预测方法包括如下步骤:1)搭建基于改进深度随机森林算法的变桨系统的故障预测模型,该模型的搭建方法如下:1-1)从实际风场运行产生的历史SCADA数据中选取样本数据;1-2)利用基于专家经验和数据挖掘算法相结合的特征选择方法进行特征筛选,确定故障预测模型的输入变量和输出变量;1-3)对每一个样本数据进行加权处理;1-4)通过一个长度为k的采样窗口对样本数据进行滑动采样,得到子样本向量;1-5)每个子样本由级联模块中的完全随机森林和随机森林训练分别生成一个表征向量H(x),叠加两个森林的输出得到特征向量Zi作为输入,用于训练深度随机森林;1-6)训练过程中为防止过拟合,每层深度随机森林都会进行交叉验证,当验证出的正确率相比前一层没有提升,则训练终止,得到故障预测模型;2)利用步骤1-5)中得到的故障预测模型对风电变桨系统进行故障预测。进一步的,所述的步骤1-2)中进行特征筛选的方法为:首先利用专家知识对所有特征进行初筛,形成候选特征集合;然后采用支持向量机结合后向搜索策略对候选特征集合进行进一步筛选。进一步的,所述的步骤1-3)中加权时权值的确定方法为:权值wi由逻辑回归模型生成,逻辑回归模型为:其中g(x)=w0+w1x1+...+wpxp,逻辑回归模型的似然函数为:用最大似然估计法,求解出参数w0,w1,…,wp,这组参数就是所需的权值,对似然方程取对数得:对参数wk求偏导,得到下述方程,求解方程即可解得参数w0,w1,…,wp即为权值,其中p表示样本维数,y为其样本观测值。进一步的,所述的决策树采用cart中的回归树。进一步的,所述的随机森林和完全随机森林的输出均为:式中,H(x)为最终结果,hi为第i个决策树分类结果,Y为真实类别,I为度量函数,N为决策树的数量。进一步的,所述的步骤1-6)对深度随机森林进行训练时,采用以下指标进行综合评判,误差越小,系数越高,表明深度随机森林的性能越好,当各性能指标均满足设定条件时才能停止训练,各评判标准的计算方法如下:(1)平均绝对误差MAE计算公式:(2)均方根误差RMSE计算公式:(3)决定系数R2计算公式:(4)校正后的决定系数Ra2计算公式:其中,n为样本数量,p为特征数量,yi为实际值,为预测值,为实际值的平均值。进一步的,所述的步骤2)对风电变桨系统进行故障预测时,将故障预测模型的输出与设定预警值进行比较,若超过预警值则发送信号至监控中心。与现有技术相比,本专利技术提供的风电变桨系统故障预测具有如下优势:实现风电机组异常状态的早期识别,变故障驱动维修为主动维修,减少设备故障率和停机时间,保证经济效益最大化;基于数据的故障预测方法不需要或只需要少量的对象系统的先验知识,主要基于实际运行数据,通过机器学习算法挖掘潜在故障信息更加具有实用性;不仅为风电场监控人员提供实时的机组运行状态信息,而且可以在故障发生前发现机组运行的异常状态,及时报警并通知相关维修人员,避免因故障造成设备损坏、机组停机,减少损失。在多粒度扫描阶段,通过给特征增加权重,对各特征的重要程度进行区分,使得特征的表征能力更强。通过对级联森林的输出进行加权,克服了原始深度森林模型中存在的特征向量冗余问题,同时将每层的增强特征向量由原来的8维降低为4维,降低了算法空间复杂度的同时提高了运行速率。数据采集单元实时从SCADA中提取变桨系统运行数据,输入训练好的基于改进的深度随机森林建立的故障预测模型中进行分析,比较残差曲线是否超出设定阈值,若超过则发送信号至监控中心,进行预警,实现了变桨系统的智能监测,监测速度高,准确率高。附图说明图1是深度随机森林算法流程图;图2是变桨系统监控图;图3是改进的多粒度扫描结构图;图4是改进的级联森林结构;具体实施方式下面结合附图对本专利技术进一步详细说明:基于实际风场运行产生的SCADA数据,采集正常数据作为的训练集和选取故障前30分钟的数据作为测试集作为实验样本,并数据预处理。所述的数据预处理是对数据进行清洗,即舍弃以下数据,包括发生通讯故障时的错误数据、不合理的数据和异常工况下的数据。处理后的数据用于制作训练集和测试集。所述特征提取方法分为两个阶段:第一阶段结合已有的专家经验选出候选特征集,所得候选特征不仅具有较多的先验知识,而且方便工程运维人员的理解;第二阶段利用支持向量机结合后向搜索策略对特征进一步筛选得到重要特征并确定输入输出。将样本中的风速、风轮转速、发电机轴承a温度、发电机轴承b温度、机舱外温度、机舱温度、发电机转速、变桨轴箱1温度作为回归模型输入,桨距角和发电机有功功率回归模型输出。对于一个线性不可分问题,(xi,yi)(xi∈Rp,yi∈{-1,1},i=1,2,...n)表示由n个样本和p个特征组成的训练集,并且yi是训练样本xi的类标,支持向量机分类问题等价于一个优化问题,其目标函数如下:其中,J为目标函数,w为特征权重,C为惩罚系数,ξii为松弛因子,i=1,2,...n,样本x的分类结果通过决策函数f(x)=yi(wTxi+b)来决定,其中w=[w1,w2,...,wp]是特征权重向量。引入拉格朗日函数其中,0≤αi≤C,i=1,2,…n。对w和b分别求导最小化L,根据KKT可得:将式(b)和(c)代入式(a),得到拉格朗日函数的对偶问题:为了避免高维的内积运算,采用核函数进行内积计算:K(xi,xj)=Φ(xi)Φ(xj)利用核函数代替内积后,原对偶问题变为:相应的分类问题也变为:通过移除特征,目标函数的改变为ΔJ(i),考虑第i个特征对的影响,利用二阶泰勒级数展本文档来自技高网...

【技术保护点】
1.一种基于改进深度随机森林算法的变桨系统故障预测方法,其中,深度森林算法包括多个级联模块,每个级联模块包括并行设置的完全随机森林模块和随机森林模块,且均采用决策树进行决策,其特征在于,上述故障预测方法包括如下步骤:1)搭建基于改进深度随机森林算法的变桨系统的故障预测模型,该模型的搭建方法如下:1‑1)从实际风场运行产生的历史SCADA数据中选取样本数据;1‑2)利用基于专家经验和数据挖掘算法相结合的特征选择方法进行特征筛选,确定故障预测模型的输入变量和输出变量;1‑3)对每一个样本数据进行加权处理;1‑4)通过一个长度为k的采样窗口对样本数据进行滑动采样,得到子样本向量;1‑5)每个子样本由级联模块中的完全随机森林和随机森林训练分别生成一个表征向量H(x),叠加两个森林的输出得到特征向量Zi作为输入,用于训练深度随机森林;1‑6)训练过程中为防止过拟合,每层深度随机森林都会进行交叉验证,当验证出的正确率相比前一层没有提升,则训练终止,得到故障预测模型;2)利用步骤1‑5)中得到的故障预测模型对风电变桨系统进行故障预测。

【技术特征摘要】
1.一种基于改进深度随机森林算法的变桨系统故障预测方法,其中,深度森林算法包括多个级联模块,每个级联模块包括并行设置的完全随机森林模块和随机森林模块,且均采用决策树进行决策,其特征在于,上述故障预测方法包括如下步骤:1)搭建基于改进深度随机森林算法的变桨系统的故障预测模型,该模型的搭建方法如下:1-1)从实际风场运行产生的历史SCADA数据中选取样本数据;1-2)利用基于专家经验和数据挖掘算法相结合的特征选择方法进行特征筛选,确定故障预测模型的输入变量和输出变量;1-3)对每一个样本数据进行加权处理;1-4)通过一个长度为k的采样窗口对样本数据进行滑动采样,得到子样本向量;1-5)每个子样本由级联模块中的完全随机森林和随机森林训练分别生成一个表征向量H(x),叠加两个森林的输出得到特征向量Zi作为输入,用于训练深度随机森林;1-6)训练过程中为防止过拟合,每层深度随机森林都会进行交叉验证,当验证出的正确率相比前一层没有提升,则训练终止,得到故障预测模型;2)利用步骤1-5)中得到的故障预测模型对风电变桨系统进行故障预测。2.根据权利要求1所述的基于改进深度随机森林算法的变桨系统故障预测方法,其特征在于,所述的步骤1-2)中进行特征筛选的方法为:首先利用专家知识对所有特征进行初筛,形成候选特征集合;然后采用支持向量机结合后向搜索策略对候选特征集合进行进一步筛选。3.根据权利要求1所述的基于改进深度随机森林算法的变桨系统故障预测方法,其特征在于,所述的步骤1-3)中加权时权值的确定方法为:权值wi由逻辑回归模型生成...

【专利技术属性】
技术研发人员:褚景春袁凌张磊丁亮曹扬潘磊于天笑
申请(专利权)人:国电联合动力技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1