本发明专利技术涉及一种基于差分进化随机森林分类器的光伏阵列故障诊断方法。该方法:首先,采集各种工况条件下的光伏阵列电压和各个光伏组串的电流,并以不同的标识符对各种工况进行标识;其次,采用基于袋外数据的分类误判率均值大小确定随机森林模型中决策树的数量范围;而后,利用差分进化算法对其决策树数量范围进行全局优化,得到最优的决策树数量值;再而,将计算出的最优决策树数量值带入利用随机森林分类器并对样本进行训练,得到随机森林故障诊断训练模型;最后,利用训练模型对光伏阵列进行故障检测和分类。本发明专利技术方法,能够在保证最优的模型分类准确率的同时大大加快模型训练速度,从而更快速、准确地实现对光伏发电阵列的故障检测和分类。
【技术实现步骤摘要】
基于差分进化随机森林分类器的光伏阵列故障诊断方法
本专利技术涉及光伏发电阵列故障检测和分类技术,特别是一种基于差分进化随机森林分类器的光伏阵列故障诊断方法。
技术介绍
大规模光伏电站是新能源利用的一种重要方式,其核心的光伏发电阵列在运行过程中由于受到外界自然环境与自身老化等问题的影响,不可避免地会发生一些故障,由于其故障比例在光伏系统中比较大,一旦发生故障就会对对整个光伏发电系统造成很大的破坏。如果这些故障不及时发现与排除,将会直接影响光伏发电系统的正常运行,严重时甚至会烧坏电池组件引发火灾。因此实现光伏系统的故障诊断对发电系统的正常运行具有非常重要的意义。传统的光伏故障诊断方法主要有红外检测法、多传感器法、对地电容测量法、时域反射法。红外检测法通过分析光伏组件的红外图像实现故障诊断,该方法需要很多红外摄像仪与传感器,检测精度不够高,实时性较差,设备费用昂贵;多传感器法需要为光伏组件安装一定数量的电压传感器和电流传感器,通过分析采集到的电压和电流数据实现故障诊断,但是所用传感器数量较多、故障定位的精度较差、容易受外界环境因素影响、难以在大规模光伏阵列中推广;而对地电容测量法和时域反射法都需要离线操作,效率较低,适用范围较小,只适用于串联光伏电路,对测量设备的精度要求很高。近些年,机器学习算法也被提出用于光伏系统的故障诊断,其中常用的诊断方法有人工神经网络(ANN)和支持向量机(SVM)。人工神经网络(ANN)具有较强的自学能力、适应性和非线性逼近能力等优点,但存在着参数优化难、收敛速度过慢等缺点。而支持向量机(SVM)作为比较经典的分类算法,克服了人工神经网络(ANN)收敛速度慢和过拟合的问题,但存在处理大样本数据时能力不足以及解决多分类问题精度较低等困难。而随机森林作为集成学习中比较经典的算法之一,能够解决人工神经网络(ANN)收敛速度过慢,容易陷于过拟合等问题,同时也能解决支持向量机(SVM)处理大样本数据的能力不足的缺点。更重要的是随机森林能够集成多种特征向量,有效提高诊断的正确率。ECernadas等人在2014年评估了179个分类器(包括判别分析,贝叶斯,神经网络,支持向量机,决策树,增强,套袋法,提升法,随机森林,广义线性模型,最近邻分类算法等方法),并证明随机森林是最好的分类器。为此,本专利技术提出一种基于差分进化随机森林分类器的光伏阵列故障诊断方法,通过分析袋外数据(OOB)的分类误判率均值大小确定随机森林模型中决策树数量范围,利用差分进化算法(DE)对其决策树的范围进行全局寻优,使得模型训练时间大大减小,同时使故障检测和分类的准确性达到最优,从而更快速、准确地实现对光伏发电阵列的故障检测和分类。目前,公开发表的文献及专利中尚未见有本专利技术所提出的基于差分进化随机森林分类器的光伏阵列故障诊断方法。
技术实现思路
本专利技术的目的在于提供一种基于差分进化随机森林分类器的光伏阵列故障诊断方法,以克服现有相关技术的缺陷,从而更快速、准确地实现对光伏发电阵列的故障检测和分类。为实现上述目的,本专利技术的技术方案是:一种基于差分进化随机森林分类器的光伏阵列故障诊断方法,包括如下步骤:步骤S1:采集各种工况条件下的光伏阵列电压和各个光伏组串的电流,并以不同的标识符对各种工况进行标识,该些电压、电流数据和类别标识符构成样本数据;步骤S2:将所述样本数据随机分成训练集和测试集;随机森林分裂属性集中的属性个数选用默认值;并采用基于袋外数据的分类误判率均值大小确定随机森林模型中决策树的数量范围;步骤S3:根据所述步骤S2计算出的决策树的数量范围,以求解分类误判率最小值为目标,利用差分进化算法对其数量范围进行全局优化,得到最优的决策树数量值;步骤S4:根据所述步骤S3计算出的最优决策树数量值,利用随机森林分类器对训练集中的每个样本进行训练,得到随机森林故障诊断训练模型;步骤S5:通过所述步骤S1对实际待测工况进行处理,并利用所述随机森林故障诊断训练模型,对所述实际待测工况下的光伏阵列电压电流数据进行检测和分类,判断光伏发电阵列系统是否处于故障状态;若处于故障状态,则给出故障类型。在本专利技术一实施例中,所述的样本数据是平衡数据,每个类别有大致相同的样本数;所述阵列电压和各个组串电流作为随机森林故障诊断训练模型的输入向量;所述类别标识作为随机森林故障诊断训练模型的输出。在本专利技术一实施例中,所述工况包括正常工作、组串级线线故障、阵列级线线故障、老化故障、阴影故障、开路故障;其中,组串级线线故障,即组串中一块或多块组件被短路;阵列级线线故障,即不同组串中电势差为一块或多块组件工作电压的电位点被短路;老化故障,即组串老化和阵列老化;阴影故障,即组串中一块或多块组件发生阴影遮挡;开路故障,即组串中连接线发生意外断路。在本专利技术一实施例中,所述随机森林故障诊断训练模型通过袋外误差估计模型的泛化误差,并采用多重K-fold交叉验证的方法,将其多重K次迭代的平均分类准确率作为分类精度。在本专利技术一实施例中,所述随机森林故障诊断训练模型采用多项式作为构建随机森林的运行时间复杂度,其中c为常数项,T为决策树的数量,M为模型输入向量个数,N为样本数量。相较于现有技术,本专利技术具有以下有益效果:本专利技术方法,通过分析袋外数据(OOB)的分类误判率均值大小确定随机森林模型中决策树数量范围,利用差分进化算法(DE)对其决策树的数量范围进行全局寻优,得到最佳的决策树棵树,在保证最优的模型分类准确率的同时大大加快模型训练速度,从而更快速、准确地实现对光伏发电阵列的故障检测和分类。附图说明图1为本专利技术中基于差分进化随机森林分类器的光伏阵列故障诊断方法的总体流程图。图2为本专利技术中获取样本数据的实验平台实物图。图3为本专利技术一实施例中各种预设故障的原理图。图4为本专利技术一实施例中袋外数据(OOB)估计误差结果图。图5为本专利技术一实施例中用于搜索决策树范围的基本差分进化算法流程图。图6为本专利技术一实施例中经差分进化算法(DE)优化后的随机森林算法流程图。图7为本专利技术一实施例中10折交叉验证得到的准确性对比图。具体实施方式下面结合附图,对本专利技术的技术方案进行具体说明。本专利技术提供一种基于差分进化随机森林分类器的光伏阵列故障诊断方法,流程框图如图1所示。图2为本实施例中用于获取样本数据的实验平台实物图,其中光伏阵列采用18块型号为GL-M100太阳能组件,分成3个组串,每个组串采用6块组件串联,组成6×3的串并联连接方式。本专利技术提供一种基于差分进化随机森林分类器的光伏阵列故障诊断方法,本实施例中各种预设工况包括:正常工作;组串级线线故障,即组串中短路组件的数量为1块和2块;阵列级线线故障,即短接不同组串中电势差为1块和2块组件工作电压的电位点;老化故障,即组串老化4欧和阵列老化4欧;阴影故障,即组串中阴影组件的数量为1块和2块;开路故障,即断开某一组串中组件间的连接线。本实施例中的预设故障创建方法:线线故障通过使用导线使不同电位点短路实现;开路故障通过断开光伏组件间的连接线实现;老化故障通过串联接入阻值为4欧的大功率铝壳电阻实现;阴影故障通过使用半透明的亚克力板遮挡组件实现。各种预设故障的原理图如图3所示。通过模拟光伏发电阵列出现的不同故障状况,在不同的气候条件下,选择不同的时段本文档来自技高网...
【技术保护点】
一种基于差分进化随机森林分类器的光伏阵列故障诊断方法,其特征在于,包括如下步骤:步骤S1:采集各种工况条件下的光伏阵列电压和各个光伏组串的电流,并以不同的标识符对各种工况进行标识,该些电压、电流数据和类别标识符构成样本数据;步骤S2:将所述样本数据随机分成训练集和测试集;随机森林分裂属性集中的属性个数选用默认值;并采用基于袋外数据的分类误判率均值大小确定随机森林模型中决策树的数量范围;步骤S3:根据所述步骤S2 计算出的决策树的数量范围,以求解分类误判率最小值为目标,利用差分进化算法对其数量范围进行全局优化,得到最优的决策树数量值;步骤S4:根据所述步骤S3 计算出的最优决策树数量值,利用随机森林分类器对训练集中的每个样本进行训练,得到随机森林故障诊断训练模型;步骤S5:通过所述步骤S1对实际待测工况进行处理,并利用所述随机森林故障诊断训练模型,对所述实际待测工况下的光伏阵列电压电流数据进行检测和分类,判断光伏发电阵列系统是否处于故障状态;若处于故障状态,则给出故障类型。
【技术特征摘要】
1.一种基于差分进化随机森林分类器的光伏阵列故障诊断方法,其特征在于,包括如下步骤:步骤S1:采集各种工况条件下的光伏阵列电压和各个光伏组串的电流,并以不同的标识符对各种工况进行标识,该些电压、电流数据和类别标识符构成样本数据;步骤S2:将所述样本数据随机分成训练集和测试集;随机森林分裂属性集中的属性个数选用默认值;并采用基于袋外数据的分类误判率均值大小确定随机森林模型中决策树的数量范围;步骤S3:根据所述步骤S2计算出的决策树的数量范围,以求解分类误判率最小值为目标,利用差分进化算法对其数量范围进行全局优化,得到最优的决策树数量值;步骤S4:根据所述步骤S3计算出的最优决策树数量值,利用随机森林分类器对训练集中的每个样本进行训练,得到随机森林故障诊断训练模型;步骤S5:通过所述步骤S1对实际待测工况进行处理,并利用所述随机森林故障诊断训练模型,对所述实际待测工况下的光伏阵列电压电流数据进行检测和分类,判断光伏发电阵列系统是否处于故障状态;若处于故障状态,则给出故障类型。2.根据权利要求1所述的基于差分进化随机森林分类器的光伏阵列故障诊断方法,其特征在于,所述的样本数据是平衡数据,每个类别...
【专利技术属性】
技术研发人员:陈志聪,韩付昌,吴丽君,俞金玲,林培杰,程树英,郑茜颖,
申请(专利权)人:福州大学,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。