一种基于K-Means-HMM模型的分布式光伏电站故障预警算法制造技术

技术编号:26731969 阅读:66 留言:0更新日期:2020-12-15 14:35
本发明专利技术涉及光伏发电技术领域,具体为一种基于K‑Means‑HMM模型的分布式光伏电站故障预警算法,采集生产记录N条,从这N条数据筛选出发电功率在1kw以上的数据M条,对采集的数据进行分档离散化,并以输出电流和电压两个维度进行K‑Means聚类;利用聚类后的光伏电站的工作状态样本数据训练HMM模型;采集光伏组件的实时生产数据,以输出电流和电压两个维度进行K‑Means聚类,计算出聚类结果;输入训练后的HMM模型,得到预警结果。本发明专利技术将光伏组件的发电功率按照功率区间进行离散化,采用K‑Means对输出电流、输出电压分为不同的类别,利用HMM对时间序列的学习和预测能力,对正常状态和各种故障状态进行学习,进而对光伏组件的工作状态进行判断和预警。

【技术实现步骤摘要】
一种基于K-Means-HMM模型的分布式光伏电站故障预警算法
本专利技术涉及光伏发电
,具体为一种基于K-Means-HMM模型的分布式光伏电站故障预警算法。
技术介绍
随着光伏发电在我国的普及,光伏面板的故障率高的特点逐渐显现出来。由于光伏面板长期在室外环境工作,面板不可避免的发生受损,老化等问题,导致热斑,裂纹等故障,影响了光伏面板的稳定运行,缩短了面板的使用寿命。因此光伏组件的故障诊断成为业界所关注的重点话题。光伏组件常见的缺陷有热斑,玻璃开裂,闪电纹等。热斑是由于在室外环境中灰尘,落叶等遮挡物或由电池内部缺陷造成的局部功率增大,导致局部温度上升。玻璃开裂是由外界高空坠物或其他外力造成的玻璃破碎。闪电纹与电池的隐裂,背板透过的水汽等多因素有关,其具体成因尚不清楚,有研究指出闪电纹可能会造成输出功率的衰减。对于光伏组件的故障检测,传统的方法是测试人员使用IV检测仪对组件的电流,电压数据进行检测,并由专业人员进行分析。其缺点在于操作性较差,由于电厂的组件数量极大,只能对特定设备进行点检,而无法实时的对所有设备进行在线监控,且依赖专家知识,对分析人员的专业水平要求较高。现阶段光伏发电厂的信息化系统已经十分完善,光伏组件实时的生产数据被系统采集和储存,因此基于数据驱动的光伏组件故障诊断方法开始流行。但当前的光伏组件故障诊断算法多为学术研究机构在试验环境下进行研究,甚至采用软件进行模拟产生试验数据,可以获得大量故障样本,与真实的光伏电站的情况相差较大。且算法每次运行仅对单个时间点进行诊断分析,当故障发生时才发出警告,未有效利用时间维度上的信息。检索到现有技术有基于隐马尔科夫模型的分布式光伏电站故障预警算法(对比文件1:CN111124840A),其对数据的预处理方式仅论述其缺失值处理和数据编码。因此,其如何编码,编码的原则是否有利于模型预测的精度不得而知,如果进行大量的手动动态编码,或者制定不合理的编码规则,不利于样本扩大,模型动态更新的需求,因此预警模型在后期维护和可扩展性较差,预测精度也可能无法得到保证,为此,我们提出一种基于K-Means-HMM模型的分布式光伏电站故障预警算法。
技术实现思路
本专利技术的目的在于提供一种基于K-Means-HMM模型的分布式光伏电站故障预警算法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于K-Means-HMM模型的分布式光伏电站故障预警算法,包括如下步骤:S1、采集生产记录N条,从这N条数据筛选出发电功率在1kw以上的数据M条,对采集的数据进行分档离散化,并以输出电流和电压两个维度进行K-Means聚类;S2、利用聚类后的光伏电站的工作状态样本数据训练HMM模型;S3、采集光伏组件的实时生产数据,以输出电流和电压两个维度进行K-Means聚类,计算出聚类结果;S4、将聚类后的光伏组件的实时生产数据输入训练后的HMM模型,得到预警结果。优选的,所述步骤S1中采集一年的生产记录共N条,每条记录含组件号、时间、输出电流、输出电压、发电功率五种参数,从这N条数据筛选出发电功率在1kw以上的数据M条,筛选出的发电功率数据最小值为1kw,最大功率为14.7kw;设某条数据的发电功率值为p,若n≤P<n+1,1≤n≤13,则n为该发电功率档数P,作为HMM模型状态序列的取值。优选的,所述步骤S1中以输出电流和电压两个维度进行K-Means聚类的具体步骤如下:对于M条数据中的输出电流,输出电压进行归一化处理,将输出电流,输出电压视为M*2大小的矩阵,归一化计算公式为:其中:i,j分别为矩阵中的行和列的索引,xij表示归一化后i,j位置的矩阵元素,vij表示归一化前i,j位置的矩阵元素,为归一化前j列中的最小矩阵元素,为归一化前j列中的最大矩阵元素;对经过归一化后的输出电流,输出电压数据进行K-means聚类,K值设为20,得到M条数据的聚类结果C,聚类结果将作为HMM观测序列的取值。优选的,所述步骤S2中的训练样本是根据某一年全年光伏电站的故障记录,在时间段该年的1-10月份中选择32个正常运行时间点及对应组件编号,作为训练集正常状态标签,选择遮挡、导线短路、导线开路、电池老化四种故障的时间点各8个及对应组件编号,作为训练集故障状态标签;在时间段该年的11-12月份中,选择8个正常运行时间点及对应组件编号,作为测试集正常状态标签,选择遮挡、导线短路、导线开路、电池老化四种故障的时间点各2个及对应组件编号,作为测试集故障状态标签。优选的,所述步骤S2中的得到的每个正常状态标签,正常状态标签包含训练集和测试集,根据时间点和组件编号,在M条数据中寻找对应记录,选取对应时间点前300分钟到对应时间点的聚类结果C值和发电功率档数P值,得到训练集正常样本32个和测试集正常样本8个,每个样本含300个C值和300个P值;对于步骤S2中得到的每个故障状态标签,故障状态标签包含训练集和测试集,根据时间点和组件编号,在M条数据中寻找对应记录,选取对应时间点前360分钟到前60分钟的聚类结果C值和发电功率档数P值,得到训练集故障样本32个和测试集故障样本8个,每个样本含300个C值和300个P值。优选的,所述步骤S2训练HMM模型的过程如下:已知模型的状态序列状态的集合的数量N=13,观测值集合的数据量M=20,每个训练样本中的300个P值作为状态序列,300个C值作为观测序列,初始状态概率向量πi有13个元素,每个元素的值为1/13;对于训练集中的正常、遮挡、导线短路、导线开路、电池老化五种状态的样本,按照如下算法,分别训练五个HMM模型:基于已知信息,使用有监督学习算法,求解HMM的转移概率矩阵A,观测概率矩阵B;(1)转移概率矩阵A的求解:对于所有的训练样本,统计C值由i转移到为j的样本个数为Sij个,则由状态为i转移到状态j的概率的估计值为:aij组成的矩阵即为转移概率矩阵A;(2)观测概率矩阵B的求解:对于所有的训练样本,统计C值为i且P值为j的样本个数为Tij个,则状态为i且观测值为j的概率估计值为:bi(j)组成的矩阵即为观测概率矩阵B。优选的,还需验证训练后的HMM模型的预测准确率,将测试样本的观测序列分别代入训练好的五个HMM模型,使用前向-后向算法进行计算,得到五个该观测序列出现的概率,前向-后向算法的公式如下:其中αt(i)是前向概率,即在t时刻部分观测序列为O1,O2,O3…,Ot,状态是qi的概率,记作:αt(i)=P(o1,o2,…,ot,it=qi|λ)βt+1(j)是后向概率,即在t+1时刻部分观测序列Ot+2,Ot+3,…,OT,状态是qi的概率,记作:βt(i)=P(ot+2,ot+3,…,oT,it+1=qi|λ)根据上述公式计算得到的5个概率值,取最大概率本文档来自技高网
...

【技术保护点】
1.一种基于K-Means-HMM模型的分布式光伏电站故障预警算法,其特征在于:包括如下步骤:/nS1、采集生产记录N条,从这N条数据筛选出发电功率在1kw以上的数据M条,对采集的数据进行分档离散化,并以输出电流和电压两个维度进行K-Means聚类;/nS2、利用聚类后的光伏电站的工作状态样本数据训练HMM模型;/nS3、采集光伏组件的实时生产数据,以输出电流和电压两个维度进行K-Means聚类,计算出聚类结果;/nS4、将聚类后的光伏组件的实时生产数据输入训练后的HMM模型,得到预警结果。/n

【技术特征摘要】
1.一种基于K-Means-HMM模型的分布式光伏电站故障预警算法,其特征在于:包括如下步骤:
S1、采集生产记录N条,从这N条数据筛选出发电功率在1kw以上的数据M条,对采集的数据进行分档离散化,并以输出电流和电压两个维度进行K-Means聚类;
S2、利用聚类后的光伏电站的工作状态样本数据训练HMM模型;
S3、采集光伏组件的实时生产数据,以输出电流和电压两个维度进行K-Means聚类,计算出聚类结果;
S4、将聚类后的光伏组件的实时生产数据输入训练后的HMM模型,得到预警结果。


2.根据权利要求1所述的一种基于K-Means-HMM模型的分布式光伏电站故障预警算法,其特征在于:所述步骤S1中采集一年的生产记录共N条,每条记录含组件号、时间、输出电流、输出电压、发电功率五种参数,从这N条数据筛选出发电功率在1kw以上的数据M条,筛选出的发电功率数据最小值为1kw,最大功率为14.7kw;设某条数据的发电功率值为p,若n≤P<n+1,1≤n≤13,则n为该发电功率档数P,作为HMM模型状态序列的取值。


3.根据权利要求2所述的一种基于K-Means-HMM模型的分布式光伏电站故障预警算法,其特征在于:所述步骤S1中以输出电流和电压两个维度进行K-Means聚类的具体步骤如下:
对于M条数据中的输出电流,输出电压进行归一化处理,将输出电流,输出电压视为M*2大小的矩阵,归一化计算公式为:



其中:i,j分别为矩阵中的行和列的索引,xij表示归一化后i,j位置的矩阵元素,vij表示归一化前i,j位置的矩阵元素,为归一化前j列中的最小矩阵元素,为归一化前j列中的最大矩阵元素;
对经过归一化后的输出电流,输出电压数据进行K-means聚类,K值设为20,得到M条数据的聚类结果C,聚类结果将作为HMM观测序列的取值。


4.根据权利要求3所述的一种基于K-Means-HMM模型的分布式光伏电站故障预警算法,其特征在于:所述步骤S2中的训练样本是根据某一年全年光伏电站的故障记录,在时间段该年的10个月份中选择32个正常运行时间点及对应组件编号,作为训练集正常状态标签,选择遮挡、导线短路、导线开路、电池老化四种故障的时间点各8个及对应组件编号,作为训练集故障状态标签;
在时间段该年的另外2个月份中,选择8个正常运行时间点及对应组件编号,作为测试集正常状态标签,选择遮挡、导线短路、导线开路、电池老化四种故障的时间点各2个及对应组件编号,作为测试集故障状态标签。


5.根据权利要求4所述的一种基于K-Means-HMM模型的分布式光伏电站故障预警算法,其特征在于:所述步骤S2中的得到的每个正常状态标签,正常状态标签包含训练集和测试集,根据时间点和组件编号,在M条数据中寻找对应记录,选取对应时间点前300分钟到对应时间点的聚类结果C值和发电功率档数P值,得到训练集正常样本32个和测试集正常样本8个,每个样本含300个C值和300个P值;
对于步骤S2中得到的每个故障状态标签,故障状态标签包含训练集和测试集,根据时间点和...

【专利技术属性】
技术研发人员:梁华锋陈昊林翀
申请(专利权)人:杭州华电下沙热电有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1