基于EM算法和梯度提升树的电压暂降原因识别方法技术

技术编号:17840884 阅读:184 留言:0更新日期:2018-05-03 21:22
本发明专利技术公开了一种基于EM算法和梯度提升树的电压暂降原因识别方法,旨在解决同类和异类暂降特征下的电压暂降无法精准分类、数据特征提取提取困难等问题。本发明专利技术以电压暂降波形数据为基础,以电网故障、雷电、气象数据为辅,通过EM算法准确提取了电网二次电压的标幺值,并在此基础上提取了波形数据统计学意义上的特征,在单相和三相数据波形中通过一定的训练样本数据训练了梯度提升树模型,实现了电压暂降原因识别,清晰地区分了系统侧故障导致的电压暂降和用户侧大用户负荷启动导致的电压暂降。

【技术实现步骤摘要】
基于EM算法和梯度提升树的电压暂降原因识别方法
本专利技术涉及一种基于EM算法和梯度提升树的电压暂降原因识别方法,属于电力系统电能质量领域。
技术介绍
电压暂降指电压均方根值快速下降且持续时间不长的事件,其典型持续时间为10ms~1min个周波。电压暂降现象通常可以用电压暂降幅值、持续时间来描述。暂降幅值定义为暂降时的电压有效值与额定值的比,持续时间是指暂降从发生到结束经历的时间。这两个表征电压暂降的特征量对负荷运行有较大影响。国际电工委员会(IEC)定义电压暂降幅值为下降到额定值的90%~1%;电气与电子工程师协会(IEEE)将其定义为下降到额定值的90%~10%。根据实际的运行经验统计,在用户电能质量问题投诉中,80%以上是由电压暂降引起的。这一电压质量问题之所以有如此大的影响,一方面是由于电压暂降的高频次发生;另一方面,即使仅仅持续4~5个周波的电压暂降也会使某些敏感设备非正常运行甚至无序启停,给重要用户带来巨大经济损失。当输配电系统中发生短路故障、大容量感应电机启动、雷击、开关操作、变压器以及电容器组的投切等事件时,均会引起电压暂降。其中雷击会造成杆塔绝缘闪络或对地放电会使保护装置动作,从而导致供电电压下降。这种暂降影响范围大,持续时间一般超过100ms。大容量感应电机的启动及大功率冲击性负荷与短路故障引起的电压暂降会带来不同特征的暂降。感应电机启动造成的暂降深度取决于感应电机特性和联接处的系统短路容量,幅值随电流逐渐恢复为正常值而上升,具有跌落深度浅和持续时间长的特点,一般不会对用户造成严重影响。而由短路故障引起的电压暂降幅值大小与故障位置和类型有关,暂降持续时间由保护的动作时间决定。一般都是电压突然跌落,等断路器动作后,电压立即恢复。因此,短路故障会引起较严重的电压暂降,影响敏感设备的正常工作。变压器在投运时,由于铁芯饱和特性,会在送电端产生数倍于额定电流的涌流,其大小和变压器投运时正弦电压的初相角及铁心剩磁有关。初相角为0°时产生最大的涌流,此时电压暂降程度也最深;相角为90°时,则不会产生涌流。由于变压器投运时三相的初相角始终互差120°,因此,变压器投运引起的电压暂降总是三相不平衡。线圈铜损导致暂降电压的恢复是个逐渐过程,小型变压器的电阻较大,电抗较小,约几个周期就达到稳态;而大型变压器由于电阻较小,电抗较大,一般需要几十个周期才能达到稳态。无论是短路故障引起的电压暂降还是变压器励磁涌流引起的电压暂降,这属于系统侧导致的电压暂降,而大容量感应电机启动引起的电压暂降属于用户侧导致的电压暂降,如何将两者区分是电压暂降治理的必要前提。现有技术要么将大量的电压暂降波形存入数据库,通过繁琐、耗时的方式来匹配,花费大量的计算资源与时间资源,要么通过显式的规则来判断,需要不断地添加规则。在电压暂降源的识别过程中,根据电压有效值及持续时间来进行直观的特征提取往往具有颗粒度大、无法精准分类、数据特征提取等困难。
技术实现思路
为达到上述目的,本专利技术公开一种基于EM算法和梯度提升树的电压暂降原因识别方法,具体包括电压暂降特征工程、暂降事件分类模型训练和外部数据关联,能够克服现有技术电压暂降原因识别颗粒度大、无法精准分类、数据特征提取等困难。为实现上述技术目的,达到上述技术效果,本专利技术通过以下技术方案实现:一种基于EM算法和梯度提升树的电压暂降原因识别方法,其特征在于,包括电压暂降特征工程、暂降事件分类模型训练和外部数据关联;基于电压暂降特征工程提取电压暂降数据的特征数据后,通过暂降事件分类模型训练将电压暂降数据原因分类后,与外部数据关联。电压暂降特征工程从电压暂降波形数据中提取特征数据;所述特征数据具体包括:电压暂降相别、暂降深度、电压暂降持续时间、所在地区、监测点电压等级、暂降10%-180%区间占比、暂降启始到最深暂降的时段、最深暂降到暂降恢复的时段、暂降深度、矩形系数、暂降凹型20%底部与头部比值、暂降凹型20%面积比值、波形偏度、波形翘度和频域聚类5组占比。暂降事件分类模型训练包括梯度提升树的电压暂降波形数据训练模型和EM算法的电压暂降标幺值预估模型,电压暂降波形数据训练模型用于针对样本数据进行参数训练,电压暂降标幺值预估模型用于识别电网二次电压标幺值。基于梯度提升树的电压暂降波形数据训练模型J(θ)表示为:其中f(xi,θ)为电压暂降波形数据类别的预估值;L(yi,f(xi,θ))为损失函数,表示电压暂降波形类别预估值与类标签之间的相似性,θ为参数集合;N为样本数据数目,Ω(θ)为正则项,选取L2正则作为电压暂降波形数据的训练模型的正则项,则:以逻辑回归损失作为损失函数:L(yi,f(xi,θ))=-ylog(f(x;θ))-(1-y)log(1-f(x,θ))(6)为了简化计算复杂度和提升计算速度,以牛顿插值法逼近损失函数,即:xi为训练样本,yi为训练样本对应的类标量,x为训练样本集,y为训练样本对应的类标量集,xi∈x,yi∈y;为插值基函数;训练样本对应的类标量集y有K类波形,将训练样本对应的类标量集标记为集合D,中第k类波形样本所占的比例为pk,则电压暂降波形数据样本集合的纯度Ent(D)为:根据样本集的纯度公式(10),选择某一特征作为决策树的根节点Det(D,a),根节点Det(D,a)的选择原则为比较选取所有特征下纯度比率的最小值:迭代每一个特征后计算其预估值f(xi;θ)与yi之间的差值,以差值作为下一颗决策树的目标;循环计算每一个特征下的决策树,直至差值小于等于ε,即算法收敛,ε为定义的收敛值。电压暂降波形数据类别具体包括故障导致的电压暂降、大用户负荷导致的电压暂降和变压器激磁涌流导致的电压暂降。在波形数据服从正态分布X~N(μ;σ2)的前提下,基于EM算法的电压暂降标幺值预估模型包括E步和M步;E步根据训练数据推断出最优隐变量Z的分布参数;M步在最优隐变量Z的分布参数的基础上,根据波形数据修正Z的分布参数;循环迭代E步与M步,直至最优隐变量Z的参数收敛。基于EM算法的电压暂降标幺值预估模型具体包括以下步骤:S101,计算电压暂降波形数据中前两个周波下有效值的平均值e0和最后两个周波下有效值的平均值e1,分别针对e0保留[0.9e0,1.1e0]范围内的有效值和e1保留[0.9e1,1.1e1]范围内的有效值,其中e0和e1为E步中预估的最优隐变量Z数据组的组成分量;即Z由e0和e1组成。S102,M步具体包括以下步骤,分别针对[0.9e0,1.1e0]和[0.9e1,1.1e1]范围内的有效值数据进行正态分布下的高斯拟合X~N(μ0;σ02)、X~N(μ1;σ12),得到两个范围内的参数μ0和μ1,μ0和μ1为M歩的参数修正;S103,分别计算|μ0-e0|、|μ0-e1|、|μ1-e0|和|μ1-e1|,若任何一个值小于等于ε,则算法停止计算,取小于或者等于ε下的μ0或μ1作为二次电压标幺值,其中ε为参数误差(如取0.01或0.001);S104,若|μ0-e0|、|μ0-e1|、|μ1-e0|、|μ1-e1|都大于ε,则分别在μ0或μ1下保留[0.9μ0,1.1μ0]和[0.9μ1,1.1μ1]范围内的有效值,进行正态分布下的高斯拟合得到参数和S105,重复权利本文档来自技高网
...
基于EM算法和梯度提升树的电压暂降原因识别方法

【技术保护点】
一种基于EM算法和梯度提升树的电压暂降原因识别方法,其特征在于,包括电压暂降特征工程、暂降事件分类模型训练和外部数据关联;基于电压暂降特征工程提取电压暂降数据的特征数据后,通过暂降事件分类模型训练将电压暂降数据原因分类后,与外部数据关联。

【技术特征摘要】
1.一种基于EM算法和梯度提升树的电压暂降原因识别方法,其特征在于,包括电压暂降特征工程、暂降事件分类模型训练和外部数据关联;基于电压暂降特征工程提取电压暂降数据的特征数据后,通过暂降事件分类模型训练将电压暂降数据原因分类后,与外部数据关联。2.根据权利要求1所述的基于EM算法和梯度提升树的电压暂降原因识别方法,其特征在于,电压暂降特征工程从电压暂降波形数据中提取特征数据;所述特征数据具体包括:电压暂降相别、暂降深度、电压暂降持续时间、所在地区、监测点电压等级、暂降10%-180%区间占比、暂降启始到最深暂降的时段、最深暂降到暂降恢复的时段、暂降深度、矩形系数、暂降凹型20%底部与头部比值、暂降凹型20%面积比值、波形偏度、波形翘度和频域聚类5组占比。3.根据权利要求1所述的基于EM算法和梯度提升树的电压暂降原因识别方法,其特征在于,暂降事件分类模型训练包括梯度提升树的电压暂降波形数据训练模型和EM算法的电压暂降标幺值预估模型,电压暂降波形数据训练模型用于针对样本数据进行参数训练,电压暂降标幺值预估模型用于识别电网二次电压标幺值。4.根据权利要求3所述的基于EM算法和梯度提升树的电压暂降原因识别方法,其特征在于,基于梯度提升树的电压暂降波形数据训练模型J(θ)表示为:其中f(xi,θ)为电压暂降波形数据类别的预估值;L(yi,f(xi,θ))为损失函数,表示电压暂降波形类别预估值与类标签之间的相似性,xi为训练样本,θ为参数集合;N为样本数据数目,Ω(θ)为正则项,选取L2正则作为电压暂降波形数据的训练模型的正则项,则:以逻辑回归损失作为损失函数:L(yi,f(xi,θ))=-ylog(f(x,θ))-(1-y)log(1-f(x,θ))(6)为了简化计算复杂度和提升计算速度,以牛顿插值法逼近损失函数,即:xi为训练样本,yi为训练样本对应的类标量,x为训练样本集,y为训练样本对应的类标量集,xi∈x,yi∈y;为插值基函数;训练样本对应的类标量集y有K类波形,将训练样本对应的类标量集标记为集合D,中第k类波形样本所占的比例为pk,则电压暂降波形数据样本集合的纯度Ent(D)为:根据样本集的纯度公式(10),选择某一特征作为决策树的根节点Det(D,a),根节点Det(D,a)的选择原则为比较选取所有特征下纯度比率的最小值:迭代每一个特征后计算其预估值f(xi;θ)与yi之间的差值,以差值作为下一颗决策树的目标;循环计算每一个特征下的决策树,直至差值小于等于ε,算法收敛,ε为定义的收敛值。5.根据权利要求4所述的基于EM算法和梯度提升树的电压暂降原因识别方法,其特征在于,电压暂降波形数据类别具体包括故障导致的电压暂降、大用户负荷导致的电压暂降和变压器激磁涌流导致的电压暂降。6.根据权利要求3所述的基于EM算法和梯度提升树的电压暂降原因识别方法,其特征在于,在波形数据服从正态分布X~N(μ;σ2)的前提下,基于EM算法的电压暂降标幺值预估模型包括E步和M步;E步根据训练数据推断出最优隐变量Z的分布参数;M步在最优隐变量Z的分布参数的基础上,根据波形数据修正Z的分布参数;循环迭代E步与M步,直至最优隐变量Z的参数收敛。7.根据权利要求6所述的基于EM算法和梯度提升树的电压暂降原因识别方法,其特征在于,基于...

【专利技术属性】
技术研发人员:李斌郭雅娟刘健良张军史明明李志陈锦铭范忠刘玉林聂国际孙德鹏邓洁清何剑
申请(专利权)人:国网江苏省电力公司电力科学研究院国家电网公司国网江苏省电力有限公司江苏省电力试验研究院有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1