基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法及系统技术方案

技术编号:22077815 阅读:23 留言:0更新日期:2019-09-12 14:52
本发明专利技术公开了一种基于模糊聚类和RS‑KNN模型用于电网运行状态的判别方法,包括如下步骤:Step 1:选择用于电网运行状态判别的特征变量;Step 2:使用模糊聚类算法,将电网运行的健康状态按照健康程度分为四种类型,分别为健康、亚健康、一般病态和严重病态。在聚类前,为了消除数据量纲的影响,需要采用归一化方法对电网的特征变量数据进行处理。Step 3:将步骤1中得到的特征变量,作为训练集的输入变量,将步骤2中得到的已经分类电网运行状态所对应的数据作为训练集,训练集的输出为对应的电网运行状态,健康、亚健康、一般病态和严重病态这四种电网运行状态所对应的标签分别设定为1、2、3和4。Step 4:将得到的四种电网运行状态的数据用来训练RS‑KNN模型。

Discrimination Method and System of Power Grid Operation State Based on Fuzzy Clustering and RS-KNN Model

【技术实现步骤摘要】
基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法及系统
本专利技术涉及电网运行状态判别领域,具体涉及一种基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法及系统。
技术介绍
各国大规模的停电事故,所造成的经济损失和社会影响极其严重,给电网的安全稳定运行敲响了警钟,对电网运行状态的准确及时判别至关重要。针对传统电网运行状态判别方法存在的问题。一方面,忽略数据中的价值,另一方面,不能满足电网运行状态判断实时性要求。
技术实现思路
为解决上述问题,本专利技术提供了一种基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法及系统。为实现上述目的,本专利技术采取的技术方案为:基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,包括如下步骤:Step1:选择用于电网运行状态判别的特征变量;Step2:划分电网运行状态类型使用模糊聚类算法,将电网运行的健康状态按照健康程度分为四种类型,分别为健康、亚健康、一般病态和严重病态。在聚类前,为了消除数据量纲的影响,需要采用归一化方法对电网的特征变量数据进行处理。Step3:构造训练集将步骤1中得到的特征变量,作为训练集的输入变量,将步骤2中得到的已经分类电网运行状态所对应的数据作为训练集,训练集输出结果是对应的电网运行状态,健康、亚健康、一般病态和严重病态这四种电网运行状态所对应的标签分别设定为1、2、3和4。Step4:训练RS-KNN模型首先使用随机子空间方法在原训练样本的特征空间中随机抽样,构造新的训练集。然后,利用新的样本训练集来训练基分类器KNN。最后,通过多数投票规则融合多个KNN基分类器,输出的结果是电网运行状态的分类结果。进一步地,所述步骤Step1具体包括如下步骤:S11:使用使数据集中的电网运行正常样本和故障样本相对平衡;S12:随机森林-递归特征消除用于选取重要变量;S12.1训练集是利用初始变量集构建的,包含多个训练样本,其输入为:训练集的输出为:其中,为训练样本总数,是指第个变量,是指第个输入样本,则是代表第个输入样本的第个变量。是指电网运行状态判别的标签,其中,1用于表示电网正常状态,而–1表示电网故障状态。S12.2利用随机森林得到10个初始变量集中各变量的重要度,并且记录当变量个数为初始变量集时的分类正确率。S12.3每次删除一个最不重要的变量,使用删除变量后的变量集重新构造一个新的训练集,并重新测试训练集的分类正确率。S12.4重复12.3直到只剩下一个重要性最大的变量,所有的变量都被搜索结束。在步骤S12后,初始变量集即10个变量的重要度排序被得到,也可以得到不同变量所对应训练集的分类正确率。获得最高分类正确率时,所用的输入变量就是重要变量。进一步地,所述步骤S11具体包括如下步骤:Step1:在故障样本集中,为故障样本集中的每个样本找到距离该样本最近的个样本,度量标准采用欧式距离。Step2:随机在每个电网故障样本的个最近邻样本中抽取样本数为,为采样倍率,由正常样本数与故障样本数的比值确定。Step3:基于式(1),构建新的故障样本,是与之间的随机线性插值,其中是随机选择的最近邻样本,是故障样本。(1)上式中代表一个随机数,其取值范围在[0,1]区间。Step4:把生成的电网故障样本与原始数据集组合,获得两个类别数量比较平衡的数据集。进一步地,所述步骤S12.2具体包括如下步骤:Step1:生成随机森林模型(1.1)首先抽取样本数据构造决策树,使用抽样对样本数据进行抽取,随机的、有放回的从原始训练样本中抽取个样本,且未被选中的个样本作为袋外数据。(1.2)在决策数的节点中,选择初始变量集合中的个变量,计算包含在每个变量的信息量,在个变量中,选择一个变量实施节点分裂,要求这个变量是分类能力最好的。(1.3)每棵树都自然生长,不进行剪枝。(1.4)重复上述步骤次,就会得到随机森林其中,随机森林含有棵决策树。Step2:针对袋外数据,通过RF中的每个决策树进行分类并计算电网运行状态样本的分类正确率。Step3:训练集中每个初始变量记作新的袋外数据记作是依次对袋外数据的添加随机噪声干扰得到的,电网运行状态样本的分类正确率是通过针对袋外数据,使用每棵决策树对其实施分类并计算得到的。Step4:计算变量的重要度,具体计算见下式。进一步地,假设指标为观测值为所述步骤Step2中:对于越大越优的指标数据,采用以下公式进行归一化处理其中,对于越小越优和中间型的指标数据,采用以下公式归一化处理通过对指标进行归一化,将其取值范围规范到[0,1]之间,这有利于整体的综合评估;本专利技术还一提供了基于模糊聚类和RS-KNN模型用于电网运行状态的判别系统,该系统基于Spark的SparkStreaming实时读取数据,然后通过上述的判别方法输出判别结果。本专利技术具有以下有益效果:1.本专利技术通过考察电网运行状态的相关特征,收集影响电网运行的各类指标,从负荷、电压、线路、功率四个方面初步建立描述电网运行状态的指标体系,再通过随机森林-特征消除(RF-RFE)算法,从数据的角度入手选取重要变量,使构建的最终指标体系用于电网运行状态评估更加准确,为调度人员从高维复杂的电网指标中高效地选择出重要指标。2.本专利技术通过采用监督学习与无监督学习相结合的方式对电网运行状态进行判别,采用模糊聚类与最近邻算法相结合,对电网的健康、亚健康、一般病态、严重病态四种电网状态进行判别,得到的结果更加精确且误判的严重程度较低,为预防电网大面积停电事故的发生,调度人员有必要及时准确的把握电网的运行状态。附图说明图1为初步指标体系;图2为随机森林模型图;图3为RF-RFE算法流程图;图4为变量重要度;图5为分类正确率与变量个数之间的关系;图6为FCM-RS-KNN;图7为模型参数与分类正确率关系;图8为模型的混淆矩阵;图9为IEEE9节点系统;图10为IEEE39节点系统。具体实施方式下面结合具体实施例对本专利技术进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本专利技术,但不以任何形式限制本专利技术。应当指出的是,对本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变形和改进。这些都属于本专利技术的保护范围。本专利技术实施例提供了一种基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,包括如下步骤:步骤一、基于RF-RFE的电网运行状态判别指标体系的构建首先依据评价指标体系构建的基本原则入手,构建初始变量集;使用RF计算变量的重要性后并对其进行排序;然后每次删除一个最不重要的变量,使用删除变量后的变量集重新构造一个新的训练集,利用随机森林重新计算新的训练集的分类正确率。重复以上过程直到训练集只剩下一个重要性最大的变量,得到不同变量数量所对应的分类准确度。最佳分类准确率对应的变量是指标系统的重要变量。具体的包括如下步骤:Step1:使用使数据集中的电网运行正常样本和故障样本相对平衡;Step2:随机森林-递归特征消除用于选取重要变量;(2.1)训练集是利用初始变量集构建的,包含多个训练样本,其输入为:训练集的输出为:其中,为训练样本总数,是指第个变量,是指第个输入样本,则是代表第个输入样本的第个变量。是指电网运行状态判别的标签,其中,1用于表示电网正常状态,而–1表示电本文档来自技高网...

【技术保护点】
1.基于模糊聚类和RS‑KNN模型用于电网运行状态的判别方法,其特征在于:包括如下步骤:Step 1:选择用于电网运行状态判别的特征变量;Step 2:划分电网运行状态类型使用模糊聚类算法,将电网运行的健康状态按照健康程度分为四种类型,分别为健康、亚健康、一般病态和严重病态。在聚类前,为了消除数据量纲的影响,需要采用归一化方法对电网的特征变量数据进行处理。Step 3:构造训练集将步骤1中得到的特征变量,作为训练集的输入变量,将步骤2中得到的已经分类电网运行状态所对应的数据作为训练集,训练集输出结果是对应的电网运行状态,健康、亚健康、一般病态和严重病态这四种电网运行状态所对应的标签分别设定为1、2、3和4Step 4:训练 RS‑KNN模型首先使用随机子空间方法在原训练样本的特征空间中随机抽样,构造新的训练集。然后,利用新的样本训练集来训练基分类器KNN。最后,通过多数投票规则融合多个KNN基分类器,输出的结果是电网运行状态的分类结果。

【技术特征摘要】
1.基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,其特征在于:包括如下步骤:Step1:选择用于电网运行状态判别的特征变量;Step2:划分电网运行状态类型使用模糊聚类算法,将电网运行的健康状态按照健康程度分为四种类型,分别为健康、亚健康、一般病态和严重病态。在聚类前,为了消除数据量纲的影响,需要采用归一化方法对电网的特征变量数据进行处理。Step3:构造训练集将步骤1中得到的特征变量,作为训练集的输入变量,将步骤2中得到的已经分类电网运行状态所对应的数据作为训练集,训练集输出结果是对应的电网运行状态,健康、亚健康、一般病态和严重病态这四种电网运行状态所对应的标签分别设定为1、2、3和4Step4:训练RS-KNN模型首先使用随机子空间方法在原训练样本的特征空间中随机抽样,构造新的训练集。然后,利用新的样本训练集来训练基分类器KNN。最后,通过多数投票规则融合多个KNN基分类器,输出的结果是电网运行状态的分类结果。2.如权利要求1所述的基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,其特征在于:所述步骤Step1具体包括如下步骤:S11:使用使数据集中的电网运行正常样本和故障样本相对平衡;S12:随机森林-递归特征消除用于选取重要变量;S12.1训练集是利用初始变量集构建的,包含多个训练样本,其输入为:训练集的输出为:其中,为训练样本总数,是指第个变量,是指第个输入样本,则是代表第个输入样本的第个变量。变量的内容如图2-1。是指电网运行状态判别的标签,其中,1用于表示电网正常状态,而–1表示电网故障状态。S12.2利用随机森林得到10个初始变量集中各变量的重要度,并且记录当变量个数为初始变量集时的分类正确率。S12.3每次删除一个最不重要的变量,使用删除变量后的变量集重新构造一个新的训练集,并重新测试训练集的分类正确率。S12.4重复12.3直到只剩下一个重要性最大的变量,所有的变量都被搜索结束。在步骤S12后,初始变量集即10个变量的重要度排序被得到,也可以得到不同变量所对应训练集的分类正确率。获得最高分类正确率时,所用的输入变量就是重要变量。3.如权利要求2所述的基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,其特征在于:...

【专利技术属性】
技术研发人员:娄建楼时丹丹孟勃曲朝阳王蕾郭晓利
申请(专利权)人:东北电力大学
类型:发明
国别省市:吉林,22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1