本发明专利技术涉及一种电网自动化系统及设备运行状态风险评估算法,所述算法包括如下步骤:1.1基于Relief算法的特征提取;设备异常,往往是设备在运行过程中由设备的一个因素或多个因素相互作用引起的,从设备采集的众多信息中,提取出影响该类异常的因素,剔除无关因素,以供后面的数据分析,这就是特征提取;1.2基于kmeans算法的相似样本聚集;经过步骤1.1Relief算法已获取到影响该设备运行风险的特征指标序列,通过k-means算法计算出每个特征指标在各风险等级下的阈值范围。本本发明专利技术具有如下优点:能够针对每个设备设置其特有的状态分析阈值知识库,避免外界环境及设备自身条件造成的阈值误差,确保告警、预警的准确性。
【技术实现步骤摘要】
本专利技术属于电力系统调度自动化
,利用数据挖掘算法,分析自动化设备运行数据与缺陷之间的关系,生成设备运行状态安全阈值专家库,进而对设备实时与阶段性运行状态进行监控分析,对设备运行中的潜在危险进行提前预警,减少系统故障发生。
技术介绍
随着电网规模的日益扩大,电网的安全稳定运行越来越离不开自动化系统的支持,自动化系统规模和涵盖范围的逐渐扩大也为自动化专业人员的日常运维带来挑战,如何高效合理地管控起下辖的系统是自动化运维工作的关键。自动化设备是系统的基础,设备的健康运行是系统稳定运行的前提,而自动化设备数量众多,关系复杂,管理难度大。虽然现阶段已有针对自动化设备的监控系统,但多为事后告警,且告警判定规则单一不具备适应性,所以存在告警不准确的情况,依然需要大量人力进行人工判定。因此需要一种更加智能的监控方式,针对每个设备,设置其单独的指标阈值范围,从而避免设备因安装环境、运行年限等外在因素造成的阈值差异,并结合数据挖掘算法,分析设备的历史运行情况,自动生成适合该设备的指标阈值,并随着设备的持续运行实时更新,保障设备指标阈值的准确性的同时减少人力维护大量设备阈值的人工代价。
技术实现思路
本专利技术的目的是应用数据挖掘算法,通过对设备历史运行指标数据的分析,构建设备的运行状态分析阈值模型,并以该模型对设备的实时运行情况进行比对判定,对设备的当前运行状态及未来状态进行分析与预测,推送告警与预警,实现自动化设备的智能监控。(1)设备状态影响指标项的确定。不同类型的设备有其各自的运行指标,且影响设备运行的指标各不相同,需要对大量历史数据进行分析,筛选出对设备影响度较大的指标作为相关指标。(2)设备运行相关指标阈值的自动生成与更新。自动化设备数量庞大,人工地逐个设置其相关指标阈值需要大量的人力,且不能做到实时地更新,因此需要通过算法实现设备运行相关指标阈值的自动生成,并根据设备的运行情况实时更新,保证阈值的合理性及实时性。本专利技术针对人工设定阈值的不足,本方案采用结合设备运行数据和设备异常信息,利用数据挖掘算法,提取设备运行特征值,并对设备状态进行聚类分析的方法动态地确定预警告警阈值。随着设备的持续运行,不断更新设备预警告警阈值,使阈值能够准确反应设备的工作状态阈值。具体技术方案如下:本专利技术与现有技术相比,本专利技术具有如下优点:1、分析过程由系统进行,在无人力投入的情况下能够建立起完善合理的设备运行状态分析知识库。2、能够针对每个设备设置其特有的状态分析阈值知识库,避免外界环境及设备自身条件造成的阈值误差,确保告警、预警的准确性。附图说明图1为本专利技术具体实施例经过Relief算法计算最后得到的各指标对设备状态影响权重图。图2为本专利技术具体实施例聚类的效果图。具体实施方式本方案结合了Relief和kmeans两个数据挖掘算法对系统信息进行分析,以供最后的预警告警阈值提取。1.Relief算法作用:设备异常,往往是设备在运行过程中由设备的一个因素或多个因素相互作用引起的。从设备采集的众多信息中,提取出影响该类异常的因素,剔除无关因素,以供后面的数据分析,这就是特征提取。Relief就是这样的一个算法。Relief算法最早由Kira提出,最初局限于两类数据的分类问题。Relief算法是一种特征权重算法(Featureweightingalgorithms),根据各个特征和类别的相关性赋予特征不同的权重,权重小于某个阈值的特征将被移除。Relief算法中特征和类别的相关性是基于特征对近距离样本的区分能力。算法从训练集D中随机选择一个样本R,然后从和R同类的样本中寻找最近邻样本H,称为NearHit,从和R不同类的样本中寻找最近邻样本M,称为NearMiss,然后根据以下规则更新每个特征的权重:如果R和NearHit在某个特征上的距离小于R和NearMiss上的距离,则说明该特征对区分同类和不同类的最近邻是有益的,则增加该特征的权重;反之,如果R和NearHit在某个特征的距离大于R和NearMiss上的距离,说明该特征对区分同类和不同类的最近邻起负面作用,则降低该特征的权重。以上过程重复m次,最后得到各特征的平均权重。特征的权重越大,表示该特征的分类能力越强,反之,表示该特征分类能力越弱。Relief算法的运行时间随着样本的抽样次数m和原始特征个数N的增加线性增加,因而运行效率非常高。下面以电网系统中某以计算机设备的运行数据为例,对算法进行说明。设运行信息包含的属性如下表所示:信息属性说明特征编号hostname主机名无cpu_1_load1mincpu的平均负载1cpu_5_load5mincpu的平均负载2cpu_15_load15mincpu的平均负载3mem_total内存总量4mem_free内存空闲空间5mem_used_rate内存利用率6disk_total磁盘总量7disk_free磁盘空闲空间8disk_used_rate磁盘使用率9status设备实时状态表中对采集的信息进行特征编号,每一个采集的信息都是属性。relief算法的目的就是从这么多的采集属性中提取出影响主机状态的属性,而这些影响主机状态的属性就是特征。以400条采集到的主机信息作为训练集,每一条信息都包含上表中所列的信息属性。设样本的抽样次数为m,权重选择阈值为x。下面说明算法步骤1.按照实时设备状态status将数据分成正常和异常两类;2.初始化每一个属性的权重为0,即W(A)=0,A为特征编号1-9;3.从400条数据中随机选择一个样本R;4.从同类样本中找到最近邻样本H,从不同类样本中找到最近邻样本M。样本与样本间的距离为欧几里德距离,最近邻即欧几里德距离相差最小的样本。5.设A为特征编号,用公式W(A)=W(A)-diff(A,R,H)/m+diff(A,R,M)/m依次计算特征编号从1至9中各个属性的权重,其中diff(A,R,H)为该样本与同类数据的最近邻距离,diff(A,R,M)为该样本与不同类数据的最近临距离;6.重复步骤3到步骤5m次,最后得到各个属性的权重;7.依次将各个属性的权重与设定的权重选择阈值x进行比较,选择权重大于x的属性作为影响该设备运行风险的考量指标。2.kmeans算法作用:经过上一步的特征提取后,找出了真正影响设备状态的因素,但由于样本数量太少(仅一条信息),无法对设备的预警告警阈值进行科学有效的提取。因此,此时应增加样本数量,避免阈值提取时因样本数过少造成的随机误差。而样本并非随意增加,只有对与设备异常发生时有关系的样本进行分析才有意义。这时候需要kmeans算法将与该样本相似的样本聚集到一起,以供后面的预警告警阈值提取。算法:由于聚类算法是给予数据自然上的相似划法,要求得到的聚类是每个聚类内部数据尽可能的相似而聚类之间要尽可能的大差异。所以定义一种尺度来衡量相似度就显得非常重要了。一般来说本文档来自技高网...
【技术保护点】
一种电网自动化系统及设备运行状态风险评估算法,其特征在于,所述算法包括如下步骤:1.1基于Relief算法的特征提取;设备异常,往往是设备在运行过程中由设备的一个因素或多个因素相互作用引起的,从设备采集的众多信息中,提取出影响该类异常的因素,剔除无关因素,以供后面的数据分析,这就是特征提取;1.2基于kmeans算法的相似样本聚集;经过步骤1.1Relief算法已获取到影响该设备运行风险的特征指标序列,通过k‑means算法计算出每个特征指标在各风险等级下的阈值范围。
【技术特征摘要】
1.一种电网自动化系统及设备运行状态风险评估算法,其特征在于,所述
算法包括如下步骤:
1.1基于Relief算法的特征提取;
设备异常,往往是设备在运行过程中由设备的一个因素或多个因素相互作用
引起的,从设备采集的众多信息中,提取出影响该类异常的因素,剔除无关因素,
以供后面的数据分析,这就是特征提取;
1.2基于kmeans算法的相似样本聚集;
经过步骤1.1Relief算法已获取到影响该设备运行风险的特征指标序列,通
过k-means算法计算出每个特征指标在各风险等级下的阈值范围。
2.根据权利要求1所述的一种电网自动化系统及设备运行状态风险评估算
法,其特征在于,所述步骤1.1基于Relief算法的特征提取具体方法如下:
提取设备运行相关的指标项,作为影响设备运行的特征指标可选项,对每个
可选项进行编号,通过relief算法从所有的可选项中提取出影响设备状态的重
要指标,作为特征指标;
以一段时间内的设备运行数据集合作为训练集,每条运行数据都包含该设备
所有指标项运行值,设样本的抽样次数为m,权重选择阈值为x,即最终计算权
重大于x的指标作为特征指标,算...
【专利技术属性】
技术研发人员:王刚,王梓,王晓辉,徐晟,曹宇,张志君,于永超,郭凌旭,徐家慧,郄洪涛,
申请(专利权)人:国家电网公司,北京科东电力控制系统有限责任公司,国网天津市电力公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。