一种基于半监督学习方法的汽轮机异常检测方法技术

技术编号:37964278 阅读:7 留言:0更新日期:2023-06-30 09:39
本发明专利技术公开了一种基于半监督学习方法的汽轮机异常检测方法,包括:采集机组的实时运行数据,所述机组的实时运行数据包括高压调节阀门指令值、机组功率值、综合阀位指令、主蒸汽压力以及调节级压力值;对所述机组的实时运行数据进行特征提取,将提取的特征输入到训练后的学习分类模型中,以判断机组是否发生异常,该方法能够提高汽轮机异常检测的准确性。该方法能够提高汽轮机异常检测的准确性。该方法能够提高汽轮机异常检测的准确性。

【技术实现步骤摘要】
一种基于半监督学习方法的汽轮机异常检测方法


[0001]本专利技术属于汽轮机异常检测领域,涉及一种基于半监督学习方法的汽轮机异常检测方法。

技术介绍

[0002]作为发电机的一种重要动力来源,汽轮机保持正常的运行状态是维持电力供应稳定的基础。布置在汽轮机上的众多的传感测量装置用以监测各个部位的工作状态,通过监测参数的异常行为来判断汽轮机的状态。在生产过程中,传感器故障、设备运行异常都会造成各种监测参数产生波动,这就给故障诊断方法发研究造成了相当大的难题。而如何发现参数异常这件事情本身也是比较困难的,识别出异常节点是故障诊断的基础,基于此才能够准确判断机组故障,确保地区内的发电持续供应。
[0003]大数据时代,发电机组海量数据情况下,异常检测显得更加重要。
[0004]总的看来,目前的研究还存在以下问题亟待解决:
[0005]发电机组异常检测方法在实际应用中,为了增加鲁棒性,识别的异常范围较广,预警次数明显偏多,需要有经验的专家再次识别预警,判断是否是真实异常,预警结果的应用意义不大。
[0006]只采用一种无监督学习或监督学习。监督学习必须使用标签数据,但是在实践中标签数据的获得成本太高,很难实现。而对于无监督学习的模型性能又没有准确的衡量标准,模型结果的可解释性较差。
[0007]实际机组数据有其自身特点,样本各指标之间相互独立,在不同场景下的变化趋势不尽相同,导致异常节点的判断也较复杂。
[0008]样本量太少,实验数据大多在一万条以下,缺少针对汽轮机万级数据异常检测的解决方案。因为不同的预测模型特点不同,有的适合特征维度较小、量级较低的样本,而有的模型在处理高维、海量数据时性能更优。
[0009]在现有的研究中,对于汽轮机的异常检测主要是基于模型的方法和基于数据驱动的方法。基于模型的方法要求对汽轮机整个生命周期的所有情况都特别了解,包括汽轮机的负载条件,材料特性和破坏机理等,而汽轮机是一个复杂的系统,想要构造一个性能良好的模型,以提高检测的准确性较为困难。

技术实现思路

[0010]本专利技术的目的在于克服上述现有技术的缺点,提供了一种基于半监督学习方法的汽轮机异常检测方法,该方法能够提高汽轮机异常检测的准确性。
[0011]为达到上述目的,本专利技术所述的基于半监督学习方法的汽轮机异常检测方法包括:
[0012]采集机组的实时运行数据,所述机组的实时运行数据包括高压调节阀门指令值、机组功率值、综合阀位指令、主蒸汽压力以及调节级压力值;
[0013]对所述机组的实时运行数据进行特征提取,将提取的特征输入到训练后的学习分类模型中,以判断机组是否发生异常。
[0014]还包括:
[0015]构建训练集;
[0016]构建学习分类模型;
[0017]利用所述训练集对所述学习分类模型进行训练,得到训练后的学习分类模型。
[0018]基于SVM算法、随机森林算法、基于boosting集成学习算法GBDT、K

近邻算法或决策树算法构建所述学习分类模型。
[0019]构建训练集的具体过程为:
[0020]采集高压调节阀门指令值、机组功率值、综合阀位指令、主蒸汽压力以及调节级压力值的历史数据;
[0021]根据采集到的历史数据计算数据特征值,根据计算得到的数据特征值构建样本集;
[0022]利用K

Means算法、Isolation Forest算法以及LOF算法分别对样本集进行聚类分析,以分别识别出异常样本点;
[0023]将K

Means算法、Isolation Forest算法以及LOF算法均检测出来的异常样本点标记为0,将K

Means算法、Isolation Forest算法以及LOF算法均没有检测出来的样本点标记为3,将其他样本点标记为1,以形成三类样本;
[0024]根据所述三类样本构建训练集。
[0025]所述数据特征值包括特征1(F1)、特征2(F2)、特征3(F3)、特征4(F4)、特征5(F5)、特征6(F6)、特征7(F7)、特征8(F8)及特征9(F9);
[0026]其中,特征1(F1)表示当前功率与前一秒功率之间的差值;特征2(F2)表示当前功率减去下一秒功率所得结果;特征3(F3)表示当前总流量值减去前一秒总流量值所得结果;特征4(F4)表示当前总流量值减去后一秒总流量值所得结果;特征5(F5)表示当前实际流量值减去前一秒实际流量值所得结果;特征6(F6)表示当前实际流量值减去下一秒实际流量值所得结果;连续两秒的功率、总流量及实际流量的有效变化的绝对值分别记作特征7(F7)、特征8(F8)及特征9(F9)。
[0027]所述数据特征值还包括;对各高压调节阀指令值,计算出各高压调节阀当前阀位指令减去前一秒阀位指令的差值(F10,F13,F16,
……
)、当前阀位指令减去下一秒阀位指令的差值(F11,F14,F17,
……
)以及连续两秒的变化总(F12,F15,F18,
……
)。
[0028]K

Means算法中设置聚类簇数k=3,每次聚类迭代次数n=500,种子数s=10。
[0029]IF算法中,设置决策树的个数t=100,每棵决策树的样本量n=128。
[0030]LOF算法中,设置n_neighbors=5,正常样本点和异常样本点被以阈值5为分界线分开。
[0031]本专利技术具有以下有益效果:
[0032]本专利技术所述的基于半监督学习方法的汽轮机异常检测方法在具体操作时,采用半监督学习方法进行异常的检测,具体的,对所述机组的实时运行数据进行特征提取,将提取的特征输入到训练后的学习分类模型中,以判断机组是否发生异常,实现汽轮机运行异常工况的自动化预警。专家可以基于不同的预警级别给予对应的解决方案,更有效的维护汽
轮机平稳运行,带来稳定的经济效益,具有较大的可行性。
附图说明
[0033]图1为本专利技术的流程图;
[0034]图2为汽轮机数据异常的诊断图;
[0035]图3为LOF算法故障检测的结果图;
具体实施方式
[0036]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,不是全部的实施例,而并非要限制本专利技术公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要的混淆本专利技术公开的概念。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0037]在附图中示出了根据本专利技术公开实施例的结构示意图。这些图并非是按比例绘制的,其中为了清楚表达的目的,放大了某些细节,并且可能省略了本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于半监督学习方法的汽轮机异常检测方法,其特征在于,包括:采集机组的实时运行数据,所述机组的实时运行数据包括高压调节阀门指令值、机组功率值、综合阀位指令、主蒸汽压力以及调节级压力值;对所述机组的实时运行数据进行特征提取,将提取的特征输入到训练后的学习分类模型中,以判断机组是否发生异常。2.根据权利要求1所述的基于半监督学习方法的汽轮机异常检测方法,其特征在于,还包括:构建训练集;构建学习分类模型;利用所述训练集对所述学习分类模型进行训练,得到训练后的学习分类模型。3.根据权利要求3所述的基于半监督学习方法的汽轮机异常检测方法,其特征在于,基于SVM算法、随机森林算法、基于boosting集成学习算法GBDT、K

近邻算法或决策树算法构建所述学习分类模型。4.根据权利要求3所述的基于半监督学习方法的汽轮机异常检测方法,其特征在于,构建训练集的具体过程为:采集高压调节阀门指令值、机组功率值、综合阀位指令、主蒸汽压力以及调节级压力值的历史数据;根据采集到的历史数据计算数据特征值,根据计算得到的数据特征值构建样本集;利用K

Means算法、Isolation Forest算法以及LOF算法分别对样本集进行聚类分析,以分别识别出异常样本点;将K

Means算法、Isolation Forest算法以及LOF算法均检测出来的异常样本点标记为0,将K

Means算法、Isolation Forest算法以及LOF算法均没有检测出来的样本点标记为3,将其他样本点标记为1,以形成三类样本;根据所述三类样本构建训练集。5.根据权利要求4所述的基于半监督学习方法的汽轮机异常检测方法,其特征在于,所述数据特征值包括特...

【专利技术属性】
技术研发人员:屈杰姚坤曾立飞万杰马汀山张磊黄嘉驷潘渤谷伟伟张永海张学延
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1