一种基于半监督主元分析的过程监控方法,包括步骤一,离线建模进程,分为数据收集模块、数据预标签模块、数据归一化模块1、半监督特征提取模块、统计量计算模块1和控制限设定模块;步骤二,在线监控进程,分为数据归一化模块2、特征提取模块、统计量计算模块2和决策模块,如果步骤二第3步计算得到的或连续5次超出步骤一第6步计算得到的控制上限或,判断为有故障发生,由控制系统则发出报警。可对数据预标签时不需要对采集的所有数据进行标记,大量减少因标记样本等消耗的人力、物力和财力;可以同时利用有标签样本和无标签样本中蕴含的统计方差信息,提高了系统的鲁棒性和实用性,可应用石油化工、机械加工生产过程中。
【技术实现步骤摘要】
【专利摘要】一种基于半监督主元分析的过程监控方法,包括步骤一,离线建模进程,分为数据收集模块、数据预标签模块、数据归一化模块1、半监督特征提取模块、统计量计算模块1和控制限设定模块;步骤二,在线监控进程,分为数据归一化模块2、特征提取模块、统计量计算模块2和决策模块,如果步骤二第3步计算得到的或连续5次超出步骤一第6步计算得到的控制上限或,判断为有故障发生,由控制系统则发出报警。可对数据预标签时不需要对采集的所有数据进行标记,大量减少因标记样本等消耗的人力、物力和财力;可以同时利用有标签样本和无标签样本中蕴含的统计方差信息,提高了系统的鲁棒性和实用性,可应用石油化工、机械加工生产过程中。【专利说明】
本专利技术涉及基于主元分析的故障监控方法,特别涉及一种。
技术介绍
主元分析是一种在生产监控过程中得到广泛应用的方法。传统的主元分析需要使用纯净的正常过程样本进行建模。在建模数据混入非正常数据的情况下,主元分析的监控性能会迅速下降。然而,在工业生产过程,样本的标签通常很难获得。一般情况下,我们有许多无标签的样本和少量的有标签样本。一个合理的设想就是如何利用这些无标签的样本去更新主元特征空间,进而提高主元分析的监控性能的。传统的主元分析监控算法是非监督的,即,主元分析致力于发现样本数据方差变化最大的方向,而忽略了各样本的标签信息。换句话说,主元分析不能处理有标签的样本。因此,在这种情况下,半监督学习被引入,扩展主元分析,提高主元分析的监控性能。相比传统的学习方法,半监督学习可以同时利用未标签的样本和标签样本信息,既可以如监督学习方法那样利用样本的标签信息,还可以如非监督方法那样保持样本的方差结构。因此,半监督学习可以克服的传统主元分析的缺点。
技术实现思路
本专利技术所解决的技术问题是提供一种简单便于计算的,通过该方法可以同时利用有标签样本和无标签样本中蕴含的统计方差信息,克服传统主元分析建模过程中,需要纯净的正常工况样本,如果建模数据混入非正常工况数据,监控性能大幅下降的缺陷。并在很大程度上降低生产过程监控的复杂性,可以大量减少因标记样本等消耗的人力、物力和财力。专利技术的技术方案: 一种基于半监督主元分析的过程监控方法,包括以下步骤: 步骤一:离线建模进程 (I)、数据收集模块收集某一段时间内生产过程中各传感器采集的现场无标签数据,【权利要求】1.一种基于半监督主元分析的过程监控方法,其特征是包括以下步骤: 步骤一:离线建模进程 (I)、数据收集模块 收集某一段时间内生产过程中各传感器采集的现场无标签数据 2.根据权利要求1所述的基于半监督主元分析的过程监控方法,其特征是所述步骤一第I步中的某一段时间是指包含正常工况和非正常工况的最少24小时采集的数据,其中正常工况的数据最少20小时,非正常工况数据最少4小时。3.根据权利要求1所述的基于半监督主元分析的过程监控方法,其特征是所述步骤一第I步中传感器是指温度传感器、流量传感器、液位传感器和压力传感器。4.根据权利要求1所述的基于半监督主元分析的过程监控方法,其特征是所述步骤一第2步中根据生产班组的生产情况记录,标记部分数据是指从步骤一第I步采集的最少24小时数据中,在生产班组的生产情况记录中为正常工况的时间段中随机选取最少5小时数据,从非正常工况的时间段中随机选取最少2小时数据。-5.根据权利要求1所述的基于半监督主元分析的过程监控方法,其特征是所述中《取值为I,P取值为I,P取值为5,取值为10 ¥取值为0.05 q取值为0.05。6.根据权利要求1所述的基于半监督主元分析的过程监控方法,其特征是所述步骤二第I步中传感器是指温度传感器、流量传感器、液位传感器和压力传感器。【文档编号】G06F19/00GK103559401SQ201310551626【公开日】2014年2月5日 申请日期:2013年11月8日 优先权日:2013年11月8日 【专利技术者】王健, 韩志艳 申请人:渤海大学本文档来自技高网...
【技术保护点】
一种基于半监督主元分析的过程监控方法,其特征是包括以下步骤:步骤一:离线建模进程(1)、数据收集模块收集某一段时间内生产过程中各传感器采集的现场无标签数据????????????????????????????????????????????????,?,其中,T表示矩阵的转置,表示第i个样本,表示第i个样本的j个观测变量,n表示样本个数,m表示测量变量的个数,Rmxn表示m行n列的欧式空间;??(2)、数据预标签模块步骤一第1步中采集的数据为未标签数据,根据生产班组的生产情况记录,标记中部分数据为正常工况数据,非正常工况数据,剩余的未标签数据,其中nN是标记的正常工况的样本个数,nAB是标记的非正常工况的样本个数,nU是剩余的未标签数据的样本个数;(3)、数据归一化模块1计算正常工况数据各变量均值(1)和标准差(2)将正常工况数据,非正常工况数据,无标签数据的各列减去公式(1)得到的变量均值且除以公式(2)得到的变量标准差,得到归一化后的正常工况数据,归一化后的非正常工况数据,归一化后的无标签数据;?(4)、半监督特征提取模块4.1?设定无标签样本数据的最优映射目标函数利用归一化后的剩余无标签数据,定义无标签样本数据的最优映射目标函数(3)最大化提取无标签样本数据的方差统计信息,其中W表示最优映射矩阵,表示映射xi通过映射W得到的像,i是索引号,i=1,2,…,nU,表示映射xj通过映射W得到的像,j是索引号,j=1,2,…,?nU;4.2?设定正常工况样本数据的最优映射目标函数?利用获得归一化后的正常过程数据,定义正常工况样本数据的最优映射目标函数(4)最大化提取正常工况样本数据的方差统计信息,其中W表示最优映射矩阵,表示映射xi通过映射W得到的像,i是索引号,i=1,2,…,nN,表示映射xj通过映射W得到的像,j是索引号,j=1,2,…,?nN;4.3?设定非正常工况样本数据的最优映射目标函数利用获得归一化后的非正常工况数据,定义非正常工况样本数据的最优映射目标函数(5)最大化提取非正常工况样本数据的方差统计信息,?其中其中W表示最优映射矩阵,表示映射xi通过映射W得到的像,i是索引号,i=1,2,…,nAB,表示映射xj通过映射W得到的像,j是索引号,j=1,2,…,?nAB;4.4合成无标签样本数据、正常工况样本数据、非正常工况样本数据的最优映射目标函数形成一个综合的最优映射目标函数(6)其中,是比例参数,用来调节正常工况样本数据和非正常工况样本数据对半监督目标函数的贡献比率,取值为0~1;4.5计算最优化半监督最优目标函数的映射向量W综合的最优映射目标函数(7)简化成(8)其中:(9)(10)其中Sij是属性矩阵,是对角阵,?,在谱分析理论中被称为拉普拉斯矩阵,设,I是单位阵,则被扩展成特征值分解问题;对XLXT进行特征值分解,其特征值λ1≥λ2≥…≥λd≥…≥λr,其中r是分解得到的特征值的个数,选取最大的d个特征值所对应的特征向量ω1,ω2,…,ωd,即是所要求解的W=[ω1,ω2,…,ωd?];?(5)、统计量计算模块1计算平方预测误差SPE,即Q统计量,和Hotelling’s?统计量,即D统计量,Q统计量和D统计量被用来作为监控故障状态的指标;5.1归一化后的正常过程数据通过映射,得到降维后的数据,nN表示样本个数,i是索引号,i=1,2,…,nN,XN和YN的关系为:(11)其中是转化矩阵,是残差矩阵;5.2计算D统计量D统计量定义为(12),其中,,,d是映射后的维数,即步骤一第4.5步中选取的特征值的个数;5.3计算Q统计量Q统计量定义为(13),其中表示的估计值;(6)、控制限设定模块通过观察Q统计量和D统计量的分布状况,设定需要报警的控制上限:Q统计量的控制上限满足一个加权的分布,利用步骤一第5.3步计算得到的正常工况SPE值,计算其均值为,方差为,控制上限的置信度为,则Q统计量的控制上限为:(14),取值为0?1;??D统计量的控制上限满足一个加权的F分布,控制上限的置信度为时,则D统计量的控制上限为(15)其中p和q是F分布的自由度,p和q取大于0的整数,取值为0?1;步骤二:在线监控进程(1)数据归一化模块2将当前生产过程中各传感器采集的实时现场数据的各列减去步骤一第3步中得到的相应的变量均值且除以相应的变量标准差,得到归一化后的数据,(16);(?2)、特征提取模块用步骤一第4步中得到的映射向量,将映射到;(3)、统计量计算模块2用步骤一第5步的计算公式(13)计算的平方预测误差SPE统计...
【技术特征摘要】
【专利技术属性】
技术研发人员:王健,韩志艳,
申请(专利权)人:渤海大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。