本发明专利技术公开了一种基于流形保持稀疏图和偏离度的判别分析故障分类方法。本发明专利技术包括故障分类模型的离线建模阶段和故障分类模型的在线使用阶段,第一阶段中首先,利用正常工况下被正确标记的历史训练样本的均值、标准差,对所有历史训练样本进行标准化处理,消除量纲不同对建模的影响;然后,利用流形保持稀疏图,过滤各个故障类别的历史训练样本,消除各个故障类别中的明显标记噪声,改善历史训练样本的信息质量;进一步地,利用过滤后的历史训练样本,计算各个故障类别的偏离度信息,并建立基于判别分析的工业过程故障分类模型。本发明专利技术结合实际工业过程,充分考虑了历史训练样本的标记噪声和源于未知故障的在线样本,具有更强的实用性和鲁棒性。实用性和鲁棒性。实用性和鲁棒性。
【技术实现步骤摘要】
基于流形保持稀疏图和偏离度的判别分析故障分类方法
[0001]本专利技术涉及一种工业过程故障分类方法,尤其涉及一种基于流形保持稀疏图和偏离度信息的工业过程判别分析故障分类方法。
技术介绍
[0002]现代工业过程日益大规模化、复杂化,导致故障产生的可能性显著增加;当故障在大规模的、复杂的工业过程中传播时,会导致低产品质量、高生产能耗、设备损坏、人员伤亡、环境污染等严重后果。因此,为了确保安全、高质、高效、绿色生产,有必要进行有效的过程监测,及时地发现和消除故障。
[0003]传统的过程监测方法大致包括状态估计、参数估计、等价空间等基于机理模型的方法和故障树、专家系统、有向图等基于专家知识的方法,对于大规模复杂工业过程,上述两类方法在实用性、通用性等方面仍存在较大缺陷;近年来,集散控制系统、工业物联网等信息技术的迅速发展为现代工业过程的数据采集与存储奠定了坚实基础;因此,数据驱动的过程监测已成为现代化工过程综合自动化的关键研究领域之一。作为数据驱动过程监测的重要研究内容,故障分类能够在检测故障是否发生的同时,为操作工程师提供故障类别信息,对于后续的故障溯源与过程恢复具有重要作用。因此,有必要针对实际工业过程,研究实用有效的故障分类方法。
[0004]从机器学习的角度分析,工业过程故障分类本质上属于典型的模式识别问题,通常采用近邻分类器、随机森林、判别分析、支持向量机、神经网络等方法实现;其中,判别分析、支持向量机、神经网络是使用更为广泛的三类方法。
[0005]对于判别分析故障分类方法,仍有如下两方面的问题有待解决:
[0006](1)如图1所示,判别分析故障分类方法采用监督学习模式,要求所有历史训练样本被全部地、正确地标记;然而,如图2所示,历史训练样本的标记通常是专家知识和样本数据质量共同作用的结果,受限于专家知识的主观性和实际数据质量的非理想性,历史训练样本很有可能出现误标记现象,形成标记噪声;标记噪声的存在,将严重干扰模型的正常训练,导致模型分类性能的剧烈下降。
[0007](2)如图1所示,判别分析故障分类方法遵循封闭世界假设,要求所有在线测试样本的类别信息均能被历史训练样本表征;然而,如图2所示,实际工业过程属于开放世界,是一个不断发展变化的过程,很有可能出现历史训练样本无法表征的新故障;如果无法识别新故障,判别分析故障分类方法在实际工业过程难以取得理想的分类性能。
技术实现思路
[0008]本专利技术针对现有技术的不足,提供了一种基于流形保持稀疏图和偏离度信息的工业过程判别分析故障分类方法。
[0009]本专利技术包括以下步骤:
[0010]步骤1:故障分类模型的离线训练
[0011](1)对工业过程历史训练样本进行标记,使得所有历史训练样本获得标记信息(有可能存在错误的标记信息,即标记噪声)。
[0012](2)对工业过程历史训练样本进行标准化预处理,消除不同量纲对建模的影响。
[0013](3)利用流形保持稀疏图,过滤各个故障类别的历史训练样本,消除各个故障类别中的明显标记噪声,改善历史训练样本的信息质量。
[0014](4)利用过滤后的历史训练样本,计算各个故障类别的偏离度信息。
[0015](5)利用过滤后的历史训练样本,建立基于判别分析的工业过程故障分类模型。
[0016]步骤2:故障分类模型的在线使用
[0017](1)利用各个故障类别的偏离度信息,识别在线样本中源于未知故障类别的样本,避免故障分类模型将上述样本误分类为已知故障类别。
[0018](2)对于源于已知故障类别的在线样本,则将其输入至基于判别分析的工业过程故障分类模型,进一步实现精确分类。
[0019]本专利技术的有益效果:相比于现有的基于判别分析的工业过程故障分类方法,本专利技术结合实际工业过程,充分考虑了历史训练样本的标记噪声和源于未知故障的在线测试样本,提出了一种基于流形保持稀疏图和偏离度信息的工业过程判别分析故障分类方法。该方法的创新之处包括如下两方面一方面:考虑了历史训练样本实际标记过程中的标记噪声,能够利用流形保持稀疏图在过滤明显标记噪声的同时,保留历史训练样本的本质性流形结构,从而显著改善历史训练样本的信息质量;另一方面,可从过滤后的历史训练样本中提取偏离度信息,并利用该信息有效识别源于未知故障的在线测试样本,从而进一步改善模型的分类性能。
附图说明
[0020]图1是现有判别分析方法假定的工业过程故障分类场景图。
[0021]图2是实际的工业过程故障分类场景图。
[0022]图3是均匀分布噪声模型示意图。
[0023]图4是流形保持稀疏图的过滤效果示意图。
[0024]图5是标记样本偏离度示意图。
[0025]图6是基于偏离度的未知故障识别示意图。
[0026]图7是一种基于流形保持稀疏图和偏离度信息的工业过程判别分析故障分类方法流程图。
具体实施方式
[0027]本专利技术的具体实施步骤如下:
[0028]步骤1:故障分类模型的离线训练
[0029](1)对工业过程历史训练样本进行标记,使得所有历史训练样本获得标记信息(有可能存在错误的标记信息,即标记噪声)。
[0030]假定所收集的历史训练样本源于K个工况,每个工况的历史训练样本个数为n
k
,k=1,2,....,K,每个样本可表示为x∈R
M
(其中M为样本维度或变量个数)。对于K个工况,可分为1个正常工况、K
‑
1个故障工况。利用专家知识,对上述源于K个工况的历史训练样本进
行标记。
[0031]值得说明的是,历史训练样本的标记通常是专家知识和样本数据质量共同作用的结果,受限于专家知识的主观性和实际数据质量的非理想性,历史训练样本很有可能出现误标记现象,形成标记噪声。以图3所示的均匀分布噪声模型为例,对于3类故障(即故障1、故障2、故障3),假定故障1(历史训练样本总个数为18)的噪声率为1/3,则有6个源于故障1的训练样本会被误标记为其他故障;对于均匀分布噪声模型,上述6个训练样本将被等可能性地误标记为故障2和故障3(每类故障各3个)。
[0032](2)对工业过程历史训练样本进行标准化预处理,消除不同量纲对建模的影响。
[0033]采用Z
‑
score标准化方法对历史训练样本进行预处理。对于变量m,m=1,2,...,M,假定公认的正常工况下的均值为mean(m)、标准差为对于所有历史训练样本(同样适用于在线测试样本)x
i
的变量m,可按如下公式(1)进行标准化处理:
[0034][0035]其中,为x
i
(m)标准化处理后所得的值。
[0036](3)利用流形保持稀疏图,过滤各个故障类别的历史训练样本,消除各个故障类别中的明显标记噪声,改善历史训练样本的信息质量。
[0037]对于所有历史训练样本表征的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.基于流形保持稀疏图和偏离度的判别分析故障分类方法,其特征在于该方法包括以下步骤:步骤1:故障分类模型的离线训练(1)对工业过程历史训练样本进行标记,使得所有历史训练样本获得标记信息;(2)对工业过程历史训练样本进行标准化预处理,消除不同量纲对建模的影响;(3)利用流形保持稀疏图,过滤各个故障类别的历史训练样本,消除各个故障类别中的明显标记噪声,改善历史训练样本的信息质量;(4)利用过滤后的历史训练样本,计算各个故障类别的偏离度信息;(5)利用过滤后的历史训练样本,建立基于判别分析的工业过程故障分类模型;步骤2:故障分类模型的在线使用(1)利用各个故障类别的偏离度信息,识别在线样本中源于未知故障类别的样本,避免故障分类模型将上述样本误分类为已知故障类别;(2)对于源于已知故障类别的在线样本,则将其输入至基于判别分析的工业过程故障分类模型,进一步实现精确分类。2.根据权利要求1所述的基于流形保持稀疏图和偏离度的判别分析故障分类方法,其特征在于:步骤1中(2)所述标准化预处理是采用Z
‑
score标准化方法。3.根据权利要求1所述的基于流形保持稀疏图和偏离度的判别分析故障分类方法,其特征在于:步骤1中(3)所述流形保持稀疏图的求解是一个NP难问题;采用流形保持图缩减算法,求解该NP难问题。4.根据权利要求1所述的基...
【专利技术属性】
技术研发人员:刘俊,蒋鹏,郑松,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。