利用分块主成分分析的污水处理过程异常工况检测方法技术

技术编号:24171742 阅读:38 留言:0更新日期:2020-05-16 03:11
本发明专利技术涉及一种利用分块主成分分析的污水处理过程异常工况识别方法。本发明专利技术以污水处理过程正常工况下的数据作为训练数据集,通过计算训练数据集中变量的互信息,对变量进行分块,在每个子块中根据主成分分析法建立主元模型,在每个子块的主元模型中构建T

【技术实现步骤摘要】
利用分块主成分分析的污水处理过程异常工况检测方法
本专利技术属于污水处理领域,具体涉及一种利用分块主成分分析的污水处理过程异常工况检测方法。
技术介绍
城市污水包含大颗粒固态悬浮物、多种病原体、含氮化合物、含磷化合物、碳水化合物等,是一个非常复杂的混合液。图1示出了一种污水处理工艺的流程图。污水处理过程是一个典型的多变量、多耦合、长流程、非线性的复杂过程,同时存在很多干扰因素和不确定因素。目前,城市污水处理所采用的方法主要是借助微生物群体吸附和分解能力,对污水中可降解的有机物成分进行氧化,再使用复杂的生物和化学反应以及物理处理,使有机物质被降解并与污水进行分离以净化污水。图2示出了活性污泥简化流程图。现在的城市污水处理系统广泛使用活性污泥法及其衍生的改良工艺,但由于受到工作环境、用水量、天气、毒水、进水水质和水量波动的影响,活性污泥会受到一定程度的损害,进而引起污水处理过程的故障,最终影响整个污水处理系统的出水水质不达标。因为污水处理过程长流程、连续性和不可替代性的特点,一旦污水处理系统的某个过程发生故障就会导致整个污水处理的故障,会给污水厂和社会带来巨大的经济损失和重大环境污染。因此对污水处理过程中的异常工况进行在线的故障监测和故障诊断,进而采取必要的措施减少或抑制异常工况的发生就变得非常重要。在目前过程监控领域中,一般将故障检测方法划分为以下三个类别:基于解析模型的方法、基于知识驱动的方法以及基于数据驱动的方法。基于解析模型的方法是指利用系统的解析模型,再加上可以获取的输入以及输出信号,就可以构建出残差信号,反映了系统的实际行为和期望状态之间偏离程度,通过设置残差信号的阈值就能进行故障检测。但在实际工业过程涉及的变量、规模等都十分庞大,建立具体的解析模型变得极为困难,甚至无法完成。虽然通过机理模型的故障检测方法可以实现对特殊情况的异常工况的诊断识别,但这类方法过度依赖于生物反应的机理模型,而现有的机理模型中涉及到太多的难以辨识的参数,增加了异常工况的不确定性。同时,模型的参数还与实际工厂的运行状态有关,目前并没有统一的生化机理模型,而基于不同机理模型获得的异常诊断结果可能互相矛盾,这使得基于机理模型的故障诊断的准确性受到了严重的影响。基于知识驱动方法主要是借助现有的先验知识和专家经验对系统的运行状态进行分类,不用建立准确的数学模型,就能准确直观地识别出故障行为。但对于知识的收集、专家系统的建立都是十分困难的,且专家经验的可靠性与丰富程度是系统识别准确性的决定性因素。在污水处理的故障诊断领域,基于知识的研究方法中应用较广泛的有决策树和专家系统这两种方法,但基于知识的故障诊断方法种类较少,重点分析了污泥负荷、化学需氧量、SVI值、溶解氧和pH等,通过这些指标建立决策树或专家数据库,并建立异常工况的风险评估模型。该模型能实现对异常工况的风险评估,但不能对异常工况进行定量的分析。基于数据驱动方法不要求具体的解析模型和丰富专家知识,能够直接利用工业过程中可获取的变量数据,通过提取数据中的特征信息,就能对系统的运行状态进行故障检测。随着人工智能的发展,现阶段使用较多的的故障诊断方法有:深度学习模型、分阶段解析模型、BP(BackPropagation)神经网络模型、主成分分析模型等。深度学习模型利用分类器进行多次分类,准确度较高。分阶段解析模型在引入故障假说后,可以通过快速检测出可疑元件,然后对可疑元件进行筛选。BP神经网络模型利用故障特征和诊断目标,建立三层神经网络的故障模型,将提取的故障信号作为BP神经网络的输入信号,其诊断速度较慢但准确度高。主成分分析模型的优点在于不用建立模型,可以利用大量的数据进行快速区分。但实际的污水处理过程大部分是复合变量非高斯的动态过程,变量繁多且相互之间存在耦合。大范围的多变量的动态变化过程比起单一过程变量是复杂得多的,而且局部单元中当前的测量不仅依赖于局部单元中过去的几次测量,而且还依赖于相邻单元中现在或过去的测量。传统主成分分析法(PrincipleComponentAnalysis,PCA)是将所有的变量进行矩阵运算,矩阵的维度通常很大,在进行运算时会花费大量的时间,一旦特征值的选择不当就会对模型的构建和主元空间的产生造成较大误差,因此,传统主成分分析法具有识别率低、计算量大的缺陷。
技术实现思路
鉴于以上问题,本专利技术提出了一种利用分块主成分分析的污水处理过程的异常工况检测方法。该方法利用互信息将采集的正常工况下的预处理后的数据分成训练子块,对每个训练子块按照传统的主成分分析法建立主元模型,对每个训练子模型计算T2统计量,并根据核密度估计确定T2统计量的阈值;然后采集实时数据,对实时数据进行同样的建模,计算每个检测子模型的T2统计量,并根据贝叶斯推论确定T2统计量的故障概率,对T2统计量的故障概率进行加权得到实时数据在整个数据空间的检测统计量,若检测统计量超出控制限则认为可能发生了异常工况。具体而言,本专利技术提供一种利用分块主成分分析的污水处理过程异常工况检测方法,其特征在于,所述方法包括以下步骤:步骤一:选取污水处理过程中的监控变量,采集正常工况下的数据,作为训练数据集;步骤二:对训练数据进行预处理;步骤三:使用互信息方法分别计算预处理后的训练数据中每两个变量之间的互信息;步骤四:指定互信息的阈值,根据互信息规则将训练数据中的变量划分成不同子块,即训练子块;步骤五:在每个训练子块中建立主成分分析模型,即训练子模型;步骤六:对每个训练子模型计算T2统计量,根据核密度估计确定各个训练子块的T2统计量的阈值;步骤七:获取污水处理过程中的实时数据,对实时数据进行预处理,按照步骤四确定的分块方式将预处理后的实时数据中的变量划分成不同子块,即检测子块,在每个检测子块中建立主成分分析模型,即检测子模型;步骤八:对每个检测子模型计算T2统计量,根据贝叶斯推论确定各个检测子模型的T2统计量的故障概率;步骤九:根据各个训练子块的T2统计量的阈值、各个检测子模型的T2统计量及其故障概率,计算实时数据在整个数据空间的检测统计量,识别故障点。在一个或多个实施方案中,步骤一中,污水处理过程应大致满足活性污泥1号模型中的动态过程,主要包括:(1)异养生物的需氧生长,(2)异养生物的缺氧生长,(3)自养生物的需氧生长,(4)异养生物的衰减,(5)自养生物的衰减,(6)可溶性有机氮的氨化,(7)被吸附的缓慢降解有机碳的水解,和(8)被吸附的缓慢降解有机氮的水解。在一个或多个实施方案中,步骤一中,污水处理过程符合长期型1号基准仿真模型,包括两个缺氧池、三个好氧池和一个二沉池。在一个或多个实施方案中,步骤一中,选取的监控变量要能反映污水处理过程的运行状况。在一个或多个实施方案中,步骤一中,选取的监控变量选自溶解氧浓度、进水量、污泥回流量、出水量、出水氨氮含量、化学需氧量、生物需氧量、pH值、固态悬浮物浓度、水的压力和水温。在一个或多个实施方案中,步骤二或步骤七中,对数据进行预处理包括:去除本文档来自技高网
...

【技术保护点】
1.一种利用分块主成分分析的污水处理过程异常工况检测方法,其特征在于,所述方法包括以下步骤:/n步骤一:选取污水处理过程中的监控变量,采集正常工况下的数据,作为训练数据集;/n步骤二:对训练数据进行预处理;/n步骤三:使用互信息方法分别计算预处理后的训练数据中每两个变量之间的互信息;/n步骤四:指定互信息的阈值,根据互信息规则将训练数据中的变量划分成不同子块,即训练子块;/n步骤五:在每个训练子块中建立主成分分析模型,即训练子模型;/n步骤六:对每个训练子模型计算T

【技术特征摘要】
1.一种利用分块主成分分析的污水处理过程异常工况检测方法,其特征在于,所述方法包括以下步骤:
步骤一:选取污水处理过程中的监控变量,采集正常工况下的数据,作为训练数据集;
步骤二:对训练数据进行预处理;
步骤三:使用互信息方法分别计算预处理后的训练数据中每两个变量之间的互信息;
步骤四:指定互信息的阈值,根据互信息规则将训练数据中的变量划分成不同子块,即训练子块;
步骤五:在每个训练子块中建立主成分分析模型,即训练子模型;
步骤六:对每个训练子模型计算T2统计量,根据核密度估计确定各个训练子块的T2统计量的阈值;
步骤七:获取污水处理过程中的实时数据,对实时数据进行预处理,按照步骤四确定的分块方式将预处理后的实时数据中的变量划分成不同子块,即检测子块,在每个检测子块中建立主成分分析模型,即检测子模型;
步骤八:对每个检测子模型计算T2统计量,根据贝叶斯推论确定各个检测子模型的T2统计量的故障概率;
步骤九:根据各个训练子块的T2统计量的阈值、各个检测子模型的T2统计量及其故障概率,计算实时数据在整个数据空间的检测统计量,识别异常工况。


2.如权利要求1所述的方法,其特征在于,
步骤一中,污水处理过程满足活性污泥1号模型中的动态过程,包括:(1)异养生物的需氧生长,(2)异养生物的缺氧生长,(3)自养生物的需氧生长,(4)异养生物的衰减,(5)自养生物的衰减,(6)可溶性有机氮的氨化,(7)被吸附的缓慢降解有机碳的水解,和(8)被吸附的缓慢降解有机氮的水解;和/或
步骤一中,污水处理过程符合长期型1号基准仿真模型,包括两个缺氧池、三个好氧池和一个二沉池;和/或
步骤一中,选取的监控变量要能反映污水处理过程的运行状况;和/或
步骤一中,选取的监控变量选自溶解氧浓度、进水量、污泥回流量、出水量、出水氨氮含量、化学需氧量、生物需氧量、pH值、固态悬浮物浓度、水的压力和水温。


3.如权利要求1所述的方法,其特征在于,
步骤二或步骤七中,对数据进行预处理包括:去除数据缺失的样本,去除与其他样本偏差过大的样本,对数据零均值化,以消除不同量纲的影响;其中,对数据零均值化包括:假设有M组数据{Xm},每组数据是N维,由此组成矩阵Xm×n,对数据零均值化的公式为:



其中,i=1,2…M,j=1,2…N。


4.如权利要求1所述的方法,其特征在于,
步骤三中,两个变量x1和x2之间的互信息I(x1,x2)如下计算:



其中,p(x1,x2)是联合概率密度函数,p(x1)和p(x2)分别是x1和x2的边际概率密度函数;其中,p(x1,x2)、p(x1)和p(x2)如下计算:









其中,f(x1,x2)为x1和x2的联合分布函数。


5.如权利要求1所述的方法,其特征在于,
步骤四中,分块的过程如下:
假设有n个样本,每个样本包含m个变量,构成X∈Rn×m的数据集;
步骤a:计算两个变量xi,xj(i=1,2,…,m;j=1,2,…,m)之间的互信息I(xi,xj),由此得到一个互信息矩阵I∈Rm×m;
步骤b:根据经验给定互信息的阈值η,如果I(xi,xj)满足I(xi,xj)≥η,则将变量xi和xj分在一个子块中;
...

【专利技术属性】
技术研发人员:钱锋钟伟民杜文莉周钊彭鑫
申请(专利权)人:华东理工大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1