基于特征结构优化和深度学习的工业污水处理软测量方法技术

技术编号:36794166 阅读:10 留言:0更新日期:2023-03-08 22:54
本发明专利技术公开了一种基于特征结构优化和深度学习的工业污水处理软测量方法;本发明专利技术首先对工业污水处理厂所采集的数据进行重叠特征的剔除。此外,采用完全集合经验模式分解方法将输入的特征序列和历史数据分解。输入序列和历史数据分解为各自的内在模式函数,接着,使用特征选择Relief F方法将IMFs进行特征筛选。然后,本发明专利技术应用一个新的混合深度学习模型,以预测出水四项指标,模型结合卷积神经网络和门控循环单元网络,通过注意机制进行优化。本发明专利技术相比未经过特征优化的软测量算法,本发明专利技术提升了预测效果。提升了预测效果。提升了预测效果。

【技术实现步骤摘要】
基于特征结构优化和深度学习的工业污水处理软测量方法


[0001]本专利技术属于污水处理系统控制中水质软测量领域,特别涉及一种基于特征结构优化和深度学习的工业污水软测量方法。

技术介绍

[0002]工业废水是指工业生产过程所产生的废水、污水和废液,其种类繁多、成分复杂,常含多种有毒物质。随着工业的迅速发展,工业废水对水体的污染也日趋广泛和严重,造成土壤和空气的污染,威胁人类的健康和安全。由此可见,工业废水的处理比城市污水的处理更为重要。如何有效的根据废水中污染物成分和浓度采取相应的净化措施进行综合利用和处理,是保证可持续发展的有待解决核心问题之一。工业废水处理厂(IETP)虽可通过物理、化学及生物等方法对废水进行有效处理,但废水的水质和水量等干扰因素的波动,往往减弱IETP的治理效果。此外,污水处理厂内其他过程变量与出水某一项指标在时域和频域的耦合关系也很少被提出。

技术实现思路

[0003]本专利技术针对现有工业污水处理软测量方法的局限性,提出一种基于特征结构优化和深度学习的工业污水处理软测量方法。
[0004]本专利技术首先将采集了的工业污水处理厂内数据特征进行了皮尔逊相关性分析(PCC),剔除存在信息重叠的特征。此外,使用完全集合经验模式分解(CEEMD)方法将输入特征序列和历史数据分解。分解后的IMFs分量既包含了主要特征信息,也会有一些IMFs表示原始信号中的噪声成分,这些伪分量会成为后续处理的一个障碍。采用Relief F特征选择方法来选择IMFs中主要过程变量作为输入序列。然后,应用新的混合深度学习模型,结合卷积神经网络(CNN)和门控循环单元网络(GRU),最后,通过注意机制(AM)进行优化,输出出水水质CODcr、NH3‑
N、TN和TP的浓预测结果。
[0005]本专利技术解决其技术问题所采用的技术方案包括如下步骤:
[0006]步骤1、针对工业污水处理厂所采集的数据,剔除重叠特征;
[0007]步骤2、对剔除重叠特征的工业污水处理厂内的数据进行经验模态分解;
[0008]步骤3、对分解后的IMFs进行特征筛选;
[0009]步骤4、设计CNN

GRU

AM混合网络模型;
[0010]步骤5、训练并验证提出模型网络,输出预测指标。
[0011]作为优选,步骤1中所述的剔除重叠特征,具体如下:
[0012]在构建模型之前,对工业污水处理厂所采集的数据进行了皮尔逊相关性分析,相关性的强弱表明输入信息是否存在重叠;PCC的信号x(t)和y(t)的相关系数ρ
xy
定义为:
[0013][0014]式中,σ
xy
为信号x(t)和y(t)的协方差,σ
x
,σ
y
分别为信号x(t)和y(t)的标准差;最
后,将计算得到的相关系数进行归一化,ρ
xy
∈[

1,1],ρ
xy
值越趋近于1表明两个信号的相关性越强,设定阈值,当ρ
xy
大于设定阈值时,则认定为输入信号为重叠信号。
[0015]作为优选,步骤2所述的对特征进行经验模态分解,具体如下:
[0016]采用互补集成经验模态分解方法对原始数据做处理,结合特征筛选算法,剔除高频噪声干扰和虚假分量,筛选出能够表征出有效信息的分量。互补集成经验模态分解既保留了经验模态分解良好的自适应性,又结合了集成经验模态分解有效抑制了模态混叠现象的优点,有效克服了高斯白噪声的残留问题。从而使整体模型具有较好的降噪性能,具体步骤如下:
[0017]步骤

、为原始信号s(t)添加成n对正、负白噪声ω
i
(t):
[0018][0019]步骤

、添加噪声之后的信号按EMD分解过程重新分解,得到两组相应的固有模态函数IMFs和残差r
i
(t),再求均值:
[0020][0021][0022]式中,C
ij+
(t)、C
ij

(t)表示第j个IMF分量,r
i+
(t)、r
i

(t)表示第i次计算残差。
[0023]工业污水处理厂的数据采集往往在复杂的环境下,获取的数据通常有大量的噪声混杂其中。CEEMD分解的过程是将原始信号在不同的时间尺度分解得到频率由高到低的IMFs分量,这个过程是自适应的、近似于正交的滤波过程。IMFs分量既包含了主要特征信息,也会有一些IMFs表示原始信号中的噪声成分,这些伪分量会成为后续处理的一个障碍。本专利技术将在下一步骤通过设定IMF的筛选阈值选取有效IMF分量。
[0024]作为优选,步骤3所述的对分解后的IMFs进行特征筛选,具体如下:
[0025]通过ReliefF算法对分解后的IMFs进行特征筛选,具体为:从同类和不同类样本中各选出k个最近邻样本,对其求平均值得到每个特征权值,从而得到每个样本实例中各个特征与类的相关性。接着,将特征按照权值大小进行排序,将通过设定门限来判定特征是有效或无效,并且选择n个权值最大的特征,去除其他特征来进行特征选择;
[0026]步骤如下:
[0027]设D为特征集合,m为样本重复抽样次数,δ为特征统计量指标,k为最近邻样本个数,T为输出各个特征的统计量指标。
[0028](1)置0所有特征权重
[0029](2)For i=1 to m do
[0030](3)R为从特征集合D中任意抽取的一个样本数据;H
j
(j=1,2,...k)为从R的同一类别的样本集中找到的k个最近邻H
j
(j=1,2,...k),在从每个类别不一致的特征集合中找到k个最近邻M
j
(C)(j=1,2,...k)。
[0031](4)for i=1 to N do
[0032]对于某一特征的A的统计量指标有:
[0033][0034]其中p(C)为该类别的比例。p(Class(R))为随机选取的某样本的类别的比例。
[0035](6)对W进行排序
[0036]求出特征权值后,权值越大表示该特征对样本的区分能力越强,通过设定阈值就选择新的特征子集。
[0037]作为优选,步骤4所述的设计CNN

GRU

AM网络模型,具体如下:
[0038]其中卷积神经网络CNN结构包括卷积层、池化层、全连接层和输出层;CNN模型使用梯度下降法训练参数,经过训练的模型能够学习到时间序列数据中的特征。
[0039]门控循环单元GRU神经网络包含更新门和重置门;GRU单元中的数据传播过程描述如下:首先,通过上一个传输下来的评估状态h
t
‑1和当前节点的输入x
t
来获取重置门R<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于特征结构优化和深度学习的工业污水处理软测量方法,其特征在于,该方法包括以下步骤:步骤1、针对工业污水处理厂所采集的数据,剔除重叠特征;步骤2、对剔除重叠特征的工业污水处理厂内的数据进行经验模态分解;步骤3、对分解后的IMFs进行特征筛选;步骤4、设计CNN

GRU

AM混合网络模型;步骤5、训练并验证提出模型网络,输出预测指标。2.根据权利要求1所述的一种基于特征结构优化和深度学习的工业污水处理软测量方法,其特征在于步骤1所述的剔除重叠特征,具体如下:在构建模型之前,对工业污水处理厂所采集的数据进行了皮尔逊相关性分析,相关性的强弱表明输入信息是否存在重叠;PCC的信号x(t)和y(t)的相关系数ρ
xy
定义为:式中,σ
xy
为信号x(t)和y(t)的协方差,σ
x

y
分别为信号x(t)和y(t)的标准差;最后,将计算得到的相关系数进行归一化,ρ
xy
∈[

1,1],ρ
xy
值越趋近于1表明两个信号的相关性越强,设定阈值,当ρ
xy
大于设定阈值时,则认定为输入信号为重叠信号。3.根据权利要求1所述的基于特征结构优化和深度学习的工业污水处理软测量方法,其特征在于,步骤2所述的对特征进行经验模态分解,具体如下:采用互补集成经验模态分解方法对原始数据做处理,结合特征筛选算法,剔除高频噪声干扰和虚假分量,筛选出能够表征出有效信息的分量;具体步骤如下:步骤

、为原始信号s(t)添加成n对正、负白噪声ω
i
(t):步骤

、添加噪声之后的信号按EMD分解过程重新分解,得到两组相应的固有模态函数IMFs和残差r
i
(t),再求均值:(t),再求均值:式中,C
ij+
(t)、C
ij

(t)表示第j个IMF分量,r
i+
(t)、r
i

(t)表示第i次计算残差。4.根据权利要求3所述的一种基于特征结构优化和深度学习的工业污水处理软测量方法,其特征在于,步骤3所述的对分解后的IMFs进行特征筛选,具体如下:通过Relief F算法对分解后的IMFs进行特征筛选,具体为:从同类和不同类样本中各选出k个最近邻样本,对其求平均值得到每个特征权值,从而得到每个样本实例中各个特征与类的相关性;接着,将特征按照权值大小进行排序,将通过设定门限来判定特征是有效或无效,并且选择n个权值最大的特征,去除其他特征来进行特征选择;步骤如下:
设D为特征集合,m为样本重复抽样次数,δ为特征统计量指标,k为最近邻样本个数,T为输出各个特征的统计量指标;(1)置0所有特征权重(2)For i=1 to m do(3)R为从特征集合D中任意抽取的一个样本数据;H

【专利技术属性】
技术研发人员:曹佳斐薛安克杨勇张乐杨洁胡晓静
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1