在线自学习随机配置网络出水氨氮浓度实时预测方法技术

技术编号:36684509 阅读:8 留言:0更新日期:2023-02-27 19:45
在线自学习随机配置网络出水氨氮浓度实时预测方法应用于污水处理领域。该算法基于误差反馈策略通过基于实时样本对构建好的模型进行在线参数调整和网络结构修正,以使网络具有良好的持续学习能力,更好的处理非平稳动态数据建模问题,进而提高污水处理过程出水氨氮浓度的实时预测性能。浓度的实时预测性能。浓度的实时预测性能。

【技术实现步骤摘要】
在线自学习随机配置网络出水氨氮浓度实时预测方法


[0001]本专利技术涉及人工智能领域,直接应用于污水处理领域。

技术介绍

[0002]氨氮是指在水中以游离氨和铵离子形式存在的氮,是水体中最为常见的污染物之一。其主要来源与生活污水中含氮有机物分解的产物以及焦化、合成氨等工业废水。在污水处理过程中,出水氨氮浓度是衡量出水水质优劣的一个重要参数指标。当水体在氨氮浓度过高时,会对水生生物以及周围的生态环境产生严重的危害。因此,实现对水体氨氮浓度进行及时有效测量显得尤为重要。
[0003]目前,国内外污水处理厂对氨氮浓度的测定方法有很,包括仪器分析法,电化学分析法,以及分光光度计等。采用这些方法的优点是测量精度高,但由于检测过程繁琐、检测时间长、成本高等,无法完成对出水氨氮浓度的实时监测。虽然部分在线监测仪器可以实现水体中氨氮浓度的实时测量,但需要采用化学试剂辅助检测,且容易受到干扰,通用性差。因此,如何高精度、高效率、低成本的对出水氨氮浓度进行实时预测,仍是目前研究的一个关键问题。
[0004]近年来,随着软测量技术的快速发展,数据驱动的软测量技术以其成本低、易操作等优势成为实现对水体氨氮实时监测的一个重要途径。然而,值得注意的是,在实际工业生产过程中采集到的出水氨氮浓度往往以数据流的形式存在,这些数据具有高维非线性、动态时序性、未知性、海量性等特点。传统的神经网络模型大多都基于静态数据或数据流稳定的假设下设计的,未考虑数据流中样本统计特性的不稳定性,导致无法有效学习动态非平稳数据的变化特性。因此,如何分析和利用数据流中蕴含的有效信息是数据驱动建模的难点。为此,本专利技术提出了一种具有自主学习特性的在线自学习随机配置网络结构动态优化算法来根据实时到达的数据流调整网络自身的参数及结构。该算法基于误差反馈策略通过基于实时样本对构建好的模型进行在线参数调整和网络结构修正,以使网络具有良好的持续学习能力,更好的处理非平稳动态数据建模问题,进而提高污水处理过程出水氨氮浓度的实时预测性能。

技术实现思路

[0005]本专利技术提出了一种具有自主学习特性的在线自学习随机配置网络出水氨氮浓度预测方法。通过自身的在线参数学习机制与网络结构修正机制使得构建的模型具有良好的持续学习能力。该方法解决了污水处理过程中出水氨氮浓度测量的问题,实现了对出水氨氮浓度的实时有效预测,进一步提高了出水氨氮浓度的预测性能。
[0006]由于污水处理过程的高复杂性,不稳定性等特点,获取到的水质数据的分布特性往往随时间的推移不断发生变化。它导致基于历史数据训练的模型无法对实时获取的数据进行有效学习。为了从实时变化的动态数据流中获取到有价值的信息和模式,本专利技术提出了一种具有自学习特性的在线自学习随机配置网络。值得注意的是,网络的自学习特性不
仅意味着网络参数的在线更新,还意味着网络拓扑结构的动态改变。具体来说,该方法能够根据实时数据输出的误差大小选择在线参数更新机制或者网络结构修正机制来对网络模型进行在线调整,使SCNs具有良好的持续学习能力以适应实际系统需求。具体内容如下。
[0007]在线参数更新机制
[0008]给定一个初始训练集基于初始训练集构建随机配置网络,假设构建的SCNs具有L个隐节点,网络隐含层神经元激活函数g(
·
)采用sigmoid激活函数,此时第j个隐节点的输出为
[0009][0010]其中,
[0011][0012]此时网络的输出权值可由(2)计算得出
[0013][0014]其矩阵描述如下:
[0015][0016]其中,分别为隐含层的输出矩阵与目标期望值矩阵, 为初始输出权值矩阵。此时t=1即,第一组新样本到达时,网络输出权值为:
[0017][0018]其矩阵描述如下:
[0019][0020]其中,
[0021][0022][0023]则此时,网络的输出权值为:
[0024][0025]以此类推,当t=k,即组第k组样本到达时,网络输出权值的调整公式如下:
[0026][0027]其中,
[0028][0029]令,P
k
=G
k
‑1则,第k个样本到达时,网络权值调整如下。
[0030][0031]值得注意的是,当新样本到达时,若网络输出误差较小,则我们可以假设SCNs监督机制选取的节点仍然有效。因此,这里根据(11

12)对网络参数进行在线修正。
[0032]网络结构修正机制
[0033]在实际工业应用中获取到的数据流往往分布差异较大,简单的在线参数调整无法有效提升网络的学习能力以适应数据的变化。因此,为了对实时到达的数据流进行有效的分析处理,更好的提高模型的在线学习和自主调节能力,我们提出了一种采用融合灵敏度分析与随机配置算法的SCN结构动态调整策略。这部分主要分为两个阶段对网络结构进行调整,分别为剪枝阶段与网络构建阶段。
[0034]1:剪枝阶段
[0035]首先,假设基于历史样本已构建了具有L个隐含层节点的SCNs,因此当新时间窗口t 的样本到达时网络的输出为:
[0036][0037]假设删除第l个神经元节点,则网络输出为:
[0038][0039]网络输出残差
[0040][0041]因此,定义第I个隐含层节点相对于输出残差变化的灵敏度为:
[0042][0043]S越大,表明第I个神经元对网络输出的贡献度越大。因此,通过灵敏度分析可以对隐含层神经元节点的贡献度进行排序S
′1≥S
′2≥

≥S

L
。由于隐含层神经元节点删除越多,模型输出残差变化越大,因此网络规模适应度定义为:
[0044][0045]J
I
越大,网络结构规模越大,学习残差越小。因此,与学习样本相匹配的网络规模可通过网络结构适应度定义为:
[0046]J=min{IJ
I
≥γ,1≤I≤L}
ꢀꢀ
(18)
[0047]其中,γ(0<γ<1)为网络规模适应度阈值,J为网络保留隐含层节点数量。
[0048]2:网络构建阶段
[0049]为避免因隐含层节点删除造成样本信息的丢失,需对保留的网络结构进行进一步的优化调整以更好的学习新的样本。这里,采用随机配置算法III,基于新到达的样本在删
减后的网络基础上重新进行节点构建。
[0050]假定删减M个节点后网络的输出为:
[0051][0052]当前网络的残差为:
[0053]e
L

M
=f

f

L

M
=[e
L,1
,e
L,2
,...,e
L

M,K
].
ꢀꢀ...

【技术保护点】

【技术特征摘要】
1.在线自学习随机配置网络出水氨氮浓度实时预测方法,其特征在于,包括以下步骤:步骤1:水质数据采集与预处理以某污水处理厂进行污水处理时采集的实际水质数据为基础,通过对污水处理过程的出水氨氮进行机理分析,选取

温度、

pH值、

好氧前端溶解氧DO、

进水总磷浓度TP、

厌氧末端氧化还原电位OPR

出水硝态氮NO3‑
N共6个变量作为出水氨氮NH3‑
N的输入变量,记为X={x
im
|i=1,2,

,N,m=1,2,

,M,},m为输入特征维数,这里M=6;N为样本个数;X
im
表示为第i个数据的第m个特征;选取出水NH3‑
N浓度作为输出变量,记为Y={y
ik
|i=1,2,

,N,k=1,2,

,K},k为输出节点数;y
ik
表示第i个样本的第k个输出值;由于采集到的不同水质参数具有不同的量纲,且采集到的不同参数的数据值差别很大,为了消除数据值大小和不同量纲对模型性能的影响,这里对采集到的数据进行归一化操作;将输入变量X和输出变量Y按照如下公式进行归一化处理:将输入变量X和输出变量Y按照如下公式进行归一化处理:将输入变量X和输出变量Y按照如下公式进行归一化处理:X和Y表示经过归一化处理后的数据,其取值范围为[0,1];步骤2:设计基于在线自学习随机配置网络的出水氨氮浓度实时预测模型;步骤2.1:基于系统采集的数据,设置一个固定大小的初始时间窗t0,基于窗口内的数据建立随机配置网络模型;随机配置网络SCN是一个三层前向神经网络,包括输入层、隐含层、输出层;输入层将样本导入网络,包含6个神经元,即;网络初始时隐含层包含1个神经元,用L表示网络隐含层神经元个数,初始时L=1,网络隐含层神经元激活函数采用sigmoid激活函数,即,此时第j个隐节点的输出:其中,<
·
>表示欧式空间的内积运算;w
j
和b
j
是第j个隐含层神经元的输入权值和偏置,其在[

λ,λ]中随机生成为正实数,并受随机配置算法的不等式约束(8)的限制;x
i
表示第i个样本;β
j
是第j个隐藏节点的输出权重向量,当前网络的输出为:当前网络的输出残差为:e
L
=f

f
L
=[e
L,1
,e
L,2
,...,e
L,K
]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)若当前网络的输出残差||e
L
||,这里||
·
||指L2范数,即没能满足网络预设的误差容忍要求,即||e
L
||≤e
P
,e
P
为预设容忍误差阈值且设定e
P
=0.001,则该网络会根
据随机配置算法来选出新的个隐含层节点用于网络构建,此时节点数L=L+1,直至满足终止条件||e
L
||≤e
P
或L≥L
max
,L
max
=150为预设最大隐节点数;其中,随机配置算法可简单描述如下:假设Γ:={h1,h2,h3,

}表示一组实值函数,span(Γ)表示由Γ组成的函数空间且在L2空间是稠密的;其中为正实数;给定0<r<1以及一个非负实值序列{μ
L
},且μ
L
≤(1

r),.对于L=1,2,...,定义第L个隐节点的误差下降因子δ
L
如下:且生成的隐节点满足条件隐含层和输出层之间的输出权重β
*
通过以下方式计算那么,我们可以得到其中假设t=0的初始训练集为N0为初始样本个数,M,K分别为网络的输入输出维数,基于初始训练集构造了一个具有L个隐藏节点的随机配置网络;此时网络隐含层的输出矩阵H0=[h1,...h
j
,...,h
L
],定义h
j
可通过公式(3

4)计算得出;网络的最优初始输出权值可通过公式(9)计算得出,其矩阵描述如下:其中,分别为隐含层的输出矩阵与目标期望值矩阵,为初始输出权值矩阵;步骤2.2:基于构建的网络对新时间窗t内获取的数据进行测试,计算并记录网络的输出值和输出误差;假设基于历史样本已构建了具有L个隐含层节点的SCNs,新时间窗t内的数据为Xt={x
tm
|m=1,2,

,M,t=1,2,

,N
t
},Yt={y
t
|t=1,2,

,N
t
},N
t
为t时刻窗口内的新样本...

【专利技术属性】
技术研发人员:乔俊飞李康苏尹陈鼎元
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1