一种多端协同的多水厂混凝剂投放方法和系统技术方案

技术编号:36400339 阅读:14 留言:0更新日期:2023-01-18 10:07
本发明专利技术提供了一种多端协同的多水厂混凝剂投放方法和系统,方法包括如下步骤:接收不同水厂侧子系统推送的历史样本数据,基于指标种类集合建立不同的样本域,并生成样本域标志;基于不同的样本域对各个水厂的历史样本数据进行合并,并将各样本域对应的样本域标志关联至各个水厂;对历史样本数据进行机器学习,生成对应各个样本域的预测模型;基于每个水厂对应的样本域标志,将预测模型推送至相应水厂侧子系统;水厂侧子系统基于接收的预测模型和采集的现场实时样本数据进行混凝剂投放量预测和投放;根据混凝剂投放后采集的现场实时样本数据和预设的出水水质目标数据,对混凝剂投放量进行本地调整;基于新接收的样本数据对相应的预测模型进行更新。应的预测模型进行更新。应的预测模型进行更新。

【技术实现步骤摘要】
一种多端协同的多水厂混凝剂投放方法和系统


[0001]本专利技术属于污水处理信息化
,涉及一种多端协同的多水厂混凝剂投放方法和系统。

技术介绍

[0002]污水处理厂水质处理流程主要有混凝沉淀、A/O生化反应、氧化消毒等步骤,其中在混凝沉淀池需要投加大量的混凝剂用来絮凝污水中的胶体,一家污水处理量为1万m
³
/d的水厂一年的药剂添加量在数百吨左右,而药剂投加技术很长一段时间都比较基础,主要由人工经验决定投加量,并且依赖于维护人员手动添加,整个过程粗放。如何实现药剂的自动精准投加已成为许多研究人员的研究热点。
[0003]另外当前水厂建设模式多采用BOT模式,一家机构建设多家水厂并同时运营的情况较为普遍,例如在某省,某家厂商同时运营其下34家水厂。因此如何统一建设多水厂下的药剂的精准投放系统,充分利用不同水厂的样本数据,并且同时使该系统具备兼容性也是一个难题。
[0004]公开号为CN112456621A是中国专利技术专利公开了一种絮凝智能加药控制系统及控制方法,通过对絮凝反应池和平流沉淀池中设置多个CCD图像采集设备对矾花颗粒进行观察,通过不同的时期的图像变化对矾花形成过成进行动态分析,预判沉淀池出水的浊度,进行多次修正,并且通过机器识别、机器学习、模型理论等人工智能系统自动识别和学习最佳投加的过程。但其主要针对加药后的反馈调节,没有对加药前的混凝剂添加量的进行预测,而且该专利技术的方案需要对每一个混凝沉淀池设置多个摄像头,成本较高。
[0005]公开号为CN113419432A的中国专利技术专利提供了一种基于动态矩阵控制算法的污水处理系统精准加药方法,包括以下步骤:建立传递函数模型,选取采样时间以及建模时域,选取控制时域和优化时域,根据模型向量、优化时域和控制时域来建立一个动态矩阵,建立模型初始预测向量,计算误差,移位计算,计算控制变量的控制增量,计算实际输出量以及计算输出预测向量;返回进行下一次优化运算,如此循环。但该方案只针对加药量进行预测,没有加药后的再调节,其只应用在单个水厂的情况下,不具备多水厂下广泛接入、统一学习并以此提升方案效率和准确度的优点。

技术实现思路

[0006]基于上述背景,本专利技术的目的在于提供一种多端协同的多水厂混凝剂投放方法和系统,利用多水厂的大样本数据优势,提升加药模型的准确度,以达到污水处理厂混凝药剂精准投放的效果。
[0007]为实现上述目的,本专利技术采用了如下技术方案:一种多端协同的多水厂混凝剂投放方法,包括如下步骤:S1、接收不同水厂侧子系统推送的历史样本数据,基于各历史样本数据中的指标种类集合建立不同的样本域,并生成每个样本域的样本域标志;
S2、基于不同的样本域对各个水厂的历史样本数据进行合并,并将各样本域对应的样本域标志关联至各个水厂;S3、基于决策树模型,对历史样本数据进行机器学习,生成对应各个样本域的加药决策树预测模型;S4、基于每个水厂对应的样本域标志,将对应该样本域的加药决策树预测模型推送至相应水厂侧子系统;S5、水厂侧子系统基于接收的加药决策树预测模型和采集的现场实时样本数据进行混凝剂投放量预测和投放;S6、根据混凝剂投放后采集的现场实时样本数据和预设的出水水质目标数据,对混凝剂投放量进行本地调整;S7、基于新接收的样本数据对相应的加药决策树预测模型进行更新。
[0008]进一步的,步骤S1中,所述的历史样本数据中的指标种类包括化学需氧量、氨氮、总磷、总氮、悬浮物、进水浊度、出水浊度、进水流量、生化需氧量、色度、温度、PH、电导率和溶解氧中的几种或全部;基于历史样本数据中的指标种类集合建立的样本域数量为:其中,N为指标种类的总数量。
[0009]进一步的,步骤S1中,生成每个样本域的样本域标志具体包括:为样本域中的每一个指标种类赋予唯一性编码,然后将每个样本域中包含的指标种类的唯一性编码按照字母升序或降序进行排列并合并成一个字符串,以该字符串作为该样本域的唯一标记,并记录该字符串长度。
[0010]进一步的,步骤S3具体包括:S31、以混凝剂添加量为因变量,样本数据中的其它指标特征为自变量,建立决策树;S32、先遍历样本数据中的所有指标特征,再计算不同指标特征值的分裂划分点的收益,以确定指标特征值及其对应的分裂划分点,完成决策树的节点分裂;S33、当节点满足下面两个条件之一时:1)设定阈值,当叶子节点中的y值的平方误差小于阈值时;或者,2)当所有指标特征已经被用完时;判定该节点为叶子节点,不再进行分裂;S34、按照上述步骤,生成对应各个样本域的加药决策树预测模型。
[0011]进一步的,步骤S3中,对历史样本数据进行机器学习前,还包括对每一个样本域中的历史样本数据进行清洗,具体包括:对于缺失的指标特征值数据,以该指标特征值周围时间点的临近数据的平均值做近似填补;对于在某个时间点出现大幅度波动的指标特征值,先判定该指标特征值是否为异常数据,判定方法为先判断该数据当天前后数据是否为线性递增或者递减,如否再判断该指标特征值前一天、前一个月、前一年相同时间点是否同样有突兀升高或者降低,如否则判定该值为异常值;然后利用相邻时间点指标特征数据计算平均值替换异常特征值。
[0012]进一步的,步骤S32中,计算不同指标特征值的分裂划分点的收益,确定指标特征
值及其对应的分裂划分点具体包括:采用二分法预设划分点,分别计算该指标特征依据不同划分点划分之后的左右节点的y值平方差之和,所述y值平方差之和计算公式为:其中,为左边节点中样本集合的数量,为右边节点中样本集合的数量,为左边节点中样本集合的平均值,为右边节点中样本集合的平均值;选取其中最小的y值平方差之和所对应的指标特征与分裂划分点作为分裂依据。
[0013]进一步的,步骤S6具体包括:在投加根据加药决策树预测模型预测的混凝剂量后,设采集的现场实时出水水质指标值为V,预设目标值为P,预设偏差阈值为Y,如果则进行混凝剂投加量调整;投加量的调整采用线性调整,设原投加量为,新投加量为,投加步长为B,则新混凝剂投加量计算步骤为:当时,计算,以为新一轮混凝剂投放量开始投加药剂,其中上述预设偏差阈值Y与步长B为预设值;投放完成后监测预设间隔时间后混凝沉淀池出水水质,如,则确定此投加量,并标记此时数据,否则重复上述步骤。
[0014]进一步的,步骤S7具体包括:若新接收的样本数据为非标记数据,则将其作为历史样本数据存储,并在存储的数据量达到预设量级后,进行加药决策树预测模型的更新;若新采集的样本数据为标记数据,则即时对相应的加药决策树预测模型进行更新。
[0015]本专利技术还提供了一种多端协同的多水厂混凝剂投放系统,用于执行如上所述的多水厂混凝剂投放方法,包括:配置于水厂侧的若干子系统,包括:采集模块,其用于通过传感器采集样本数据;数据存储与通讯模块,其用于存储本地样本数据并推送至中心侧数据处理中心,以及接收中心侧数据处理中心下发的加药决策树预测模型并存储至本地;混凝剂投放控制模块,其用于根据采集模块采集的现场实时样本数据,基于加药决策树预测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多端协同的多水厂混凝剂投放方法,其特征在于,包括如下步骤:S1、接收不同水厂侧子系统推送的历史样本数据,基于各历史样本数据中的指标种类集合建立不同的样本域,并生成每个样本域的样本域标志;S2、基于不同的样本域对各个水厂的历史样本数据进行合并,并将各样本域对应的样本域标志关联至各个水厂;S3、基于决策树模型,对历史样本数据进行机器学习,生成对应各个样本域的加药决策树预测模型;S4、基于每个水厂对应的样本域标志,将对应该样本域的加药决策树预测模型推送至相应水厂侧子系统;S5、水厂侧子系统基于接收的加药决策树预测模型和采集的现场实时样本数据进行混凝剂投放量预测和投放;S6、根据混凝剂投放后采集的现场实时样本数据和预设的出水水质目标数据,对混凝剂投放量进行本地调整;S7、基于新接收的样本数据对相应的加药决策树预测模型进行更新。2.如权利要求1所述的多端协同的多水厂混凝剂投放方法,其特征在于,步骤S1中,所述的历史样本数据中的指标种类包括化学需氧量、氨氮、总磷、总氮、悬浮物、进水浊度、出水浊度、进水流量、生化需氧量、色度、温度、PH、电导率和溶解氧中的几种或全部;基于历史样本数据中的指标种类集合建立的样本域数量为:其中,N为指标种类的总数量。3.如权利要求1所述的多端协同的多水厂混凝剂投放方法,其特征在于,步骤S1中,生成每个样本域的样本域标志具体包括:为样本域中的每一个指标种类赋予唯一性编码,然后将每个样本域中包含的指标种类的唯一性编码按照字母升序或降序进行排列并合并成一个字符串,以该字符串作为该样本域的唯一标记,并记录该字符串长度。4.如权利要求1所述的多端协同的多水厂混凝剂投放方法,其特征在于,步骤S3具体包括:S31、以混凝剂添加量为因变量,样本数据中的其它指标特征为自变量,建立决策树;S32、先遍历样本数据中的所有指标特征,再计算不同指标特征值的分裂划分点的收益,以确定指标特征值及其对应的分裂划分点,完成决策树的节点分裂;S33、当节点满足下面两个条件之一时:1)设定阈值,当叶子节点中的y值的平方误差小于阈值时;或者,2)当所有指标特征已经被用完时;判定该节点为叶子节点,不再进行分裂;S34、按照上述步骤,生成对应各个样本域的加药决策树预测模型。5.如权利要求4所述的多端协同的多水厂混凝剂投放方法,其特征在于,步骤S3中,对历史样本数据进行机器学习前,还包括对每一个样本域中的历史样本数据进行清洗,具体包括:对于缺失的指标特征值数据,以该指标特征值周围时间点的临近数据的平均值做近似填补;
对于在某个时间点出现大幅度波动的指标特征值,先判定该指标特征值是否为异常数据,判定方法为先判断该数据当天前后数据是否为线性递增或者递减,如否再判断该指标特征值前一天、前一个月、前一年相同时间点是否同样有突兀升高或者降低,如否则判定该值为异常值;然后利用相邻时间点指标特征数据计...

【专利技术属性】
技术研发人员:何友文王鹏张伟杰张浩王丽
申请(专利权)人:中节能环保投资发展江西有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1