一种智能投加模型的生成系统及方法技术方案

技术编号:32357556 阅读:26 留言:0更新日期:2022-02-20 03:20
本发明专利技术提供一种智能投加模型的生成系统及方法,包括:由获取的水厂的多种历史水质数据及对应的混凝剂的真实投加量中提取得到多种关键水质数据;获取并处理到的多个机器学习模型中两两之间的误差差异度的相关系数,以筛选得到相关系数小于一阈值对应的各机器学习模型作为基学习器;将各种关键水质数据及对应的真实投加量划分为多个数据集,针对每个基学习器,采用交叉验证方式训练各基学习器,并根据训练完成的基学习器和各数据集处理得到新测试集和新训练集;根据新测试集和新训练集对元学习器进行训练,并根据训练完成的各基学习器和元学习器生成智能投加模型。有益效果是能够为水厂提供精准可靠的混凝剂的预测投加量。够为水厂提供精准可靠的混凝剂的预测投加量。够为水厂提供精准可靠的混凝剂的预测投加量。

【技术实现步骤摘要】
一种智能投加模型的生成系统及方法


[0001]本专利技术涉及机器学习
,尤其涉及一种智能投加模型的生成系统及方法。

技术介绍

[0002]传统水厂投加混凝剂主要依据于操作员的经验及杯罐试验。其中,基于操作员经验的投加方式往往易造成长期的、大量的浪费,不利于企业降低运营成本。而过于频繁的进行杯罐测试的方式则不利于水厂对风险进行控制与把控出水品质。并且过量的铝基混凝剂残留,对于人体会产生深远的负面影响,如导致阿尔兹海默症等疾病。智能加矾模型是水厂智慧化升级的重要环节,可以解决对加药存在投加精度低、药剂浪费等痛点。
[0003]现有的针对于混凝剂剂量投加量预测方法主要包括神经网络例如多层感知器(Multi

layer Perceptron,MLP)、人工神经网络(Artificial Network,ANN)、卷积神经网络(Convolutional Neural Networks,CNN)、支持向量机、梯度提升决策树(Extreme Gradient Boosting,XGBoost)、随机森林(Random Forest,RF)、长短期记忆网络(Long Short

Term Memory,LSTM)、支持向量回归(Support Vector Regression,SVR)和K

近邻算法(K

nearest Neighbor,KNN)等,以上模型分为传统机器学习和深度学习方法。传统机器学习方法存在精度较为一般的问题,它有时达不到工业生产的需求。而当前比较火热的深度学习模型需要较高的硬件算力、复杂的网络结构和超参数,这在工业生产中难以落地。
[0004]上述算法存在最大问题是,它们只是采用一种单独方式进行计算混凝剂投加量预测,由于混凝剂剂量预测问题的假设空间很大,可能有多个假设在训练集上达到同等性能,若使用单一模型可能由于随机性而导致泛化性能不佳。因此,寻求使用组合预测的方式,进一步提高模型预测精度。但组合的方式多是采用均值计算方式,求取多种算法模型或同一类型算法不同参数模型的预测均值,并不能体现出不同预测算法数据观测的差异性,各个算法并不能通过取长补短的方式训练出更优异模型,并且这种组合方式没有足够的理论支撑,原理也较为单薄。

技术实现思路

[0005]针对现有技术中存在的问题,本专利技术提供一种智能投加模型的生成系统,所述智能投加模型用于预测一水厂的混凝剂的预测投加量;所述生成系统包括:
[0006]数据预处理模块,用于获取所述水厂的多种历史水质数据及对应的所述混凝剂的真实投加量,并由各种所述历史水质数据中提取得到多种关键水质数据;
[0007]模型筛选模块,用于获取多个机器学习模型,并处理得到各所述机器学习模型中两两之间的误差差异度的相关系数,以筛选得到所述相关系数小于一阈值对应的各所述机器学习模型作为基学习器;
[0008]第一训练模块,分别连接所述数据预处理模块和所述模型筛选模块,用于将各种所述关键水质数据及对应的所述真实投加量划分为多个数据集,针对每个所述基学习器,将其中一个所述数据集作为原测试集,其他所述数据集作为原训练集,采用交叉验证方式
训练各所述基学习器,并根据训练完成的所述基学习器和各所述数据集处理得到新测试集和新训练集;
[0009]第二训练模块,连接所述第一训练模块,用于根据所述新测试集和所述新训练集对预设的一元学习器进行训练,并根据训练完成的各所述基学习器和所述元学习器生成以所述关键水质数据为输入,以所述预测投加量为输出的一智能投加模型。
[0010]优选的,所述水厂设有多个水质数据采集装置,连接所述数据预处理模块,各所述水质数据采集装置采用预设的一采样间隔采集所述水厂的所述历史水质数据并输出;
[0011]则所述数据预处理模块包括:
[0012]数据获取单元,用于获取各所述水质数据采集装置采集得到的各所述历史水质数据,并对各所述历史水质数据进行数据清洗得到清洗后水质数据;
[0013]数据提取单元,连接所述数据获取单元,用于由所述清洗后水质数据中提取得到多种所述关键水质数据。
[0014]优选的,所述数据获取单元中,所述数据清洗的方式包括去除缺失值,和/或剔除异常值,和/或保留突变值。
[0015]优选的,所述数据提取单元中,采用Pearson相关分析法由所述清洗后水质数据中提取得到多种所述关键水质数据。
[0016]优选的,所述关键水质数据包括化学需氧量、氨氮、pH值、浊度、原水溶解氧、沉淀池水流量、沉淀池三分之一处浊度、沉淀池出水浊度。
[0017]优选的,所述模型筛选模块包括:
[0018]预测单元,用于针对每个所述机器学习模块,将各所述关键水质数据分别输入所述机器学习模型中得到相应的一单模型预测投加量,并计算所述单模型预测投加量对应的所述真实投加量之间的差异度得到一差异度集合;
[0019]筛选单元,连接所述预测单元,用于根据每个所述机器学习模型对应的所述差异度集合处理得到各所述机器学习模型中两两之间的误差差异度的所述相关系数,以筛选得到所述相关系数小于所述阈值对应的各所述机器学习模型作为所述基学习器。
[0020]优选的,所述基学习器包括LASSO模型、KNN模型、MLP模型、XGBoost模型、SVR模型。
[0021]优选的,所述元学习器采用其中一个所述基学习器,或采用线性回归模型。
[0022]优选的,各所述基学习器的训练过程中,采用网格搜索的方式对各所述基学习器的模型参数进行调整。
[0023]本专利技术还提供一种智能投加模型的生成方法,应用于上述的智能投加模型的生成系统,所述生成方法包括:
[0024]步骤S1,所述生成系统获取所述水厂的多种历史水质数据及对应的所述混凝剂的真实投加量,并由各种所述历史水质数据中提取得到多种关键水质数据;
[0025]步骤S2,所述生成系统获取多个机器学习模型,并处理得到各所述机器学习模型中两两之间的误差差异度的相关系数,以筛选得到所述相关系数小于一阈值对应的各所述机器学习模型作为基学习器;
[0026]步骤S3,所述生成系统将各种所述关键水质数据及对应的所述真实投加量划分为多个数据集,针对每个所述基学习器,将其中一个所述数据集作为原测试集,其他所述数据集作为原训练集,采用交叉验证方式训练各所述基学习器,并根据训练完成的所述基学习
器和各所述数据集处理得到新测试集和新训练集;
[0027]步骤S4,所述生成系统根据所述新测试集和所述新训练集对预设的一元学习器进行训练,并根据训练完成的各所述基学习器和所述元学习器生成以所述关键水质数据为输入,以所述预测投加量为输出的一智能投加模型。
[0028]上述技术方案具有如下优点或有益效果:
[0029]1)采用基于Stacking集成方法的智能投加模型进行水厂的混凝剂的投加量预测,经验证,具有极高的精确度,表现为误差较低、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能投加模型的生成系统,其特征在于,所述智能投加模型用于预测一水厂的混凝剂的预测投加量;所述生成系统包括:数据预处理模块,用于获取所述水厂的多种历史水质数据及对应的所述混凝剂的真实投加量,并由各种所述历史水质数据中提取得到多种关键水质数据;模型筛选模块,用于获取多个机器学习模型,并处理得到各所述机器学习模型中两两之间的误差差异度的相关系数,以筛选得到所述相关系数小于一阈值对应的各所述机器学习模型作为基学习器;第一训练模块,分别连接所述数据预处理模块和所述模型筛选模块,用于将各种所述关键水质数据及对应的所述真实投加量划分为多个数据集,针对每个所述基学习器,将其中一个所述数据集作为原测试集,其他所述数据集作为原训练集,采用交叉验证方式训练各所述基学习器,并根据训练完成的所述基学习器和各所述数据集处理得到新测试集和新训练集;第二训练模块,连接所述第一训练模块,用于根据所述新测试集和所述新训练集对预设的一元学习器进行训练,并根据训练完成的各所述基学习器和所述元学习器生成以所述关键水质数据为输入,以所述预测投加量为输出的一智能投加模型。2.根据权利要求1所述的智能投加模型的生成系统,其特征在于,所述水厂设有多个水质数据采集装置,连接所述数据预处理模块,各所述水质数据采集装置采用预设的一采样间隔采集所述水厂的所述历史水质数据并输出;则所述数据预处理模块包括:数据获取单元,用于获取各所述水质数据采集装置采集得到的各所述历史水质数据,并对各所述历史水质数据进行数据清洗得到清洗后水质数据;数据提取单元,连接所述数据获取单元,用于由所述清洗后水质数据中提取得到多种所述关键水质数据。3.根据权利要求2所述的智能投加模型的生成系统,其特征在于,所述数据获取单元中,所述数据清洗的方式包括去除缺失值,和/或剔除异常值,和/或保留突变值。4.根据权利要求2所述的智能投加模型的生成系统,其特征在于,所述数据提取单元中,采用Pearson相关分析法由所述清洗后水质数据中提取得到多种所述关键水质数据。5.根据权利要求1或2或4所述的智能投加模型的生成系统,其特征在于,所述关键水质数据包括化学需氧量、氨氮、pH值、浊度、原水溶解氧、沉淀池水流量、沉淀池三分之一处浊度、沉...

【专利技术属性】
技术研发人员:乔继梅李泊静胡雅洁吴宗霖杨小华樊志强张振华袁丹
申请(专利权)人:上海威派格智慧水务股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1