当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于LSTM-CNN模型的空气质量检测系统技术方案

技术编号:36759295 阅读:19 留言:0更新日期:2023-03-04 10:52
本发明专利技术公开了一种基于LSTM

【技术实现步骤摘要】
一种基于LSTM

CNN模型的空气质量检测系统


[0001]本专利技术涉及空气质量检测领域,特别涉及一种基于LSTM

CNN模型的空气质量检测系统领域。

技术介绍

[0002]随着工业化与城市化进程的不断加快,大气重污染(主要为PM2.5与臭氧)的频繁发生给人体健康、大气能见度、气候等方面带来了重要的影响。因此,采取重污染期间应急防控措施并及时对公众发布预警预报信息是应对当前严重大气污染问题的关键环节,对区域大气污染联合减排也具有指导意义,目前国际上主流的数值模式对我国各地区PM2.5与臭氧的预报仍具有较大的不确定性,特别是重污染期间预报偏差可达30

60%,市面上主流数据插值方法不确定度较高,立体观测数据的水平分辨率和垂直分辨率较低,大气预报精度较低,鉴于此,我们提出一种基于LSTM

CNN模型的空气质量检测系统。

技术实现思路

[0003]本专利技术的主要目的在于提供一种基于LSTM

CNN模型的空气质量检测系统,能够有效解决
技术介绍
中提出的问题。
[0004]为解决上述问题,本专利技术采取的技术方案为:
[0005]一种基于LSTM

CNN模型的空气质量检测系统,包括回归学习系统、构建学习模型系统、快速预报系统、发布模块和数据检测系统,所述回归学习系统包括环境数据模块、参数变量模块和数据筛选模块;
[0006]所述数据筛选模块用于对环境数据模块进行特征选择,筛选出环境数据中内蕴的对污染物排放最具影响的隐性特征;
[0007]所述数据筛选模块还用于对参数变量模块的污染物进行预测,根据已知点位的污染物检测数据对未知路段检测结果的预测输出;
[0008]所述数据检测系统包括数据获取模块、模型反演数据生成模块、挖掘数据特征模块和数据得出模块。
[0009]本专利技术进一步的改进在于,所述快速预报系统包括网络数据模块、数据特征提取模块和数据预处理模块,所述网络数据模块包含卷积审计神经网络、循环神经网络以及长短期记忆网络,所述数据特征提取模块用于提取网络数据模块的特征并进行更深层次的时间序列特征提取,最终得出污染物的时空特征。
[0010]本专利技术进一步的改进在于,所述数据预处理模块中包含去除唯一属性、使用三次样条插值的全局化的分段插值方法以及数据的标准化,正则化的三种方法,所述数据预处理模块用于对原始数据进行处理,将多源历史数据通过归一化、标准化等数学方法控制在一个较小的数值区间内,从而有利于深度学习模型的训练与拟合。项目采用min

max标准化,函数为其中X代表每一个数据量,Xmin代表数据集中的最小数据值,
Xmax代表数据集中的最大数据值,代表输出的归一化之后的数据值。
[0011]本专利技术进一步的改进在于,所述快速预报系统包括数据整理模块、预报模块、数据融合模块和优化模块,所述数据整理模块和数据融合模块用于预报模块的数据的整理与汇总,所述优化模块用于已完成拟合的模型对测试数据集进行预测,计算模型输出结果与测试集数据的均方根误差与平均绝对误,并根据测试结果来调整和优化数据集以及模型参数,其中所述均方根误差与平均绝对误的计算公式为其中n为测试集样本数量;oi为第i。个样本点实际污染物浓度;pi为第i个样本点模型预报所得污染物浓度
[0012]本专利技术进一步的改进在于,所述空气质量检测步骤包括:
[0013]A,首先需要统计出所要预测区域的历史气象以及空气质量数据,历史数据可实时更新至预测前一天甚至前一小时,并将数据分为训练集、验证集与测试集3个部分,训练集与验证集用于深度学习模型下训练与拟合工作,测试集用于检验训练好的模型实际预测性能。训练集、验证集与测试集的比例一般按照数据的60%、20%、20%进行划分,也可根据实际需求进行不同比例的划分;
[0014]B,采集的多源历史数据量较大,各数据之间的差异也较大,例如采集到的PM2.5浓度数据与对应时刻的温度、降水量、风速等气象数据相差可能会达到几十甚至几百倍,如果将这些原始数据不经过任何处理,会导致深度学习模型的拟合过程较为困难,因此需要对原始数据进行处理,将多源历史数据通过归一化、标准化等数学方法控制在一个较小的数值区间内,从而有利于深度学习模型的训练与拟合。此外,由于采集的多源历史数据均为时间序列数据,因此需要将其转化为深度学习所需的监督学习样本。假设获取5条时间序列的历史数据,分别为T1、T2、T3、T4、T5,假设一条样本训练所需的历史数据为2条,则可以得到3个深度学习模型训练所需的样本;
[0015]C,采用深度学习的相关模型实现数据分析,本系统选用的深度学习模型为Long short

term memory(LSTM)与Convolutional Neural Networks(CNN)相结合的模型,其中CNN模型用于对历史污染物浓度数据进行分析,得出污染物的浅层时序特征,并考虑融合外部数据来增强预测模型,包括空气质量监测站点地理拓扑位置、节假日因素等,得到污染物的空间特征。LSTM模型用于将CNN模型提取得到的特征进行更深层次的时间序列特征提取,最终得出污染物的时空特征;
[0016]D,在完成LSTM

CNN模型的定义后,需要使用数据集对模型进行拟合工作。深度学习模型的拟合过程,将数据集分成训练集和验证集,训练数据通过初始深度学习模型得到预测结果,与验证数据通过损失函数计算误差之后,再使用优化器调整深度学习模型参数,直到模型输出结果与验证数据之间的误差达到预先设定,在完成定义和拟合模型工作之后,需要对模型进行评估工作;
[0017]E、建立融合污染物分布模型,提出基于生成对抗网络的垂直廓线立体遥测数据生成方法,并以此生成对抗网络的训练数据,得到插值后垂直廓线分解结果,其次,在大气污
染物的预报方面,运用深度神经网络对数据进行深度分析,其可以对模型反演数据中的不确定性部分和随机性部分进行建模,即从有限点位的观测数据中挖掘出内蕴的变化规律,具体地,从城市观测数据中挖掘得到同一时段不同位置的数据变化规律,从海岛观测数据中挖掘得到相邻区域不同时间的数据变化规律。在深度数据挖掘的过程中,将地理信息、气象信息等可能影响观测结果的数据一并输入网络进行综合分析,此外,进行了基于ResNet网络的立体遥测数据3D空间特征回归学习,综合上述方法后可对立体遥测数据进行空间地理加权回归,通过在系统内输入垂直廓线观测数据稀疏点位和缺失的卫星观测数据,即可得出该大气污染物的垂直廓线浓度和卫星探测大气污染物浓度总量。
[0018]本专利技术进一步的改进在于,在所述步骤A中,为实现小时间隔数据连续自动采集和储存,应用按鍵精灵软件,采用录制脚本的方式,设计数据采集与存储步骤,实现计算机每间隔小时自行登录网站,经接口拷贝一次数据,以文件格式存入本地内存,完成数据定时、连续、自动采集与存储。
[0019]本专利技术进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于LSTM

CNN模型的空气质量检测系统,包括回归学习系统、构建学习模型系统、快速预报系统、发布模块和数据检测系统,其特征在于:所述回归学习系统包括环境数据模块、参数变量模块和数据筛选模块;所述数据筛选模块用于对环境数据模块进行特征选择,筛选出环境数据中内蕴的对污染物排放最具影响的隐性特征;所述数据筛选模块还用于对参数变量模块的污染物进行预测,根据已知点位的污染物检测数据对未知路段检测结果的预测输出;所述数据检测系统包括数据获取模块、模型反演数据生成模块、挖掘数据特征模块和数据得出模块。2.根据权利要求1所述的一种基于LSTM

CNN模型的空气质量检测系统,其特征在于:所述快速预报系统包括网络数据模块、数据特征提取模块和数据预处理模块,所述网络数据模块包含卷积审计神经网络、循环神经网络以及长短期记忆网络,所述数据特征提取模块用于提取网络数据模块的特征并进行更深层次的时间序列特征提取,最终得出污染物的时空特征。3.根据权利要求2所述的一种基于LSTM

CNN模型的空气质量检测系统,其特征在于:所述数据预处理模块中包含去除唯一属性、使用三次样条插值的全局化的分段插值方法以及数据的标准化,正则化的三种方法,所述数据预处理模块用于对原始数据进行处理,将多源历史数据通过归一化、标准化等数学方法控制在一个较小的数值区间内,从而有利于深度学习模型的训练与拟合。项目采用min

max标准化,函数为其中X代表每一个数据量,Xmin代表数据集中的最小数据值,Xmax代表数据集中的最大数据值,代表输出的归一化之后的数据值。4.根据权利要求1所述的一种基于LSTM

CNN模型的空气质量检测系统,其特征在于:所述快速预报系统包括数据整理模块、预报模块、数据融合模块和优化模块,所述数据整理模块和数据融合模块用于预报模块的数据的整理与汇总,所述优化模块用于已完成拟合的模型对测试数据集进行预测,计算模型输出结果与测试集数据的均方根误差与平均绝对误,并根据测试结果来调整和优化数据集以及模型参数,其中所述均方根误差与平均绝对误的计算公式为计算公式为其中n为测试集样本数量;oi为第i个样本点实际污。染物浓度;pi为第i个样本点模型预报所得污染物浓度。5.根据权利要求1所述的一种基于LSTM

CNN模型的空气质量检测系统,其特征在于:所述空气质量检测步骤包括:A,首先需要统计出所要预测区域的历史气象以及空气质量数据,历史数据可实时更新至预测前一天甚至前一小时,并将数据分为训练集、验证集与测试集3个部分,训练集与验证集用于深度学习模型下训练与拟合工作,测试集用于检验训练好的模型实际预测性能。
训练集、验证集与测试集的比例一般按照数据的60%、20%、20%进行划分,也可根据实际需求进行不同比例的划分;B,采集的多源历史数据量较大,各数据之间的差异也较大,例如采集到的PM2.5浓度数据与对应时刻的温度、降水量、风速等气象数据相差可能会达到几十甚至几百倍,如果将这些原始数据不经过任何处理,会导致深度学习模型的拟合过程较为困难,因此需要对原始数据进行处理,将多源历史数据通过归一化、标准化等数学方法控制在一个较小的数值区间内,从而有利于深度学习模型的训练与拟合。此外,由于采集的多源历史数据均为时间序列数...

【专利技术属性】
技术研发人员:杨建文项衍刘岳阳王继云胡文萱孙亦璇魏致华王梦然路然
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1