一种基于图注意力机制的空气污染物浓度预测方法技术

技术编号:26067508 阅读:40 留言:0更新日期:2020-10-28 16:40
本发明专利技术公布了一种基于图注意力机制的空气污染物浓度预测方法,构建基于图注意力机制的空间污染物浓度预测模型,将气象数据、空气监测数据、环境因素数据作为模型输入数据,通过图注意力机制构建图邻接矩阵,利用图卷积神经网络层和多层感知机网络层提取图信息特征,输出预测的空气污染物浓度值。本发明专利技术对空气污染物浓度预测更加准确,过程更加高效。

【技术实现步骤摘要】
一种基于图注意力机制的空气污染物浓度预测方法
本专利技术属于图卷积神经网络技术和空气质量监控
,涉及一种预测点位置处空气污染物浓度预测技术,尤其涉及一种基于图注意力机制的空气污染物浓度预测方法。
技术介绍
空气质量一直是研究环境污染变化的一个重要组分,空气质量的变化是由空气污染物浓度决定的,研究空气污染物浓度能够更好的掌握空气质量的变化。大多数对空气污染物浓度预测是收集多种相关影响因素数据,进行污染物的相关性分析,空气污染物在空气中的浓度与污染物的排放量、污染源的布局、类型和气象条件等各种变量因素有关,将收集到的影响因素数据作为自变量,空气污染物浓度数据作为因变量进行相关性分析,但是由于周围环境的复杂性以及自变量之间的相互影响,使得自变量因素与因变量空气污染物浓度之间的相关性具有不确定性。对此,后续的污染物浓度预测研究中多使用机器学习算法来解决复杂的多元非线性问题。预测算法的实质是通过对一系列动态数据分析其特征之间的关联性、变化状况而构建出对未来进行预测的算法。其中,空气质量预测通常是利用历史污染物浓度数据,通过分析动态数据间的关联来找到空气污染过程的规律性,进而对未来空气质量状况做出预测。目前常用的空气污染物预测算法主要利用机器学习方法和深度学习方法来进行构建。机器学习方法在预测过程中具有坚实的数学基础,为建立合理的空气质量预测模型提供了理论依据,而深度学习方法可以通过不断地训练找出数据间的非线性关系。在针对空气污染物浓度预测的研究中,CobournWG等人针对PM2.5浓度预测开发了一种非线性回归模型,并在模型基础上增加了基于PM2.5浓度的附加参数PM24,PM24是结合空气流动轨迹和当前空气质量人为估计得到,PM24参数的添加使模型效果表现的更好,但是这种人工判断参数值的方式需要不断地手工调整参数,会被噪声数据干扰,同时对结果具有不确定性。Zhao等人将收集到的空气中的气体成分信息通过基于径向基函数(RBF)的模糊神经网络模型进行定量分析,实现了对混合气体的定量检测。王丽梅等人利用BP神经网络建立了城市大气二氧化硫浓度预测模型,引入了城市人口、国内生产总值、年燃煤量等相关变量对某城市二氧化硫浓度作出了合理的预测。王芳等利用遗传算法来对BP神经网络的初始权重和参数进行优化,将优化后的权重和参数输入BP神经网络并对北京市PM10的浓度进行预测,该模型通过遗传算法提高了BP神经网络的收敛速度,同时提高了预测的精度。但是这些算法中使用的变量较少,没有考虑到外界气象条件以及环境因素对气体浓度的影响,并且算法较为单一,很难将模型泛化到其它地区的数据中。姚宁等人在构建BP神经网络预测模型时,在数据集收集阶段考虑了气温、湿度、降水量等气象因素对大气污染物浓度的影响,通过AGNES算法对这些特征数据进行处理,减少离散值。万显列等在在构建基于人工神经网络的气体浓度预测模型时,也加入了风速、风向、温度、湿度等这些环境影响因素。数据维度的增加会适当的提高模型预测的精度,但是当数据量过多时,造成数据冗余或者不必要的网络噪声。随着人工智能优化算法研究逐渐深入,深度学习在气体浓度检测领域也开始广泛应用。其中基于LSTM和RNN的循环神经网络是深度学习应用于气体浓度监测的主要方法。此外,孙蒙等也使用了基于深度置信网络的方法建立空气质量指数预测模型。但这些方法仍然具有对样本依赖性较强,输入较多冗余数据,预测准确率较低等问题。现有的预测算法,基于机器学习的预测算法主要有多元线性回归(MultipleLinearRegression,MLR)、支持向量机(SupportVectorMachine,SVM)、随机森林(RandomForest,RF)方法,其中,多元线性回归算法的计算较为简单、速度快,结果易理解,但是对数据质量要求高、拟合性不好;支持向量机算法的鲁棒性好,可以降低过拟合概率,但是难以对大规模数据进行训练;随机森林算法的抗过拟合能力强,算法稳定,数据适应性强,但是对噪声数据敏感,计算成本高,耗时较长。基于深度学习的预测算法主要有BP神经网络和循环神经网络算法(RecurrentNeuralNetwork,RNN),其中BP神经网络的容错能力、非线性映射和自学习能力强,但是数据量大、算法收敛速度慢、样本依赖性强;循环神经网络算法易解决时间序列问题,但是对非时间序列数据处理效果不好。图注意力网络算法(GAT,GraphAttentionNetwork)加入attention机制,给节点之间的边给予重要性,帮助模型学习结构信息,但相对的缺点是训练方式不是很好,效率不够高,效果较差。
技术实现思路
为了克服上述现有技术的不足,本专利技术提供一种基于图注意力机制的空间污染物浓度预测方法,其预测效果更加准确,过程更加高效。本专利技术解决上述技术问题所采用的技术方案为:一种基于图注意力机制的空气污染物浓度预测方法,构建基于图注意力机制的空间污染物浓度预测模型,将气象数据、空气监测数据、环境因素数据作为模型输入数据,通过图注意力机制构建图邻接矩阵,利用图卷积神经网络层和多层感知机网络层提取图信息特征,输出预测空气污染物浓度值;包括训练阶段和测试阶段;具体包括如下步骤:1)利用空气污染物浓度数据、气象数据、环境因子数据,构建输入特征向量X;对收集的空气污染物浓度数据、气象数据和环境因子数据分别进行数据清洗,对缺失数据进行填充或删除等操作,并针对这些数据以GPS位置信息为基准对数据进行整合,使数据在时空尺度保持一致。将处理好的数据按照经纬度通过ARCGIS工具映射在地图中,再按照路程长度平均选取点位置数据,将所有点位置数据组成向量集合,每个点位置关联的数据包括空气污染物浓度数据、气象数据和环境因子数据;将污染物浓度作为预测标签,将环境因子数据、气象数据作为每个点位置的特征标签;每一个特征标签为一列,将每列特征标签数据进行归一化处理,构建输入特征向量X。具体实施时,收集街道尺度空气污染物浓度数据(包括但不限于可入肺颗粒物(PM1)、细颗粒物(PM2.5)、可吸入颗粒物(PM10)、375nm处紫外线颗粒物(UltravioletParticulateMatter,UVBC)、880nm处颗粒物(IRBC))、气象数据(包括但不限于温度(Temperature)、风速(Windspeed)、风向(Winddirection)和大气压强(Pressure))和环境因子数据(包括但不限于从街景影像提取的建筑物、植被、天空、人、车辆、道路环境因子所占百分比),将数据进行预处理,使数据具有统一的空间尺度。根据预测街道空间范围,由街道起点开始到街道终点为止,每Q米选取一个点,共选取P个点位,选取的P个点的位置数据组成向量集合,每个点位置关联的数据包括空气污染物浓度数据、气象数据和环境因子数据;并将污染物浓度作为预测标签,将环境因子数据、气象数据作为每个点位置的特征标签;每一个特征标签在特征向量中为一列,将每列特征标签数据进行归一化处理;将P个点按一定比例分为训练集、验证集和测试集,其中训练集的位置点为n个,本文档来自技高网
...

【技术保护点】
1.一种基于图注意力机制的空气污染物浓度预测方法,构建基于图注意力机制的空间污染物浓度预测模型,将气象数据、空气监测数据、环境因素数据作为模型输入数据,通过图注意力机制构建图邻接矩阵,利用图卷积神经网络层和多层感知机网络层提取图信息特征,输出预测的空气污染物浓度值;/n所述基于图注意力机制的空气污染物浓度预测方法包括训练阶段和测试阶段;具体包括如下步骤:/n1)利用空气污染物浓度数据、气象数据、环境因子数据和地图数据,构建输入特征向量X;包括如下操作:/n11)对收集的空气污染物浓度数据、气象数据和环境因子数据分别进行数据清洗,对缺失数据进行填充或删除;/n12)以GPS位置信息为基准对数据进行整合,使数据的时空尺度保持一致;将数据按照经纬度映射在地图中,再按照路程长度平均选取点位置;/n13)将所有点位置的数据形成向量集合;点位置关联的数据包括空气污染物浓度数据、气象数据和环境因子数据;将空气污染物浓度作为预测标签,将环境因子数据、气象数据作为每个点位置的特征标签;/n14)每一个特征标签作为特征向量中的一列;将每列特征标签数据进行归一化处理;按比例分为训练集、验证集和测试集;将训练集的n个位置点构建输入特征向量...

【技术特征摘要】
1.一种基于图注意力机制的空气污染物浓度预测方法,构建基于图注意力机制的空间污染物浓度预测模型,将气象数据、空气监测数据、环境因素数据作为模型输入数据,通过图注意力机制构建图邻接矩阵,利用图卷积神经网络层和多层感知机网络层提取图信息特征,输出预测的空气污染物浓度值;
所述基于图注意力机制的空气污染物浓度预测方法包括训练阶段和测试阶段;具体包括如下步骤:
1)利用空气污染物浓度数据、气象数据、环境因子数据和地图数据,构建输入特征向量X;包括如下操作:
11)对收集的空气污染物浓度数据、气象数据和环境因子数据分别进行数据清洗,对缺失数据进行填充或删除;
12)以GPS位置信息为基准对数据进行整合,使数据的时空尺度保持一致;将数据按照经纬度映射在地图中,再按照路程长度平均选取点位置;
13)将所有点位置的数据形成向量集合;点位置关联的数据包括空气污染物浓度数据、气象数据和环境因子数据;将空气污染物浓度作为预测标签,将环境因子数据、气象数据作为每个点位置的特征标签;
14)每一个特征标签作为特征向量中的一列;将每列特征标签数据进行归一化处理;按比例分为训练集、验证集和测试集;将训练集的n个位置点构建输入特征向量X是一个n*d的矩阵,表示一共有n个点,每个点具有d维特征,即构建得到输入特征向量X;
共选取P个点位,选取的P个点的位置数据组成向量集合,每个点位置关联的数据包括空气污染物浓度数据、气象数据和环境因子数据;并将污染物浓度作为预测标签,将环境因子数据、气象数据作为每个点位置的特征标签;每一个特征标签在特征向量中为一列,将每列特征标签数据进行归一化处理;将P个点按一定比例分为训练集、验证集和测试集,其中训练集的位置点为n个,构建输入特征向量X是一个n*d的矩阵,表示一共有n个点,每个点具有d维特征
2)构建基于图注意力机制的空气污染物浓度预测模型:
基于图注意力机制的空气污染物浓度预测模型包括:多层感知机、注意力机制模型、图注意力网络层;其中,多层感知机包括:输入层、中间的多个隐层、输出层;多层感知机的层与层之间是全连接的;注意力机制模型包括编码器、用于进行归一化的softmax层和解码器;图注意力网络层包括输入层与输出层、特征提取与注意力机制、输出特征层和多头注意力机制;构建模型包括如下过程:
21)将输入特征向量X输入到多层感知机的层中进行变换,得到新的特征向量H1;
给定实验样本作为输入层,表示样本X的批量大小为n,输入的个数为d;设置多层感知机有一层隐藏层,隐藏层神经元的个数为h,隐藏层的输出为G1,表示其隐藏层输出是行为n,列为h的矩阵;隐藏层和输出层均是全连接层,有d*h个权重;设置隐藏层的权重参数和偏差参数分别为和隐藏层的输出为G1=XWh+bh;其中,Wh大小为(d,h),即d行h列,每一列对应隐藏层的每一个神经元的连接权重;bh是偏置,为h维向量,1行h列;
设置输出层的权重和偏差参数分别为和输出为H1=f(G1W1+b1),函数f是ELU函数;
22)将H1通过四层的多层感知机,得到新的特征向量H2;
输入层给定实验样本其批量大小为n,输入的个数为q,n行q列;设置多层感知机有两层隐藏层,其中第一层隐藏层单元的个数为h,隐藏层的输出为G2,输入批量大小为n,隐藏层单元为h;输出为n行h列,第一层隐藏层的输出G2即为第二层隐藏层的输入,第二层隐藏层单元个数为m;第二层隐藏层输出为G3,n行m列,同时,第一层隐藏层、第二层隐藏层和输出层均是全连接层,设置第一层隐藏层的权重参数和偏差参数分别为和隐藏层的输出为G2=H1Wh+bh,第二层隐藏层的权重参数和偏差参数分别为和隐藏层的输出为G3=G2Wh+bh;输出层的权重和偏差参数分别为和输出为H2=f(G3W3+b3);
23)通过注意力机制得到所构造的邻接矩阵A;
输入结构化的数据到编码器中;结构化的数据用集合表示为c={c1,c2,...,cM},总共有M个元素,集合中的元素代表输入信息中的空间位置上的输入信息,在t位置上,根据已知的语义表示向量ct、上一时刻预测的zt-1和解码器中的隐状态ht-1,输出为在位置t下,第i个元素上下文分别表示对应的注意力,反映编码器对于输入注意位置和权重与输出注意位置和权重之间的相关性,表示为:




是未归一化的注意力得分;再经过softmax函数,进行归一化,突出重要元素的权重,得到所有权重系数之和为1的概率分布
解码器对集合C中不同的上下文信息表示注意的程度即概率,用注意力分布作为每个输入元素ci受关注程度的权重,对每个输入单词对应的隐状态hi进行加权求和,得到每个元素所对应的语义向量表示gn,即注意力值;
将图像视觉编码后的特征为B*C维的特征图,构造为邻接矩阵A;
将邻接矩阵A和特征向量H1作为参数,输入到图注意力网络层中,通过两层图注意力网络层得到新的特征向量H3;包括步骤24)和25);
24)针对图注意力网络层N个节点,按照输入的特征预测输出的特征;
将邻接矩...

【专利技术属性】
技术研发人员:赵瑞芳张珣江东付晶莹郝蒙蒙马广驰刘宪圣
申请(专利权)人:北京工商大学中国科学院地理科学与资源研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1