【技术实现步骤摘要】
一种基于图注意力机制的空气污染物浓度预测方法
本专利技术属于图卷积神经网络技术和空气质量监控
,涉及一种预测点位置处空气污染物浓度预测技术,尤其涉及一种基于图注意力机制的空气污染物浓度预测方法。
技术介绍
空气质量一直是研究环境污染变化的一个重要组分,空气质量的变化是由空气污染物浓度决定的,研究空气污染物浓度能够更好的掌握空气质量的变化。大多数对空气污染物浓度预测是收集多种相关影响因素数据,进行污染物的相关性分析,空气污染物在空气中的浓度与污染物的排放量、污染源的布局、类型和气象条件等各种变量因素有关,将收集到的影响因素数据作为自变量,空气污染物浓度数据作为因变量进行相关性分析,但是由于周围环境的复杂性以及自变量之间的相互影响,使得自变量因素与因变量空气污染物浓度之间的相关性具有不确定性。对此,后续的污染物浓度预测研究中多使用机器学习算法来解决复杂的多元非线性问题。预测算法的实质是通过对一系列动态数据分析其特征之间的关联性、变化状况而构建出对未来进行预测的算法。其中,空气质量预测通常是利用历史污染物浓度数据,通过分析动态数据间的关联来找到空气污染过程的规律性,进而对未来空气质量状况做出预测。目前常用的空气污染物预测算法主要利用机器学习方法和深度学习方法来进行构建。机器学习方法在预测过程中具有坚实的数学基础,为建立合理的空气质量预测模型提供了理论依据,而深度学习方法可以通过不断地训练找出数据间的非线性关系。在针对空气污染物浓度预测的研究中,CobournWG等人针对PM2.5浓度预测开发了一种非线 ...
【技术保护点】
1.一种基于图注意力机制的空气污染物浓度预测方法,构建基于图注意力机制的空间污染物浓度预测模型,将气象数据、空气监测数据、环境因素数据作为模型输入数据,通过图注意力机制构建图邻接矩阵,利用图卷积神经网络层和多层感知机网络层提取图信息特征,输出预测的空气污染物浓度值;/n所述基于图注意力机制的空气污染物浓度预测方法包括训练阶段和测试阶段;具体包括如下步骤:/n1)利用空气污染物浓度数据、气象数据、环境因子数据和地图数据,构建输入特征向量X;包括如下操作:/n11)对收集的空气污染物浓度数据、气象数据和环境因子数据分别进行数据清洗,对缺失数据进行填充或删除;/n12)以GPS位置信息为基准对数据进行整合,使数据的时空尺度保持一致;将数据按照经纬度映射在地图中,再按照路程长度平均选取点位置;/n13)将所有点位置的数据形成向量集合;点位置关联的数据包括空气污染物浓度数据、气象数据和环境因子数据;将空气污染物浓度作为预测标签,将环境因子数据、气象数据作为每个点位置的特征标签;/n14)每一个特征标签作为特征向量中的一列;将每列特征标签数据进行归一化处理;按比例分为训练集、验证集和测试集;将训练 ...
【技术特征摘要】
1.一种基于图注意力机制的空气污染物浓度预测方法,构建基于图注意力机制的空间污染物浓度预测模型,将气象数据、空气监测数据、环境因素数据作为模型输入数据,通过图注意力机制构建图邻接矩阵,利用图卷积神经网络层和多层感知机网络层提取图信息特征,输出预测的空气污染物浓度值;
所述基于图注意力机制的空气污染物浓度预测方法包括训练阶段和测试阶段;具体包括如下步骤:
1)利用空气污染物浓度数据、气象数据、环境因子数据和地图数据,构建输入特征向量X;包括如下操作:
11)对收集的空气污染物浓度数据、气象数据和环境因子数据分别进行数据清洗,对缺失数据进行填充或删除;
12)以GPS位置信息为基准对数据进行整合,使数据的时空尺度保持一致;将数据按照经纬度映射在地图中,再按照路程长度平均选取点位置;
13)将所有点位置的数据形成向量集合;点位置关联的数据包括空气污染物浓度数据、气象数据和环境因子数据;将空气污染物浓度作为预测标签,将环境因子数据、气象数据作为每个点位置的特征标签;
14)每一个特征标签作为特征向量中的一列;将每列特征标签数据进行归一化处理;按比例分为训练集、验证集和测试集;将训练集的n个位置点构建输入特征向量X是一个n*d的矩阵,表示一共有n个点,每个点具有d维特征,即构建得到输入特征向量X;
共选取P个点位,选取的P个点的位置数据组成向量集合,每个点位置关联的数据包括空气污染物浓度数据、气象数据和环境因子数据;并将污染物浓度作为预测标签,将环境因子数据、气象数据作为每个点位置的特征标签;每一个特征标签在特征向量中为一列,将每列特征标签数据进行归一化处理;将P个点按一定比例分为训练集、验证集和测试集,其中训练集的位置点为n个,构建输入特征向量X是一个n*d的矩阵,表示一共有n个点,每个点具有d维特征
2)构建基于图注意力机制的空气污染物浓度预测模型:
基于图注意力机制的空气污染物浓度预测模型包括:多层感知机、注意力机制模型、图注意力网络层;其中,多层感知机包括:输入层、中间的多个隐层、输出层;多层感知机的层与层之间是全连接的;注意力机制模型包括编码器、用于进行归一化的softmax层和解码器;图注意力网络层包括输入层与输出层、特征提取与注意力机制、输出特征层和多头注意力机制;构建模型包括如下过程:
21)将输入特征向量X输入到多层感知机的层中进行变换,得到新的特征向量H1;
给定实验样本作为输入层,表示样本X的批量大小为n,输入的个数为d;设置多层感知机有一层隐藏层,隐藏层神经元的个数为h,隐藏层的输出为G1,表示其隐藏层输出是行为n,列为h的矩阵;隐藏层和输出层均是全连接层,有d*h个权重;设置隐藏层的权重参数和偏差参数分别为和隐藏层的输出为G1=XWh+bh;其中,Wh大小为(d,h),即d行h列,每一列对应隐藏层的每一个神经元的连接权重;bh是偏置,为h维向量,1行h列;
设置输出层的权重和偏差参数分别为和输出为H1=f(G1W1+b1),函数f是ELU函数;
22)将H1通过四层的多层感知机,得到新的特征向量H2;
输入层给定实验样本其批量大小为n,输入的个数为q,n行q列;设置多层感知机有两层隐藏层,其中第一层隐藏层单元的个数为h,隐藏层的输出为G2,输入批量大小为n,隐藏层单元为h;输出为n行h列,第一层隐藏层的输出G2即为第二层隐藏层的输入,第二层隐藏层单元个数为m;第二层隐藏层输出为G3,n行m列,同时,第一层隐藏层、第二层隐藏层和输出层均是全连接层,设置第一层隐藏层的权重参数和偏差参数分别为和隐藏层的输出为G2=H1Wh+bh,第二层隐藏层的权重参数和偏差参数分别为和隐藏层的输出为G3=G2Wh+bh;输出层的权重和偏差参数分别为和输出为H2=f(G3W3+b3);
23)通过注意力机制得到所构造的邻接矩阵A;
输入结构化的数据到编码器中;结构化的数据用集合表示为c={c1,c2,...,cM},总共有M个元素,集合中的元素代表输入信息中的空间位置上的输入信息,在t位置上,根据已知的语义表示向量ct、上一时刻预测的zt-1和解码器中的隐状态ht-1,输出为在位置t下,第i个元素上下文分别表示对应的注意力,反映编码器对于输入注意位置和权重与输出注意位置和权重之间的相关性,表示为:
是未归一化的注意力得分;再经过softmax函数,进行归一化,突出重要元素的权重,得到所有权重系数之和为1的概率分布
解码器对集合C中不同的上下文信息表示注意的程度即概率,用注意力分布作为每个输入元素ci受关注程度的权重,对每个输入单词对应的隐状态hi进行加权求和,得到每个元素所对应的语义向量表示gn,即注意力值;
将图像视觉编码后的特征为B*C维的特征图,构造为邻接矩阵A;
将邻接矩阵A和特征向量H1作为参数,输入到图注意力网络层中,通过两层图注意力网络层得到新的特征向量H3;包括步骤24)和25);
24)针对图注意力网络层N个节点,按照输入的特征预测输出的特征;
将邻接矩...
【专利技术属性】
技术研发人员:赵瑞芳,张珣,江东,付晶莹,郝蒙蒙,马广驰,刘宪圣,
申请(专利权)人:北京工商大学,中国科学院地理科学与资源研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。