一种基于图自监督学习的PM2.5预测方法及存储介质技术

技术编号:30080241 阅读:20 留言:0更新日期:2021-09-18 08:37
本发明专利技术涉及一种基于图自监督学习的PM2.5预测方法及存储介质,其中PM2.5预测方法包括:步骤1:输入区域内多站点的历史环境时空数据进行图构建;步骤2:构建PM2.5预测模型;步骤3:输入时空图序列数据,训练步骤2构建的预测模型;步骤4:计算模型预测的准确率,若准确率超过预设阈值,则执行步骤5,否则,返回步骤3;步骤5:将区域内多站点数据输入训练好的预测模型,获得区域内多站点的PM2.5预测浓度值。与现有技术相比,本发明专利技术具有预测效果好、实用性好等优点。等优点。等优点。

【技术实现步骤摘要】
一种基于图自监督学习的PM2.5预测方法及存储介质


[0001]本专利技术涉及空气质量监测
,尤其是涉及一种基于图自监督学习的PM2.5多站点联合预测方法及存储介质。

技术介绍

[0002]随着我国社会的不断发展和城市规模的不断扩大,近年来,城市的空气污染问题不断受到社会的关注。空气污染会产生许多问题,如引起人体呼吸道和心肺系统疾病,影响社会生产效率等。特别是PM2.5这类微小颗粒,一旦形成具有面积大,难以消解等特点更需要被重点关注。为了改善空气污染引起的社会问题,及时准确的了解PM2.5传播扩散趋势,建立准确的PM2.5浓度预测模型,能够帮助我们提前了解污染物浓度变化趋势,帮助管理部门提前做出决策。当前,空气污染物浓度预测涉及到多个部门,多种时空数据和多个区域,准确的预测往往面对海量的数据和复杂的非线性传播依赖关系。
[0003]国内外许多研究人员都提出了众多预测方法和技术,但大部分使用的仍然是传统的机器学习方法,只能提取浅层特征。此外,现有的大部分研究方法都没有考虑到污染物数据采集自监测站点这类非欧几里得空间。对于利用非欧几里得空间下的空间关联性研究较少,尽管现有技术中存在对PM2.5的预测方法,但是预测准确率和精度都较低。

技术实现思路

[0004]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种预测效果好、实用性好的基于图自监督学习的PM2.5预测方法及存储介质。
[0005]本专利技术的目的可以通过以下技术方案来实现:
[0006]一种基于图自监督学习的PM2.5预测方法,所述的PM2.5预测方法包括:
[0007]步骤1:进行图构建;
[0008]步骤2:构建PM2.5预测模型;
[0009]步骤3:训练步骤2构建的预测模型;
[0010]步骤4:计算模型预测的准确率,若准确率超过预设阈值,则执行步骤5,否则,返回步骤3;
[0011]步骤5:将多站点数据输入训练好的预测模型,获得所有站点的PM2.5预测浓度值。
[0012]优选地,所述的步骤1具体为:
[0013]采集区域内多个站点的空气污染物和环境时空监测数据,对数据进行预处理后,将区域内的站点视为图中的节点,站点中采集到的环境时空数据作为节点特征向量,两个节点间距离小于预设阈值L,则视为两个节点间存在连边。
[0014]更加优选地,所述的环境时空监测数据包括污染物浓度值、气象监测值和时空条件值。
[0015]优选地,所述的步骤2具体为:
[0016]基于深度学习原理构建图自编码网络ST

GAE和长短期记忆网络LSTM建立时空联
合预测模型,图自编码网络ST

GAE用于提取空间依赖关系,长短期记忆网络LSTM用于提取时间依赖关系,图自编码网络ST

GAE和长短期记忆网络LSTM相连。
[0017]更加优选地,所述的图自编码网络ST

GAE使用Encoder

Decoder架构,ST

GAE的Encoder部分使用GCN来融合多阶邻居信息得到新的特征矩阵,可以用以下公式对Encoder部分进行表示:
[0018]Z=GCN(X,A)
[0019]其中,为节点的特征矩阵;为图的邻接矩阵;为融合了邻居信息的图表示;
[0020]GCN的计算方法为:
[0021][0022]其中,W0和W1为待学习的参数;D为图的度矩阵。
[0023]更加优选地,所述的所述的图自编码网络ST

GAE采用前馈神经网络作为Decoder来重构原始的图结构,具体方法为:
[0024][0025]其中,为重构后的邻接矩阵;g为sigmod激活函数;W
d
和b
d
为待学习的参数。
[0026]更加优选地,所述的步骤3具体为:
[0027]首先对ST

GAE部分进行自监督训练,训练过程中使用损失函数进行训练;
[0028]得到预训练模型后,将重构的特征矩阵输入到LSTM网络中,提取时序依赖关系,使用损失函数MSE进行训练,并对模型进行微调,完成模型的训练。
[0029]更加优选地,所述的损失函数为交叉熵,具体为:
[0030][0031]其中,y表示邻接矩阵A中的某个元素值,为0或1;表示重构后的邻接矩阵中对应元素的值,为0或1;N为节点的数量。
[0032]更加优选地,所述的损失函数MSE为均方误差,具体为:
[0033][0034]其中,y
i
表示PM2.5浓度的实际值;表示模型PM2.5浓度的预测值。
[0035]一种存储介质,所述的存储介质内存储有上述任一项所述的PM2.5预测方法。
[0036]与现有技术相比,本专利技术具有以下有益效果:
[0037]一、预测效果好:本专利技术中的PM2.5预测方法是建立在环境时空大数据和深度学习理论基础之上的,利用已经积累的大量空气和气象监测数据,使用图这种拓扑结构对这类非结构化数据进行组织,构成时空图序列数据;然后,使用本专利技术提出的新型的基于图自监督学习的深度学习模型,对PM2.5传播过程中的复杂非线性时空依赖进行深度提取,最终输出区域内多个站点的预测值,比传统方法取得更加优异的预测效果,因而具有实际的应用价值。
[0038]二、实用性好:本专利技术中的PM2.5预测方法可以直接对当前区域内所有站点的PM2.5进行预测,无需分别对各个站点进行数据处理,数据处理速度快,范围广,实用性好。
附图说明
[0039]图1为本专利技术中PM2.5预测方法的流程图。
[0040]图2为本专利技术实施例中所构建的时空图序列数据示意图。
[0041]图3为本专利技术实施例中基于图自监督学习的PM2.5浓度多站点联合预测模型结构图。
具体实施方式
[0042]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本专利技术保护的范围。
[0043]图神经网络以其强大的非欧式数据处理能力受到研究人员的关注,本专利技术利用图神经网络对非欧数据强大的学习能力,结合自编码器和自监督学习的思想,建立了多站点预测模型。该模型能够从空间和时间两个方面考虑污染物传播的非线性依赖关系,同时输出多个站点的预测值,下面提供一种具体实施方式:
[0044]一种基于图自监督学习的PM2.5预测方法,其流程如图1所示,包括:
[0045]步骤1:进行图构建;
[0046]采集区域内多个站点的空气污染物和环境时空监测数据,对数据进行预处理后,将区域内的站点视为图中的节点,站点中采集到的环境时空数据作为节本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图自监督学习的PM2.5预测方法,其特征在于,所述的PM2.5预测方法包括:步骤1:进行图构建;步骤2:构建PM2.5预测模型;步骤3:训练步骤2构建的预测模型;步骤4:计算模型预测的准确率,若准确率超过预设阈值,则执行步骤5,否则,返回步骤3;步骤5:将多站点数据输入训练好的预测模型,获得所有站点的PM2.5预测浓度值。2.根据权利要求1所述的一种基于图自监督学习的PM2.5预测方法,其特征在于,所述的步骤1具体为:采集区域内多个站点的空气污染物和环境时空监测数据,对数据进行预处理后,将区域内的站点视为图中的节点,站点中采集到的环境时空数据作为节点特征向量,两个节点间距离小于预设阈值L,则视为两个节点间存在连边。3.根据权利要求2所述的一种基于图自监督学习的PM2.5预测方法,其特征在于,所述的环境时空监测数据包括污染物浓度值、气象监测值和时空条件值。4.根据权利要求1所述的一种基于图自监督学习的PM2.5预测方法,其特征在于,所述的步骤2具体为:基于深度学习原理构建图自编码网络ST

GAE和长短期记忆网络LSTM建立时空联合预测模型,图自编码网络ST

GAE用于提取空间依赖关系,长短期记忆网络LSTM用于提取时间依赖关系,图自编码网络ST

GAE和长短期记忆网络LSTM相连。5.根据权利要求4所述的一种基于图自监督学习的PM2.5预测方法,其特征在于,所述的图自编码网络ST

GAE使用Encoder

Decoder架构,ST

GAE的Encoder部分使用GCN来融...

【专利技术属性】
技术研发人员:张波吴泽权
申请(专利权)人:上海师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1