一种融合分区建模思想的GA-LSTM模型预测PM制造技术

技术编号:37411662 阅读:9 留言:0更新日期:2023-04-30 09:36
本发明专利技术涉及一种融合分区建模思想的GA

【技术实现步骤摘要】
一种融合分区建模思想的GA

LSTM模型预测PM
2.5
浓度方法


[0001]本专利技术属于大气污染领域,涉及一种融合分区建模思想的GA

LSTM模型预测PM
2.5
浓度方法。

技术介绍

[0002]长短期记忆网络(Long Short

Time Memory,LSTM)是一种时间循环神经网络,是为了解决一般循环神经网络(Recurrent Neural Network,RNN)存在的长时间依赖问题而设计出来的。LSTM模型相对于RNN模型的主要区别在于LSTM模型引入门的概念,通过门单元来判断信息是否有效,从而解决RNN的梯度消失或梯度爆炸的缺陷。当前有许多方法,例如利用传统的统计模型、基于深度学习的神经网络模型等。由于PM
2.5
浓度的变化具有突变性和非线性的特点,预测PM
2.5
浓度的传统的统计模型精度较差;基于深度学习的神经网络模型对PM
2.5
浓度的预测有较好的模拟精度,但模型初始参数等的设置对预测的精度会产生较大的影响,同时当前PM
2.5
浓度模型的构建往往缺乏对区域的空间异质性及经济因素的深入思考。
[0003]因此,亟需构建一种新的神经网络模型来预测PM
2.5
浓度。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种融合分区建模思想的GA

LSTM模型预测PM
2.5
浓度方法,构建经济空间特征因素融合分区建模思想并使用主成分分析(Principal Component Analysis,PCA)将多维驱动数据进行降维处理,再结合遗传算法(Genetic Algorithm,GA)优化LSTM参数来提升预测PM
2.5
浓度的精度。
[0005]为达到上述目的,本专利技术提供如下技术方案:
[0006]一种融合分区建模思想的GA

LSTM模型预测PM
2.5
浓度方法,具体包括以下步骤:
[0007]S1:构建经济空间特征因素;
[0008]S2:将驱动因素进行分区,并采用PCA将多维驱动数据进行降维处理;
[0009]S3:采用遗传算法GA对LSTM的参数进行优化,得到最优的LSTM模型的层数和全连接层数以及每层的神经元个数;其中,GA表示遗传算法;
[0010]S4:利用优化后LSTM模型来预测各个分区的PM
2.5
浓度结果。
[0011]进一步,步骤S1中,构建经济空间特征因素具体包括以下步骤:
[0012]S11:经济主要用人口密度、夜晚灯光强度和GDP来表达,将k个有效监测站点PM
2.5
浓度取出,构建PM
2.5
浓度数据集X(t)=(X1(t),X2(t),

,X
k
(t));
[0013]S12:将对应PM
2.5
监测站点的人口密度、夜晚灯光强度和GDP数据取出,通过经济距离来构建经济空间权重矩阵W
S
×
S
,S=k;
[0014]S13:将构建好的经济空间权重矩阵W
S
×
S
与监测站点的PM
2.5
浓度点数据集X(t)做乘法,最终得到各个监测站点的经济空间特征因素X
Si(t)

[0015][0016]其中,i=1,2,

,k,将得到的经济空间特征因素加入到对应监测站点的数据集中,作为站点的经济空间特征因素。
[0017]进一步,步骤S2具体包括以下步骤:
[0018]S21:根据PM
2.5
监测站点,通过数据处理,提取出对应监测站点的污染物数据和气象数据结合经济空间特征因素(统称驱动数据)构建统一的初始数据集;
[0019]S22:将经济空间特征按照行政区域分区,同时将其他驱动数据采用K

means分区,然后叠加两种得到综合分区结果;在不影响模拟精度的同时提升模型运行的速率,将通过主成分分析(PCA)将多维驱动数据进行降维处理,简化驱动数据,形成新的数据集;
[0020]S23:然后在各个子区域中将数据集进行归一化处理并拆分为训练集和测试集用于GA

LSTM模型训练和预测。
[0021]进一步,步骤S3中,使用GA对LSTM模型的层数和全连接层数以及每层的神经元个数进行全局搜索,使其得到LSTM参数的最优解;其中GA的流程如下:
[0022]S31:编码和产生初始群体;
[0023]根据优化函数的实际问题,选择好相应的编码方法,根据种群规模的需要,随机产生确定长度的n个染色体,作为初始种群;
[0024]pop
i
(t),i=1,2,

,n
[0025]S32:计算适应度值;
[0026]假设适应度函数为f(i),则所有个体的适应度值为:
[0027]f(i)=f(pop
i
(t))
[0028]S33:终止条件;
[0029]根据设定的终止条件是否达到收敛,来判断下一步的执行;
[0030]S34:选择运算;
[0031]选择适应度值大的个体进行交叉运算,则每个个体的选择概率为P
i

[0032][0033]以选择概率P
i
作为新的概率分布,从当前种群中选择个体重组新的个体种群newpop(t+1):
[0034]newpop(t+1)={pop
j
(t)|j=1,2,

,n}
[0035]S35:交叉运算;
[0036]随机从种群中选择两个不同的个体,以概率P
c
进行交换基因得到新的两个个体,
进行n/2次1,得到一个新的种群crosspop(t+1);
[0037]S36:变异运算;
[0038]从种群中随机选择个体,以变异概率P
m
进行染色体变异,得到新的种群mutpop(t+1),这个种群作为完成一次遗传操作的子种群,即pop(t)=mutpop(t+1),此时传到步骤S32。
[0039]通过遗传算法GA得到最优的LSTM模型的层数和全连接层数以及每层的神经元个数,来输出各个分区的PM
2.5
浓度结果。
[0040]本专利技术的有益效果在于:本专利技术首先在考虑到经济对PM
2.5
浓度的影响,引入经济空间特征因素,再考虑多个监测站点的空间异质性而采用分区模拟,同时结合PCA将多维驱动数据进行降维,提升模型效率,最后结合GA将LSTM的参数进行优化,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合分区建模思想的GA

LSTM模型预测PM
2.5
浓度方法,其特征在于,该方法具体包括以下步骤:S1:构建经济空间特征因素;S2:将驱动因素进行分区,并采用PCA将多维驱动数据进行降维处理;S3:采用遗传算法GA对LSTM的参数进行优化,得到最优的LSTM模型的层数和全连接层数以及每层的神经元个数;其中,GA表示遗传算法;S4:利用优化后LSTM模型来预测各个分区的PM
2.5
浓度结果。2.根据权利要求1所述的融合分区建模思想的GA

LSTM模型预测PM
2.5
浓度方法,其特征在于,步骤S1中,构建经济空间特征因素具体包括以下步骤:S11:经济用人口密度、夜晚灯光强度和GDP来表达,将k个有效监测站点PM
2.5
浓度取出,构建PM
2.5
浓度数据集X(t)=(X1(t),X2(t),

,X
k
(t));S12:将对应PM
2.5
监测站点的人口密度、夜晚灯光强度和GDP数据取出,通过经济距离来构建经济空间权重矩阵W
S
×
S
,S=k;S13:将构建好的经济空间权重矩阵W
S
×
S
与监测站点的PM
2.5
浓度点数据集X(t)做乘法,最终得到各个监测站点的经济空间特征因素最终得到各个监测站点的经济空间特征因素其中,i=1,2,

,k,将得到的经济空间特征因素加入到对应监测站点的数据集中,作为站点的经济空间特征因素。3.根据权利要求1所述的融合分区建模思想的GA

LSTM模型预测PM
2.5
浓度方法,其特征在于,步骤S2具体包括以下步骤:S21:根据PM
2.5
监测站点,通过数据处理,提取出对应监测站点的驱动数据构建统一的初始数据集;S22:将经济空间特征按照行政区域分区,同时将其他驱动数据采用K

【专利技术属性】
技术研发人员:刘明皓罗小林
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1