本发明专利技术涉及一种基于城市区域网格自适应的PM2.5浓度推测方法。本发明专利技术首先将城市区域网格化,利用出租车采集原始PM2.5浓度数据,再制定标准,将网格分辨率标准化,利用提取到的网格特征离线训练网格分辨率细化等级和网格特征间的对应关系,实时推测城市浓度时,首先利用提取到的实时网格特征和训练模型,计算出网格所要调整的分辨率,重新划分网格,最后利用线性回归模型推测出每个网格的PM2.5浓度数据,得到城市区域PM2.5浓度数据分布图。本发明专利技术方法系统可扩展性强,精确度高,计算量小,为居民出行活动提供参考,并帮助管理部门寻找污染源,改善城市环境质量。
【技术实现步骤摘要】
本专利技术涉及传感器网络技术、计算机应用技术和数据挖掘技术,是一种基于城市区域网格自适应的PM2.5浓度推测方法。
技术介绍
PM2.5被认为是对公众健康和环境造成最大影响的污染物,特别是像北京这样的发展中国家大城市更是深受PM2.5的危害。由于复杂的城市结构和多样的城市功能区,传统的监测站监测PM2.5的方法根本无法告诉城市居民实时准确的PM2.5浓度。近年来,许多学者试图提供更加细粒度的城市污染物浓度分布,他们将PM2.5采集装置安装在公交车或者出租车顶,让交通工具实时自主的采集城市PM2.5数据,结合机器学习,数据挖掘等技术推测出交通工具未覆盖区域的PM2.5浓度,最后给出城市区域细粒度,固定分辨率的PM2.5浓度分布图。这种方法能提供精确的城市PM2.5浓度分布,但是其将城市区域划分成100m*100m或者200m*200m的过小的固定分辨率网格增加了算法计算量,降低了系统扩展性,不利于推广到大范围PM2.5浓度监测。总的来说,城市区域网格自适应调整下推测城市PM2.5浓度十分重要,过大的网格导致无法接受的推测误差,而过小的网格导致过多的计算量。
技术实现思路
本专利技术针对现有城市网格划分不足和传统监测PM2.5浓度的缺点,结合传感器网络,数据挖掘等技术,提出了一种基于城市区域网格自适应的PM2.5浓度推测方法。本专利技术主要由以下几个步骤构成:1、城市区域网格化,并采集城市PM2.5原始数据2、网格分辨率标准化3、网格特征提取4、离线训练5、重新划分网格6、在线推测。本专利技术方法的具体步骤是:步骤(1)、城市区域网格化,并采集城市PM2.5原始数据。具体是将城市区域划分成500m*500m大小的初始分辨率网格,车顶安装PM2.5采集设备的出租车随机行驶于城市道路,采集城市区域PM2.5浓度数据。步骤(2)、网格分辨率标准化。本专利技术方法定义了4种不同分辨率的网格,分别为1000m*1000m,500m*500m,250m*250m,125m*125m,并定义了4种相应的网格分辨率细化等级,分别为-1,0,1,2。根据PM2.5国家标准和PM2.5浓度变化对人体健康的影响,本专利技术方法制定了网格分辨率细化等级计算方法如下式所示:MDV=(|xij-xi-1j|+|xij-xi+1j|+|xij-xij-1|+|xij-xij-1|)/4其中xij表示城市区域网格中第i行,第j列的网格PM2.5浓度,MDV表示中心网格PM2.5浓度和其四周网格PM2.5浓度的平均差值,L表示网格分辨率细化等级。以下对该公式做进一步说明:等级-1:当一个网格和其周围网格的PM2.5浓度都小于75ug/m3(空气质量等级为“良”)时,合并这4个相邻的网格为1000m*1000m分辨率网格。等级1:当一个网格的PM2.5浓度大于115ug/m3(空气质量等级为“中度污染”),并且该网格的PM2.5浓度与四周网格的PM2.5浓度平均差值在5ug/m3和10ug/m3之间时,将该网格划分成4个相同的,分辨率为250m*250m的网格。等级2:当一个网格的PM2.5浓度大于115ug/m3(空气质量等级为“中度污染”),并且该网格的PM2.5浓度与四周网格的PM2.5浓度平均差值大于10ug/m3时,将该网格划分成16个相同的,分辨率为125m*125m的网格。等级0:其他网格保持其初始500m*500m分辨率。步骤(3)、网格特征提取。PM2.5浓度受温度,湿度,风力,交通状况等特征因素影响,据此本专利技术方法定义了6种网格特征:温度特征(Ft):该特征表示初始分辨率下各个网格区域的气温大小。湿度特征(Fh):该特征表示初始分辨率下各个网格区域的湿度大小。天气特征(Fw):该特征表示初始分辨率下各个网格区域的天气情况,它分为晴,阴,小雨,大雨,雪。风力特征(Fw_p):该特征表示初始分辨率下各个网格区域的风力大小。交通状况特征(Ftr):该特征表示初始分辨率下各个网格区域的交通状况,它分为畅通,缓行,拥挤,严重拥挤。位置特征(Fl):该特征表示初始分辨率下各个网格区域的地理位置。步骤(4)、离线训练。本专利技术方法利用人工神经网络(ArtificialNeutralNetwork,ANN)模型训练网格分辨率细化等级与网格特征之间的对应关系,得到网格分辨率细化模型。步骤(5)、重新划分网格。依据步骤(4)训练获得的网格分辨率细化模型和步骤(3)实时提取的网格特征,推测各个初始分辨率的网格需要细化的等级,自适应调整网格大小,重新划分整个城市区域的网格。步骤(6)、在线推测。根据步骤(1)实时采集的PM2.5浓度原始数据,利用线性回归模型(LinearRegression,LR)在自适应分辨率网格下推测无原始数据网格的PM2.5浓度。具体为:首先计算得到回归系数a,b,如下式所示;b=Σi=1n(Xi-X‾)(yi-y‾)Σi=1n(Xi-X‾)a=y‾-bX‾]]>其中Xi为网格i的温度,湿度,风力,天气,交通状况,位置特征集,为所有网格的特征平均值,yi为网格i的PM2.5浓度值,为所有网格的PM2.5浓度平均值,n为城市区域网格个数。然后建立城市任意网格PM2.5浓度值与网格特征之间的线性回归模型;Y=a*X+b其中Y为任意网格的PM2.5浓度值,x为对应网格的网格特征集;最后,利用此回归模型实时推测城市区域PM2.5浓度分布。本专利技术的有益效果是:(1)、本专利技术方法系统可扩展性强,可以通过调整初始分辨率被运用到大范围的城市空气质量监测;(2)、本专利技术方法自适应调整网格大小,确保了推测精度前提下,大大降低了计算复杂度;(3)、本专利技术方法细粒度城市区域PM2.5浓度推测方法可以告知城市居民实时确切的空气质量情况,为居民出行活动提供参考,并帮助管理部门寻找污染源,改善城市环境质量。附图说明图1示出本专利技术方法的流程图;图2示出城市区域PM2.5原始数据采集场景图;图3示出本专利技术方法离线训练图;图4示出本专利技术方法重新划分网格过程图;图5示出网格自适应分辨率下,城市区域PM2.5网格浓度推测结果图。具体实施方式以下结合附图对本专利技术作进一步说明。如图1所示,一种基于城市区域网格自适应的本文档来自技高网...
【技术保护点】
一种基于城市区域网格自适应的PM2.5浓度推测方法,其特征在于该方法的具体步骤是:步骤(1)、城市区域网格化,并采集城市PM2.5原始数据;具体是将城市区域划分成500m*500m大小的初始分辨率网格,车顶安装PM2.5采集设备的出租车随机行驶于城市道路,采集城市区域PM2.5浓度数据;步骤(2)、网格分辨率标准化;定义四种不同分辨率的网格,分别为1000m*1000m,500m*500m,250m*250m,125m*125m,并定义四种相应的网格分辨率细化等级,分别为‑1,0,1,2;制定网格分辨率细化等级计算,如下式所示:MDV=(|xij‑xi‑1j|+|xij‑xi+1j|+|xij‑xij‑1|+|xij‑xij‑1|)/4其中xij表示城市区域网格中第i行,第j列的网格PM2.5浓度,MDV表示中心网格PM2.5浓度和其四周网格PM2.5浓度的平均差值,L表示网格分辨率细化等级,其中:等级‑1:当一个网格和其周围网格的PM2.5浓度都小于75ug/m3时,合并这四个相邻的网格为1000m*1000m分辨率网格;等级1:当一个网格的PM2.5浓度大于115ug/m3,并且该网格的PM2.5浓度与四周网格的PM2.5浓度平均差值在5ug/m3和10ug/m3之间时,将该网格划分成四个相同的,分辨率为250m*250m的网格;等级2:当一个网格的PM2.5浓度大于115ug/m3,并且该网格的PM2.5浓度与四周网格的PM2.5浓度平均差值大于10ug/m3时,将该网格划分成十六个相同的,分辨率为125m*125m的网格;等级0:其他网格保持其初始500m*500m分辨率;步骤(3)、网格特征提取;定义六种网格特征:温度特征Ft:该特征表示初始分辨率下各个网格区域的气温大小;湿度特征Fh:该特征表示初始分辨率下各个网格区域的湿度大小;天气特征Fw:该特征表示初始分辨率下各个网格区域的天气情况,它分为晴,阴,小雨,大雨,雪;风力特征Fw_p:该特征表示初始分辨率下各个网格区域的风力大小;交通状况特征Ftr:该特征表示初始分辨率下各个网格区域的交通状况,它分为畅通,缓行,拥挤,严重拥挤;位置特征Fl:该特征表示初始分辨率下各个网格区域的地理位置;步骤(4)、离线训练;利用人工神经网络模型训练网格分辨率细化等级与网格特征之间的对应关系,得到网格分辨率细化模型;步骤(5)、重新划分网格;依据步骤(4)训练获得的网格分辨率细化模型和步骤(3)实时提取的网格特征,推测各个初始分辨率的网格需要细化的等级,自适应调整网格大小,重新划分整个城市区域的网格;步骤(6)、在线推测;根据步骤(1)实时采集的PM2.5浓度原始数据,利用线性回归模型,在自适应分辨率网格下推测无原始数据网格的PM2.5浓度;具体为:首先计算得到回归系数a,b,如下式所示;b=Σi=1n(Xi-X‾)(yi-y‾)Σi=1n(Xi-X‾)a=y‾-bX‾]]>其中Xi为网格i的温度,湿度,风力,天气,交通状况,位置特征集,为所有网格的特征平均值,yi为网格i的PM2.5浓度值,为所有网格的PM2.5浓度平均值,n为城市区域网格个数;然后建立城市任意网格PM2.5浓度值与网格特征之间的线性回归模型;Y=a*X+b其中Y为任意网格的PM2.5浓度值,x为对应网格的网格特征集;最后,利用此回归模型实时推测城市区域PM2.5浓度分布。...
【技术特征摘要】
1.一种基于城市区域网格自适应的PM2.5浓度推测方法,其特征在于该方法
的具体步骤是:
步骤(1)、城市区域网格化,并采集城市PM2.5原始数据;
具体是将城市区域划分成500m*500m大小的初始分辨率网格,车顶安装
PM2.5采集设备的出租车随机行驶于城市道路,采集城市区域PM2.5浓度数据;
步骤(2)、网格分辨率标准化;
定义四种不同分辨率的网格,分别为1000m*1000m,500m*500m,
250m*250m,125m*125m,并定义四种相应的网格分辨率细化等级,分别为-1,
0,1,2;制定网格分辨率细化等级计算,如下式所示:
MDV=(|xij-xi-1j|+|xij-xi+1j|+|xij-xij-1|+|xij-xij-1|)/4
其中xij表示城市区域网格中第i行,第j列的网格PM2.5浓度,MDV表示中
心网格PM2.5浓度和其四周网格PM2.5浓度的平均差值,L表示网格分辨率细化等
级,其中:
等级-1:当一个网格和其周围网格的PM2.5浓度都小于75ug/m3时,合并这四
个相邻的网格为1000m*1000m分辨率网格;
等级1:当一个网格的PM2.5浓度大于115ug/m3,并且该网格的PM2.5浓度与
四周网格的PM2.5浓度平均差值在5ug/m3和10ug/m3之间时,将该网格划分成四
个相同的,分辨率为250m*250m的网格;
等级2:当一个网格的PM2.5浓度大于115ug/m3,并且该网格的PM2.5浓度与
四周网格的PM2.5浓度平均差值大于10ug/m3时,将该网格划分成十六个相同的,
\t分辨率为125m*125m的网格;
等级0:其他网格保持其初始500m*500m分辨率;
步骤(3)、网格特征提取;
定义六种网格特征:
温度特征Ft:该特征表...
【专利技术属性】
技术研发人员:戴国骏,郭鸿杰,张桦,吴以凡,仇建,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。