一种可选的PM2.5浓度估算方法技术

技术编号:27534443 阅读:12 留言:0更新日期:2021-03-03 11:18
本发明专利技术公开了一种可选的PM2.5浓度估算方法,包括如下步骤:步骤1,通过离散变异函数公式计算所有站点PM2.5浓度样本点对的实验变异函数值;步骤2,采用最小二乘支持向量机拟合实验变异函数值,得到理论变异函数模型;步骤3,建立克里金空间插值方程组,根据理论变异函数模型求解克里金权重系数;步骤4,根据克里金权重系数计算待估位置点处的PM2.5浓度估计值。本发明专利技术所公开一种可选的PM2.5浓度估算方法,克服了普通克里金空间插值PM2.5浓度估算方法中传统理论变异函数模型形状固定且未考虑空间变化趋势的问题,以最小二乘支持向量机拟合实验变异函数值,使得PM2.5浓度估算的结果符合本身的空间变化趋势。果符合本身的空间变化趋势。果符合本身的空间变化趋势。

【技术实现步骤摘要】
一种可选的PM2.5浓度估算方法


[0001]本专利技术属于大气环境质量监测领域,特别涉及该领域中的一种可选的PM2.5浓度估算方法。

技术介绍

[0002]细颗粒物PM2.5是指在空气动力学中直径小于或等于2.5μm的颗粒物,这种颗粒物能够长时间悬浮在空气中,被人体吸附进入支气管和肺泡中,直接影响肺的换气通气等功能,甚至也可以通过毛细血管进入人体血液循环系统,对心脏及心血管造成严重危害,近年来越发引发民众对大气环境质量问题的担忧。因此,如何准确地估算特定范围内的PM2.5浓度空间分布特征,实现PM2.5浓度的监测和预警,一直是相关领域研究的热点和难点。
[0003]当前,对于PM2.5浓度的估算主要通过站点观测的手段,即在特定区域内基于有限个PM2.5浓度观测站点数据进行空间插值反演,估算一定范围内的PM2.5浓度,这种方法得到的数据信息可靠性高,且能实现连续的动态观测。这里提及的空间插值是指根据已知观测样本点的PM2.5浓度真实值来估计待估位置点的PM2.5浓度值,其原理是通过已知观测点样本数据构建函数关系,综合空间位置关系以及空间相关性,从而估算其他任意点或任意分区的PM2.5浓度。
[0004]常用的空间插值法可以归结为二类,一类是确定性方法,另一类是空间统计方法。确定性方法中最具代表性的是反距离权重法和泰森多边形法。这种传统的概念性模型对PM2.5浓度的空间变化一般采用均化处理方式,用以方便产流计算,但随之带来的问题就是难以客观反映PM2.5浓度的空间分布,一定程度上忽略了PM2.5浓度在空间上的随机性,也未能有效考虑不同观测站点PM2.5浓度在空间上的相关性。空间统计方法中最具代表性的是克里金插值方法,该方法以区域化变量独有的随机性和结构性性质为基础,使得探索PM2.5浓度空间结构和空间变异规律变得有迹可循,同时以变异函数为基本工具对区域化变量的连续性、相关性、尺度性等要素进行空间描述。PM2.5浓度正是具有这种随机性(不确定性)与结构性(相关性)双重特征的区域化变量,应用克里金空间插值实现对PM2.5浓度估算其实质在于通过对已知位置点的PM2.5浓度内插或外推的方式,对待估位置点PM2.5浓度的取值进行无偏、最优估计。
[0005]克里金空间插值PM2.5浓度估算过程中,插值模型的精度取决于模型对空间变异性和空间相关性的反映程度。传统方法中插值模型需要用理论变异函数拟合实验变异函数,而理论变异函数模型往往是根据人的经验来选定,因此会导致不同的理论变异函数模型对PM2.5浓度估算结果的优劣程度产生较大的影响。此外,理论变异函数形状固定,有限的已知PM2.5浓度观测站点数据进行拟合时,无法反映实际PM2.5浓度在空间上的相关性和差异性,空间变化趋势被淹没。故如何根据现有PM2.5浓度观测站的数据生成空间计算单元内的PM2.5浓度,且尽可能地客观反映PM2.5浓度区域空间变化特征,是相关领域亟需解决的关键科学技术问题。

技术实现思路

[0006]本专利技术所要解决的技术问题就是提供一种可选的PM2.5浓度估算方法。
[0007]本专利技术采用如下技术方案:
[0008]一种可选的PM2.5浓度估算方法,其改进之处在于,包括如下步骤:
[0009]步骤1,通过离散变异函数公式计算所有站点PM2.5浓度样本点对的实验变异函数值;
[0010]将PM2.5浓度z(x)在站点x处和站点x+h处方差的一半定义为z(x)在x轴方向上的变异函数,记为γ(x,h);
[0011][0012]其中,Var[z(x)-z(x+h)]代表z(x)-z(x+h)的方差;
[0013]在二阶平稳假设的情况下,对任意h有:
[0014]E[z(x)]=E[z(x+h)]ꢀꢀ
(2)
[0015]其中,E[z(x)]和E[z(x+h)]分别代表z(x)和z(x+h)的PM2.5浓度数学期望,整理得:
[0016][0017]这时变异函数γ(x,h)依赖于两个变量:站点位置x和PM2.5浓度样本点对的距离h,若变异函数仅仅依赖于距离h而与站点位置x无关,则γ(x,h)可以写为γ(h):
[0018][0019]离散样本的实验变异函数计算公式为:
[0020][0021]其中,i=1,...,N(h),h为各站点PM2.5浓度样本点对的距离,N(h)代表站点PM2.5浓度样本点对距离为h时所有样本点对的个数,z(x
i
)和z(x
i
+h)分别代表在空间位置点x
i
和x
i
+h处的PM2.5浓度真实值;
[0022]步骤2,采用最小二乘支持向量机拟合实验变异函数值,得到理论变异函数模型;
[0023]步骤21,最小二乘支持向量机LS-SVM输入变量和输出变量分别为距离和实验变异函数值,假定需要拟合的数据集为其中,h
i
∈R
d
,取d=1,h
i
表示第i个样本点对的距离,作为自变量,γ(h
i
)∈R,表示在距离h
i
下的实验变异函数值,作为因变量,n代表分组后需要拟合的实验变异函数值总个数;回归函数f(h)的基本形式可以用下式(6)表示:
[0024][0025]其中,h为PM2.5浓度样本点对的距离,ω为权系数向量,即列向量,ω
T
代表其转置向量;为输入空间到特征空间的映射函数,b为常数项;
[0026]步骤22,依据统计学习理论,支持向量机模型的目的是使结构风险和经验风险同时达到最小,将支持向量机模型转换为优化函数
[0027][0028]其中,i=1,...,N,N为分组后需要拟合的实验变异函数值总个数,表示结构风险,结构风险描述支持向量机模型的复杂度,||ω||2为ω的2-范数平方,范数平方,表示经验风险,经验风险描述支持向量机模型与真实数据的拟合程度,在最小二乘支持向量机方法中,经验风险用误差平方和表示,e
i
表示误差项,γ表示正则化参数;
[0029]在LS-SVM中,误差项e
i
等于站点PM2.5浓度真实值y
i
与回归模型计算的PM2.5浓度之差,因此优化函数须满足约束条件:
[0030][0031]步骤23,利用拉格朗日乘数法将步骤22中式(8)含约束条件的优化函数转化为无约束条件的拉格朗日函数,所述拉格朗日函数
[0032][0033]整理为:
[0034][0035]其中,α
i
是拉格朗日乘子,根据KKT条件,所述拉格朗日函数最优解条件为:
[0036][0037]用线性方程组表示上式,得到:
[0038][0039]其中,e=[e1,e2,

,e
N
]T
,y=[y1,y2,

,y
N
]T
,α=[α1,α2,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可选的PM2.5浓度估算方法,其特征在于,包括如下步骤:步骤1,通过离散变异函数公式计算所有站点PM2.5浓度样本点对的实验变异函数值;将PM2.5浓度z(x)在站点x处和站点x+h处方差的一半定义为z(x)在x轴方向上的变异函数,记为γ(x,h);其中,Var[z(x)-z(x+h)]代表z(x)-z(x+h)的方差;在二阶平稳假设的情况下,对任意h有:E[z(x)]=E[z(x+h)]
ꢀꢀ
(2)其中,E[z(x)]和E[z(x+h)]分别代表z(x)和z(x+h)的PM2.5浓度数学期望,整理得:这时变异函数γ(x,h)依赖于两个变量:站点位置x和PM2.5浓度样本点对的距离h,若变异函数仅仅依赖于距离h而与站点位置x无关,则γ(x,h)可以写为γ(h):离散样本的实验变异函数计算公式为:其中,i=1,...,N(h),h为各站点PM2.5浓度样本点对的距离,N(h)代表站点PM2.5浓度样本点对距离为h时所有样本点对的个数,z(x
i
)和z(x
i
+h)分别代表在空间位置点x
i
和x
i
+h处的PM2.5浓度真实值;步骤2,采用最小二乘支持向量机拟合实验变异函数值,得到理论变异函数模型;步骤21,最小二乘支持向量机LS-SVM输入变量和输出变量分别为距离和实验变异函数值,假定需要拟合的数据集为其中,h
i
∈R
d
,取d=1,h
i
表示第i个样本点对的距离,作为自变量,γ(h
i
)∈R,表示在距离h
i
下的实验变异函数值,作为因变量,n代表分组后需要拟合的实验变异函数值总个数;回归函数f(h)的基本形式可以用下式(6)表示:其中,h为PM2.5浓度样本点对的距离,ω为权系数向量,即列向量,ω
T
代表其转置向量;为输入空间到特征空间的映射函数,b为常数项;步骤22,依据统计学习理论,支持向量机模型的目的是使结构风险和经验风险同时达到最小,将支持向量机模型转换为优化函数到最小,将支持向量机模型转换为优化函数其中,i=1,...,N,N为分组后需要拟合的实验变异函数值总个数,表示结构风险,结构风险描述支持向量机模型的复杂度,||ω||2为ω的2-范数平方,范数平方,表示经验风险,经验风险描述支持向量机模型与真实数据的拟合程度,在最小二乘支持向量机方法中,经验风险用误差平方和表示,e
i
表示误差项,γ表示正则化参数;在LS-SVM中,误差项e
i
等于站点PM2.5浓度真实值y
i
与回归模型计算的PM2.5浓度之差,因此优化函数须满足约束条件:
步骤23,利用拉格朗日乘数法将步骤22中式(8)含约束条件的优化函数转化为无约束条件的拉格朗日函数,所述拉格朗日函数条件的拉格朗日函数,所述拉格朗日函数整理为:其中,α
i
是拉格朗日乘子,根据KKT条件,所述拉格朗日函数最优解条件为:用线性方程组表示上式,得到:其中,e=[...

【专利技术属性】
技术研发人员:车磊王海起陈奇东梁庆娜桂丽杨会贇张璇
申请(专利权)人:中国电波传播研究所中国电子科技集团公司第二十二研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1