本发明专利技术公开一种大气污染物浓度影响要素定量分析的方法,包括:S1.设定模型,确定广义可加模型基本形式,从采集的污染物和气象因素中选取一种污染物作为因变量,其他污染物和气象因素作为自变量构建模型;S2.估计模型,基于设定的模型,分别对连接函数g(·)和光滑函数fj(·)进行估计,得到不同模型;在满足所有预测变量的影响均达到显著水平的前提下,以模型评价指标来筛选最优模型;S3.基于的最优模型,得到累积影响程度和偏残差图。本发明专利技术将广义可加模型应用到大气环境领域的分析中,能够定量的得到不同情况下各参数对于单一污染物变化的影响,并相互进行比较,更详细的分析各个污染物的变化特征的影响因素。
【技术实现步骤摘要】
本专利技术涉及数据处理领域,更具体地,涉及一种大气污染物浓度影响要素定量分 析的方法。
技术介绍
近年来,随着经济的快速发展和城市化进程的加快,能源的大量消耗以及排放的 大幅度增加,由此而来的大气环境问题越来越引起人们的注意。由于大气污染问题受到不 同排放源的影响,各种污染物在大气中多种界面之间发生理化过程,并彼此耦合,因此其特 性十分的复杂。掌握各污染物变化特征和规律非常重要,尤其是对于特定污染天气的形成 和成因进行识别,提供政府决策参考和对居民出行提供指引,有着积极的科学和现实意义。 对于影响污染物变化的要素分析,常用的方法是通过相关性分析,得到特定参数 与对应污染物浓度变化的相关系数。但由于大气污染物浓度变化的复杂性和不确定性,采 用线性方程进行模拟存在着一定的误差,且无法详细描述同一参数不同时刻对污染物浓度 变化的影响。广义可加模型是线性回归模型的扩展,其不要求应变量与自变量满足线性关 系,适用于非线性数据的研究。可加模型是用预测变量非参数的形式代替了线性回归模型 中的参数形式,它不需要严格规定反应变量对解释变量的参数依存关系,可以给出许多灵 活多变的回归模型。对于广义可加模型,唯一需做的假设是各函数项是可加的且是光滑的, 使得其成为一种应对非线性数据的灵活而有效的工具。由于广义可加模型能够定量分析不 同变量参数对于特定因子的关系,现阶段广泛被运用在生态学领域,例如渔业资源的分布 特征以及对其影响因子进行定量分析中,但针对空气污染浓度变化的分析较少。
技术实现思路
本专利技术为了解决的上述技术问题,提供一种大气污染物浓度影响要素定量分析的 方法,是一种能确定影响污染物浓度变化原因的定量计算方法,能够了解不同参数对于某 一特定污染物浓度变化在不同时刻的影响大小。 为解决上述技术问题,本专利技术采用的技术方案是: -种大气污染物浓度影响要素定量分析的方法,包括以下步骤: SI.设定模型,确定模型基本形式,从采集的污染物和气象因素中选取一种污染物 作为因变量,其他污染物和气象因素作为自变量构建模型; 其中模型基本形式确定方式具体为: 根据所选取的污染物,对采集的其浓度数据进行分析,根据分布特点来确定该污 染物的连接函数的形式;将其余污染物和气象要素作为自变量,即预测变量,得到其广义可 加模型, 其中,μ是因变量,即所研究的污染物浓度Y的期望值,μ = ...,Xp)); g( ·)是选取的污染物的连接函数,α是截距;&(·)是预测变量X,的任意单变量函数, f,( ·)是光滑函数,P是所选取的预测变量的个数; 由于各个预测变量的函数形式不同,组合产生许多不同形式的模型;对这些模型 进行比较,根据预测变量的散点图进行筛选,并计算它们的评价指标,根据计算的指标结 果,选出对数据拟合效果最好的作为最终设定的模型; S2.估计模型,基于步骤Sl设定的模型,分别对连接函数g( ·)和光滑函数f,( ·) 进行估计,得到不同模型;在满足所有预测变量的影响均达到显著水平的前提下,以模型评 价指标来筛选最优模型; S3.基于由步骤S2的最优模型,得到累积影响程度和偏残差图。 从广义可加模型的形式上可看出,它对预测变量的形式没有规定,体现了其灵活 性。由于它适用于很多分布类型,所以对于不同的分布类型,连接函数的形式也不同。具体 对应关系见下表: 在污染物浓度变化影响要素定量分析上,一般采用log连接。 优选地,所述步骤S2中的以模型评价指标来筛选最优模型,是基于指赤池信息准 则的AIC值,即从待选模型中选出AIC值最小的模型为最优模型; AIC值的计算方式为: AIC = 2p-21n L 上式中,p是S2中所需进行评价的模型的参数的数量,即预测变量的个数;L是似 然函数。 优选地,所述S3基于最优模型,通过计算此时模型拟合的相关系数平方值,得到 因变量对自变量的累积影响程度;并计算每个预测变量对应的偏残差,做出偏残差图; 其中上述累积影响程度反应了模型的解释能力,指的此时选取的预测变量对于因 变量的影响程度的累加; 上述偏残差图中的偏残差指因变量减去期望后再减去其他预测变量的光滑函数 值后得到的残差;偏残差图表现了在模型中,当去掉其它因素的影响的时候,给定因素对自 变量对因变量的影响;这种影响被描述为边际效应,是因为这个效应是在去除了其他参数 的影响的时候得到的,表示预测变量对响应变量的独立影响。 与现有技术相比,本专利技术的技术效果为:本专利技术将广义可加模型应用到大气环境 领域的分析中,能够定量的得到不同情况下各参数对于单一污染物变化的影响,并相互进 行比较,更详细的分析各个污染物的变化特征的影响因素。【附图说明】 图1为采用广义可加模型进行大气污染物浓度影响要素定量分析计算的流程图。 图2为实施例中O3浓度变化影响要素分析偏残差图。【具体实施方式】 下面结合具体实施案例,进一步阐述本专利技术。应注意的是,这些实施例仅用于说明 本专利技术而不用于限制本专利技术的范围。 -种大气污染物浓度影响要素定量分析的方法,是采用广义可加模型对大气污染 物浓度与多个其他污染物浓度和气象要素的关系进行定量分析,具体包括以下步骤: (1)确定广义可加模型的基本形式,广义可加模型的基本形式如下: 其中,μ是因变量,即所研究的污染物浓度Y的期望值,μ = EaAX1, ...,Xp)); g( ·)是选取的污染物的连接函数,α是截距;&(·)是预测变量X,的任意单变量函数,P 是所选取的预测变量的个数。 从广义可加模型的形式上可看出,它对预测变量的形式没有规定,体现了其灵活 性。由于它适用于很多分布类型的资料,所以对于不同类型的资料,连接函数的形式也不 同。具体对应关系见下表: 在污染物浓度变化影响要素定量分析上,一般采用log连接。 (2)模型设定 针对大气污染物浓度影响要素定量分析的方法上,所采用的数据来源于各空气质 量自动监测站点,分为污染物数据和气象数据两类。通常情况下,自动监测站点的污染物数 据包括PM 2.5、O3、~02等,气象数据包括温度、风速、风向、湿度等。选取其中一种污染物的浓 度作为因变量,其他类别污染物浓度和气象参数值作为自变量,即预测变量,构建模型。 根据所选取的污染物对象,对采集的其浓度数据进行分析,根据分布特点来确定 连接函数的形式。将其余污染物和气象要素作为预测变量,由于各个预测变量的函数形式 不同,组合产生许多不同形式的模型。然后对这些模型进行比较,根据预测变量的散点图进 行筛选,并计算它们的各项评价指标。根据计算的指标结果,选出对数据拟合效果最好的作 为最终的模型。 (3)模型估计 同时考虑曲线的拟合优度和拟合光滑度的前提下,对初步构建的多个模型分别进 行估算。估算主要包括连接函数g( ·)的估计、预测变量Xj的单变量函数U ·)的估计、 光滑参数的估计等方面。对模型组估算后,需要筛选出满足预定要求和达到预设目标的优 化模型。在采用广义可加模型定量计算影响污染物浓度变化的要素上,由于此处选择了待 分析的变量,因此只需对其模型进行评价。基于广义可加模型的大气污染物浓度要素定量 分析中,最优化模型的原则需满足,在满足所有生态因子的影响均达到显著水平的前提下, 以模型评价指标如赤池信息准则本文档来自技高网...
【技术保护点】
一种大气污染物浓度影响要素定量分析的方法,其特征在于,包括以下步骤:S1.设定模型,确定模型基本形式,从采集的污染物和气象因素中选取一种污染物作为因变量,其他污染物和气象因素作为自变量构建模型;其中模型基本形式确定方式具体为:根据所选取的污染物,对采集的其浓度数据进行分析,根据分布特点来确定该污染物的连接函数的形式;将其余污染物和气象要素作为自变量,即预测变量,得到其广义可加模型,g(μ)=α+Σj=1pfj(Xj)]]>其中,μ是因变量,即所研究的污染物浓度Y的期望值,μ=E(Y/(X1,…,Xp));g(·)是选取的污染物的连接函数,α是截距;fj(·)是预测变量Xj的任意单变量函数,fj(·)是光滑函数,p是所选取的预测变量的个数;由于各个预测变量的函数形式不同,组合产生许多不同形式的模型;对这些模型进行比较,根据预测变量的散点图进行筛选,并计算它们的评价指标,根据计算的指标结果,选出对数据拟合效果最好的作为最终设定的模型;S2.估计模型,基于步骤S1设定的模型,分别对连接函数g(·)和光滑函数fj(·)进行估计,得到不同模型;在满足所有预测变量的影响均达到显著水平的前提下,以模型评价指标来筛选最优模型;S3.基于由步骤S2的最优模型,得到累积影响程度和偏残差图。...
【技术特征摘要】
【专利技术属性】
技术研发人员:刘永红,姚达文,
申请(专利权)人:中山大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。