一种交通排放配额分配过程中离群数据识别的优化方法技术

技术编号:34730474 阅读:11 留言:0更新日期:2022-08-31 18:19
本发明专利技术涉及一种交通排放配额分配过程中离群数据识别的优化方法。该方法包括构建交通排放配额分配模型、计算参考集D中各车辆各投入的单位产出投入值、采用孤立森林模型

【技术实现步骤摘要】
一种交通排放配额分配过程中离群数据识别的优化方法


[0001]本专利技术涉及环境管理领域,更具体地涉及一种交通排放配额分配过程中离群数据识别的优化方法。

技术介绍

[0002]交通引发的污染、气候变化问题是城市治理面临的一大难题。随着我国加强污染物和碳排放的管控,交通作为城市污染和碳排放的主要来源之一将承担重要的减排责任。污染及碳排放控制的市场机制是低成本实现排放控制目标的有效政策工具。在世界范围内,已有多个国家和地区建立排放权交易市场,例如美国实施SO2和NO
x
排污权交易市场,中国多个城市开展了SO2排污权交易市场试点,25个国家和地区已实施CO2交易市场。排放权交易的本质是政府制定污染物或碳排放权总量上限,然后发放排放权配额。配额分配对排放权交易机制的运行至关重要,因为排放权配额和被管控主体的利益高度相关,关系到政策导向、激励效果和政治可接受度。
[0003]数据包络分析方法(Data EnvelopmentAnalysis,DEA)是一个运筹学与数理经济学的交叉研究领域,是典型的数据驱动的非参数基准技术,已被广泛用于配额分配研究。它是根据多项投入指标和多项产出指标,利用线性规划的方法,对具有可比性的同类型的被评估对象进行相对效率的评价的一种非参数分析方法。这些被评估对象称为决策单元(Decision Making Unit,DMU)。每一个DMU使用h种投入生产出k种产出,其中,这些DMU中里,保持现有的投入获得的最大的产出或保持现有的产出消耗最小所对应的DMU称为高效的DMU,高效的DMU所形成的曲线(面)被称为效率前沿。DEA作为一种非参数绩效评估方法,不需要对整合投入和产出的权重以及效率前沿的形式进行预先估计或假定,从而避免了各种主观因素的影响。广义DEA模型在具有传统DEA客观确定权重及效率前沿的特性之外,一个重要推广是用于形成效率前沿的DMU与被评价DMU的分离。参考集是指用于形成效率前沿以评估决策DMU的DMU集合。对于传统的DEA模型,参考集和被评估DMU是同一集合,而广义DEA模型参考集可以由被评估DMU本身或由其他DMU组成。参考集中的DMU可以是策者感兴趣的标准或对象。广义DEA方法可以为决策者提供多个视角来衡量DMU的效率。
[0004]但DEA对极端值或离群值很敏感,因为DEA可能根据极端的DMU估计效率前沿,这样通常会导致对其他DMU的效率得分的估计存在严重偏差。因此,应先调查所使用的数据是否包含离群值,然后去除离群值以提高效率前沿估计的准确性。由于离群值可以分为高效离群值和低效离群值,而影响效率前沿的是高效离群值,因此后文所指的离群值均为高效离群值。
[0005]数据包络分析模型已广泛应用在排放权配额分配的研究中。在排放权配额分配的背景下,DMU可以视为待分配配额的个体,其应该分配得到的配额可作为效率指标中的投入或产出。如果离群值参与形成效率前沿,则容易导致效率评价产生偏差,从而使分配配额的对象产生不合理的配额缺口,严重影响排放交易市场的正常运行。因此需要在效率前沿的形成过程对离群值进行剔除,避免对配额分配造成过大负面影响。
[0006]关于DEA模型的离群值识别可以分为独立于DEA模型外的离群值识别和基于DEA模型进行的离群值识别。基于DEA模型进行的离群值识别有以下几种。超效率法是先测量去除某个DMU后对效率前沿的影响,然后假设造成较大影响的DMU为离群值。超效率法创始人Banker和Gifford建议从中随机地消除一定百分比的数据。虽然该方法操作简单,但此类结果可能会受到“掩蔽”效应的影响,这里的“掩蔽”是指数据集中存在会隐藏其他离群值的离群值。因为超效率模型只能逐次对单个离群值进行识别,若出现离群值聚集的情况,判断离群值的效率前沿本身可能就包含邻近的离群值,因此容易产生“掩盖”效应。具体来说,如果两个或更多的DMU在多维空间中彼此靠近,但是远离其他DMU,则超效率模型可能无法识别出离群值。此外,超效率法识别离群值的准确性以及错误识别所导致的影响也暂未明确。order

m方法虽然不会产生“掩蔽”效应,但该方法操作繁琐、复杂,需要预定义参数并需要大量的人工检查。Khezrimotlagh等提出的方法虽然也可以避免“掩蔽”效应,但需要多次运行标准DEA模型,在处理大型数据集时需要消耗大量的运算资源与时间。
[0007]独立于DEA方法以外的离群值识别方法,有一些经典的统计方法,即通过使用分布假设在数据集中预先识别离群值。Bogetoft和Otto提出了数据云的方法。但这个方法的缺点是没有考虑DMU在多维空间中的位置,因此必须对所有可能的DMU组合单独执行一次该方法。Smirlis和Despotis借助箱线图识别DMU的各个投入和产出中的极值并通过集成分段凹函数进行修正。这种方法的问题在于,一方面不正确的数据可能并没有被修正到,另一方面,具有极端值但完全正常的DMU可能被改变。上文提到的方法都有各自不可避免的缺陷。基于DEA模型方法的缺点是离群值的识别过程受离群值本身的影响,或需要大量人工判断,或需要耗费大量的计算资源;独立于DEA本身的离群值识别方法过于笼统,没有考虑到DEA分析的特殊性。
[0008]随着科技的蓬勃发展,大数据时代已经来临。交通工具由于数量多、移动频繁,在配额分配的过程中将会使用大量的有关交通工具出行、排放的时空大数据。现有的关于数据包络分析的离群值识别方法一定程度存在高效处理大数据的困境,一些方法离群值识别效果有限,另一些方法属于非自动化方法,需要大量人工干预。因此,我们提出了一种组合方法,它是基于孤立森林方法和超效率模型的、面向DEA模型的离群值识别优化方法,在配额分配过程以自动化、相对快速且准确的方式识别离群值。

技术实现思路

[0009]为解决现有技术缺陷,本专利技术提出一种交通排放配额分配过程中离群数据识别的优化方法,该方法能够在配额分配过程以自动化、相对快速且准确的方式识别离群值。
[0010]为实现上述目的,本专利技术的技术方案如下;
[0011]本专利技术一种交通排放配额分配过程中离群数据识别的优化方法,包括如下步骤:
[0012]S1.构建交通排放配额分配模型;
[0013]S2.计算参考集D中各车辆各投入的单位产出投入值;
[0014]S3.采用孤立森林模型

广义超效率模型组合方法对离群车辆进行识别;
[0015]S4.将最终离群车辆从参考集D中移除,得到完成离群车辆剔除处理的参考集D”。
[0016]进一步地,上述交通排放配额分配过程中离群数据识别的优化方法,所述步骤S1具体为:
[0017]S1

1设置配额分配对象;
[0018]S1

2设置配额分配模型的投入指标和产出指标;
[0019]S1

3设置用于形成效率前沿的参考集D,选取一段较长的历史时期的出行车辆的集合作为参考集D;
[0020]S1

4本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种交通排放配额分配过程中离群数据识别的优化方法,其特征在于,包括如下步骤:S1.构建交通排放配额分配模型;S2.计算参考集D中各车辆各投入的单位产出投入值;S3.采用孤立森林模型

广义超效率模型组合方法对离群车辆进行识别;S4.将最终离群车辆从参考集D中移除,得到完成离群车辆剔除处理的参考集D”。2.根据权利要求1所述的交通排放配额分配过程中离群数据识别的优化方法,其特征在于:所述步骤S1具体为:S1

1设置配额分配对象;S1

2设置配额分配模型的投入指标和产出指标;S1

3设置用于形成效率前沿的参考集D,选取一段较长的历史时期的出行车辆的集合作为参考集D;S1

4设置配额分配模型的距离函数;S1

5设置规模报酬类型,分为规模报酬不变或者规模报酬可变;S1

6确定配额分配模型。3.根据权利要求2所述的交通排放配额分配过程中离群数据识别的优化方法,其特征在于:所述S1

1设置配额分配对象为某个区域及时间范围的个体车辆的配额。4.根据权利要求2所述的交通排放配额分配过程中离群数据识别的优化方法,其特征在于:所述S1

2设置配额分配模型的投入指标为车辆的污染物排放量、二氧化碳排放量和行驶时间。5.根据权利要求2所述的交通排放配额分配过程中离群数据识别的优化方法,其特征在于:所述S1

2设置配额分配模型的产出指标为车辆的行驶里程。6.根据权利要求2所述的交通排放配额分配过程中离群数据识别的优化方法,其特征在于:S1

4所述的距离函数为径向距离。7.根据权利要求2所述的交通排放配额分配过程中离群数据识别的优化方法,其特征在于:S1

5设置规模报酬类型时,当选取时间为日或月尺度的范围时为规模报酬不变;当选取时间为年尺度的范围时为规模报酬可变。8.根据权利要求2所述的交通排放配额分配过程中离群数据识别的优化方法,其特征在于:S1

6确定配额分配模型时当满足规模报酬不变时,对待分配配额车辆p有以下模型:
上述模型的最优解θ
*
代表待分配配额车辆p的效率分数,λ
*
为效率前沿车辆的线性组合系数,θ
...

【专利技术属性】
技术研发人员:刘永红黎炜驰曾雪兰余志何青蔓何嘉俊
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1