当前位置: 首页 > 专利查询>青岛大学专利>正文

一种基于特征重要性的判断交通拥堵成因的方法技术

技术编号:15911391 阅读:45 留言:0更新日期:2017-08-01 22:46
本发明专利技术涉及交通拥堵成因分析方法,特别涉及一种基于特征重要性的判断交通拥堵成因的方法;其包括提取拥堵点段的交通拥堵等级及相关特征、基于预测残差集成特征重要性评估方法获得拥堵点段的成因库和基于关联规则挖掘方法分析某次拥堵的具体原因;其采用多种有监督学习方法,包括Lasso模型、随机森林模型和线性模型三种方法评估特征重要性,并依据预测误差对三种方法评估的特征重要性进行加权,所以特征重要性分析可获得更准确、更稳健的结果,从而保证了交通拥堵成因分析的正确性。

A method for judging the cause of traffic congestion based on the importance of feature

The present invention relates to a method for the analysis of traffic congestion causes, particularly relates to a method for judging the causes of traffic congestion characteristics based on importance; including traffic congestion levels and related features, extracted congestion point section of the library cause residual integrated feature importance evaluation method to predict congestion points and obtain section based on Association rule mining method based on the analysis of the specific reasons for some time congestion; it uses a variety of supervised learning methods, including Lasso model, random forest model and linear model three methods to assess the importance of features, and based on the characteristics of the importance of prediction error of the three methods of evaluation are weighted, so feature importance analysis can obtain more accurate and more stable results, so as to ensure the correctness of the analysis traffic congestion causes.

【技术实现步骤摘要】
一种基于特征重要性的判断交通拥堵成因的方法
:本专利技术涉及交通拥堵成因分析方法,特别涉及一种基于特征重要性的判断交通拥堵成因的方法。
技术介绍
:我国经济社会的快速发展,加快了城市化和机动化进程,从而使得道路交通量水平急剧攀升,截至2012年末,我国已成为世界第二大汽车保有量国家;然而,与迅速增长的交通需求相比,我国城市的交通供给能力增长较缓。交通拥堵已成为一个普遍问题,严重影响了城市经济的发展,导致了能源消耗、环境污染,还给人民的生活、工作带来诸多不便,增加了巨大的社会成本,这对社会的长远发展是非常不利的。近年来,物联网、云计算等技术的快速发展催生了智能交通系统,为高效管理城市交通提供了可能。针对智能交通系统采集的交通流量、卡口过车等数据,大量工作开展了道路旅行时间预测、交通流量预测、交通拥堵评价等方面的研发,方便了对城市交通的管理,但对于缓解甚至根治交通拥堵仍有较大欠缺,明确拥堵成因是规划城市交通、缓解交通拥堵的前提;现有工作大都从宏观角度剖析,或基于仿真模型探讨交通拥堵机理及优化策略,欠缺利用大规模历史数据分析拥堵点段成因或某次拥堵原因的自动化方法。为此,寻求设计一种将利用智能交通系统采集的数据抽取周期型特征(可反映上下班时段等因素对交通拥堵的影响)、临时型特征(可反映交通事故等临时型因素对交通拥堵的影响)、拓扑型特征(可反映临近点段对关注点段交通拥堵的影响)与功能型特征(可反映天气、关注点段附近大型设施等对交通拥堵的影响),选择交通拥堵等级作为标签,采用有监督学习方法评估各特征对交通拥堵等级的重要性,并对多种特征重要性评估方法进行集成来判断交通拥堵成因的方法,具有良好的社会效益和经济效益。
技术实现思路
:为了克服现有技术存在的缺陷,本专利技术提供一种基于特征重要性的判断交通拥堵成因的方法,集成Lasso模型、随机森林模型与线性模型评估特征重要性,有效提高交通拥堵成因分析的准确性与稳健性。为了实现上述目的涉及的基于特征重要性的判断交通拥堵成因的方法包括以下步骤:。。。本专利技术与现有技术相比,采用多种有监督学习方法,包括Lasso模型、随机森林模型和线性模型三种方法评估特征重要性,并依据预测误差对三种方法评估的特征重要性进行加权,所以特征重要性分析可获得更准确、更稳健的结果,从而保证了交通拥堵成因分析的正确性。附图说明:图1为本专利技术涉及的基于特征重要性的判断交通拥堵成因的方法的判断流程框图。图2为步骤102涉及的获得拥堵路段成因库的流程框图。具体实施方式:下面通过实施例并结合附图对本专利技术作进一步说明。实施例1:本实施例涉及的基于特征重要性的判断交通拥堵成因的方法包括如下所述的步骤:A、提取拥堵点段的交通拥堵等级及相关特征:在该步骤中,将智能交通系统采集的日志数据数据输入到计算机中进行分析、提取,以得到交通拥堵等级、周期型特征、临时型特征、拓扑型特征与功能型特征;提取交通拥堵等级,通过传入的智能交通系统的数据可知,拥堵等级分为十级,一级为不拥堵,十级为最拥堵;将采集的交通数据的初始时刻作为起始时间,以q分钟为间隔划分时段,将一天划分为个时段,采集到数据的时间跨度为d天,共包含d*nq个时段,路口i在t时段的交通流量和交通拥堵等级分别为t时段之前(不含t时段)的流量、天气、拥堵等级等信息视为已知信息,为特征重要性分析的关注变量;(1)提取周期型特征,具体包括如下特征:(1-1)以一天为周期,路口i在前k(k=1,2,…,n)天内同时段(例如,每天8:00~8:20)交通流量的均值共包含n个特征;(1-2)以一天为周期,路口i在前k天内同时段拥堵等级的均值共包含n个特征;(1-3)以一天为周期,路口i在前k天内同时段交通流量的中位数共包含n个特征;(1-4)以一天为周期,路口i在前k天内同时段拥堵等级的中位数共包含n个特征;(1-5)以一周为周期,路口i在前l(l=1,2,…,m)周同时段的交通流量的均值共包含m个特征;(1-6)以一周为周期,路口i在前l周同时段的拥堵等级的均值共包含m个特征;(1-7)以一周为周期,路口i在前l周同时段的交通流量的中位数共包含m个特征;(1-8)以一周为周期,路口i在前l周内同时段拥堵等级的中位数共包含m个特征;(2)提取临时型特征,具体包括如下特征:(2-1)路口i在t-j(j=1,2,…,q)时段交通流量共包含q个特征;(2-2)路口i在t时刻的前j个时段内交通流量的均值为共包含q个特征;(2-3)路口i在t时刻前j个时段内交通流量的中位数共包含q个特征;(2-4)路口i在t与t-j时刻交通流量的差值共包含q个特征;(2-5)以一周为周期,路口i在t-1时段与前l周同时段交通流均值的差值共包含m个特征;(2-6)以一周为周期,路口i在t-1时段与前l周同时段交通流中位数的差值共包含m个特征;(3)提取拓扑型特征,将城市道路抽象为无权网络,路口视为节点,路段视为连边,采用dijkstra算法可计算任意路口间的最短路径(最小跳数),记t时刻路口i的p(p=1,2,…,g)近邻路口的交通流量为其中,代表t时段路口i的第b个p近邻路口的流量;Ni,p代表路口i的p近邻路口的总数,即距路口i仅为p个路段的路口数目,拓扑特征具体包括如下特征:(3-1)t时刻路口i的p近邻路口交通流量的均值共包含g个特征;(3-2)t时刻路口i的p近邻路口交通流量的中位数共包含g个特征;(3-3)路口i的p近邻路口t-j时刻的交通流量的均值共包含q*g个特征;(3-4)路口i的p近邻路口t-j时刻的交通流量的中位数共包含q*g个特征;(4)提取功能型特征包括监测器附近设施类别、天气、路况等信息,本专利将这些温度、湿度的数据离散化为名义型特征,具体包括如下特征:(4-1)令tem表示温度值,将温度的划分为五种类型;(4-2)令wea表示天气状态,将天气分为五种类型;(4-3)令s表示湿度值,将湿度分为五种类型;(4-4)某路口i附近的设施情况;(4-5)某路口i附近包含x类设施的数量N(x);B、基于预测残差集成特征重要性评估方法获得拥堵点段的成因库;采用Lasso模型、随机森林模型和线性模型评估步骤A中提取的特征的重要性,并基于预测残差评估三种模型的重要程度,从而集成三种模型的特征重要性评估结果,得到拥堵点段的成因库;具体步骤如下:B1、采用Lasso模型评估交通拥堵相关特征的重要性;建立Lasso的目标函数模型为:其中,N为样本数,P为特征数,X={xi=(xi1,...xiP)|i=1,2...,N}为样本集,Y={yi|i=1,2...,N}为交通拥堵等级;β=(β1,...,βP)t为特征权重向量,βlasso为使得目标函数最小化的特征权重向量;B2、采用随机森林模型评估交通拥堵相关特征的重要性;随机森林模型通过bootstrap重抽样和随机特征选择机制生成多棵决策树,基于投票、加权平均等方式进行集成多棵决策树的预测结果;在评估特征重要性时,具体步骤如下:(1)评估特征j在第i棵决策树中的重要性;先选择袋外数据评估决策树的预测错误率为然后随机对袋外数据的特征j加入噪声干扰,再次计算袋外数据误差为最后可得两次预测错误率的差值为(2)评估特征j在随机森林中的重要性;设定随机森林中有B棵本文档来自技高网
...
一种基于特征重要性的判断交通拥堵成因的方法

【技术保护点】
一种基于特征重要性的判断交通拥堵成因的方法,其特征在于,该方法包括以下步骤:A、提取拥堵点段的交通拥堵等级及相关特征;B、基于预测残差集成特征重要性评估方法获得拥堵点段的成因库;C、基于关联规则挖掘方法分析某次拥堵的具体原因。

【技术特征摘要】
1.一种基于特征重要性的判断交通拥堵成因的方法,其特征在于,该方法包括以下步骤:A、提取拥堵点段的交通拥堵等级及相关特征;B、基于预测残差集成特征重要性评估方法获得拥堵点段的成因库;C、基于关联规则挖掘方法分析某次拥堵的具体原因。2.根据权利要求1所述的一种基于特征重要性的判断交通拥堵成因的方法,其特征在于:所述步骤A中提取的特征为通过智能交通系统采集的日志数据数据输入到计算机中进行分析和提取得到的周期型特征、临时型特征、拓扑型特征与功能型特征;所述步骤A中提取交通拥堵等级为通过智能交通系统采集的日志数据数据输入到计算机中进行提取,得到的拥堵等级,其分为十级,一级为不拥堵,十级为最拥堵。3.根据权利要求2所述的一种基于特征重要性的判断交通拥堵成因的方法,其特征在于,步骤A中提取周期型特征、临时型特征、拓扑型特征与功能型特征的方法包括以下步骤:将采集的交通数据的初始时刻作为起始时间,以q分钟为间隔划分时段,将一天划分为个时段,采集到数据的时间跨度为d天,共包含d*nq个时段,路口i在t时段的交通流量和交通拥堵等级分别为Fti、t时段之前(不含t时段)的流量、天气、拥堵等级等信息视为已知信息,为特征重要性分析的关注变量;(1)提取周期型特征,具体包括如下特征:(1-1)以一天为周期,路口i在前k(k=1,2,…,n)天内同时段(例如,每天8:00~8:20)交通流量的均值共包含n个特征;(1-2)以一天为周期,路口i在前k天内同时段拥堵等级的均值共包含n个特征;(1-3)以一天为周期,路口i在前k天内同时段交通流量的中位数共包含n个特征;(1-4)以一天为周期,路口i在前k天内同时段拥堵等级的中位数共包含n个特征;(1-5)以一周为周期,路口i在前l(l=1,2,…,m)周同时段的交通流量的均值共包含m个特征;(1-6)以一周为周期,路口i在前l周同时段的拥堵等级的均值共包含m个特征;(1-7)以一周为周期,路口i在前l周同时段的交通流量的中位数共包含m个特征;(1-8)以一周为周期,路口i在前l周内同时段拥堵等级的中位数共包含m个特征;(2)提取临时型特征,具体包括如下特征:(2-1)路口i在t-j(j=1,2,…,q)时段交通流量共包含q个特征;(2-2)路口i在t时刻的前j个时段内交通流量的均值为共包含q个特征;(2-3)路口i在t时刻前j个时段内交通流量的中位数共包含q个特征;(2-4)路口i在t与t-j时刻交通流量的差值共包含q个特征;(2-5)以一周为周期,路口i在t-1时段与前l周同时段交通流均值的差值共包含m个特征;(2-6)以一周为周期,路口i在t-1时段与前l周同时段交通流中位数的差值共包含m个特征;(3)提取拓扑型特征,将城市道路抽象为无权网络,路口视为节点,路段视为连边,采用dijkstra算法可计算任意路口间的最短路径(最小跳数),记t时刻路口i的p(p=1,2,…,g)近邻路口的交通流量为其中,代表t时段路口i的第b个p近邻路口的流量;Ni,p代表路口i的p近邻路口的总数,即距路口i仅为p个路段的路口数目,拓扑特征具体包括如下特征:(3-1)t时刻路口i的p近邻路口交通流量的均值共包含g个特征;(3-2)t时刻路口i的p近邻路口交通流量的中位数共包含g个特征;(3-3)路口i的p近邻路口t-j时刻的交通流量的均值共包含q*g个特征;(3-4)路口i的p近邻路口t-j时刻的交通流量的中位数共包含q*g个特征;(4)提取功能型特征包括监测器附近设施类别、天气、路况等信息,本专利将这些温度、湿度的数据离散化为名义型特征,具体包括如下特征:...

【专利技术属性】
技术研发人员:吴舜尧宋涛涛仝婷婷张齐
申请(专利权)人:青岛大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1