当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于PCA和Adaboost的隧道交通事故持续时间预测方法技术

技术编号:29874467 阅读:15 留言:0更新日期:2021-08-31 23:49
本发明专利技术公开了一种基于PCA和Adaboost的隧道交通事故持续时间预测方法,包括以下步骤:导入历史交通事故数据:首先对数据进行预处理,根据事故的持续时间划分为短、中、长和特长四个等级;并对预测模型中的输入变量进行缺失值检验和处理;最后对分类变量进行热编码处理。使用PCA方法对原输入变量进行去中心化处理并计算其协方差矩阵,在此基础上计算其特征值和特征向量,从小到大依次确定若干个特征值及相应的特征向量。首先基于弱分类器对交通事故持续时间进行分类,经过对样本的训练得到基础分类结果;然后采用Adaboost迭代框架计算弱分类器的分类错误样本,提高分类错误样本的权值,在此基础上构建下一个弱分类器,多次迭代后得到最终的强分类器。

【技术实现步骤摘要】
一种基于PCA和Adaboost的隧道交通事故持续时间预测方法
本专利技术涉及交通事故预测领域,具体是指一种基于PCA(PrincipleComponentAnalysis,主成分分析法)和Adaboost(Adaboost分类)的高速公路隧道持续时间预测方法。
技术介绍
高速公路作为国家经济的动脉,在城市中远距离交通运输中起着无可比拟的作用。而高速公路隧道作为公路交通中的一种特殊的构造物是交通事故的多发点,也是严重事故的易发点。相较于普通路段,隧道路段的事故会造成更大程度的交通拥堵,从而导致交通出行者需要花费更多的出行时间和成本,同时也会对人身、财产安全造成一定的威胁,容易引发一系列社会问题。因此,及时准确的预测交通事故持续时间是实现有效交通管控的前提条件,而且可以为事故下诱导性和预测性交通信息的及时发布、以及事故影响的快速消除提供依据。目前针对高速公路隧道交通事故持续时间的预测方法主要包括两类。第一类是参数模型,这种模型一般假设事故持续时间满足某种分布,然后进行拟合优度的检验,其中常用的有对数正态分布、威布尔分布等。常用的方法包括概率分布、回归分析、决策树、生存分析等方法。这类方法的有点在于模型较为简单,并且对于最后的预测结果解释性较强;而确定是对数据质量要求较高,且预测精度往往不高。第二类方法是非参数方法,如神经网络、遗传算法、随机森林、支持向量机、贝叶斯网络等方法。尤其是近年来,随着“人工智能”、“数据挖掘”等思想的发展,以上方法得到了很大发展。且众多学者的研究结果表明相较于参数方法,非参数方法的预测精度更高,而其缺点是非参数方法的可移植性较差,且该类方法往往是依赖于“黑箱操作”,因此对于预测结果的解释性不如参数方法。本文提出一种基于PCA和Adaboost算法的隧道交通事故持续时间预测方法,能直接采用弱分类器对隧道交通事故进行分类,并采用Adaboost的迭代框架将弱分类器集成为强分类器,从而进一步提高了分类准确率。
技术实现思路
本专利技术的主要目的在于解决现有技术中存在的隧道交通事故持续时间样本量较大且预测精度不够高的问题,提供一种基于PCA和Adaboost的隧道交通事故持续时间预测方法。本专利技术为解决上述技术问题采用以下技术方案:一种基于PCA和Adaboost的隧道交通事故持续时间预测方法,包括如下步骤:第一步:从高速公路事件管理中心数据库提取历史隧道交通事故数据,根据事故持续时间划分为短、中、长和特长四个等级,并对数据进行缺失值检验和筛选;第二步:使用PAC主成分分析法对第一步得到的数据进行的分析处理;第三步:将第二步所得的主成分矩阵和相对应的事故持续时间的等级,代入Adaboost模型及逆行训练,最终得到隧道交通事故持续时间的预测模型。进一步,第一步的执行步骤如下:(1)根据事故持续时间的长短划分为短、中、长和特长四个等级;(2)对输入变量中的类型进行检验,对于缺失值比例大于30%的变量不予考虑;对于缺失值比例不超过30%的变量使用特定方法填充缺失值;(3)对分类变量进行热编码处理。进一步,第二步的执行步骤如下:设第一步得到的数据中包含有m个样本,且每个样本维度为n,X={X1,X2,X3,…Xn}={x11,x12,x13,…,x1n;x21,x22,x23,…,x2n;…;xm1,xm1,xm3,…,xmn},xij为第i个样本中第j个维度;(1)采用Min-max归一化方法进行归一化,得到标准化矩阵Z;(2)计算标准化矩阵Z的协方差矩阵(3)求解协方差矩阵R的特征值和特征向量;(4)选取最大的k个特征值,并将其对应的k个特征向量作为行向量组成特征向量矩阵P;其中,k<n;(5)用Z与P相乘,得到主成分矩阵为Y=PZ。进一步,第三步的执行步骤如下:(1)输入训练集T={Y,C}={(Y1,C1),…,(Yi,Ci),…,(Ym,Cm)},其中Y为经过PCA处理得到的主成分矩阵,m为样本数,Ci表示对应Yi的事故持续时间的等级;(2)调用弱分类器,并初始化迭代次数a=1;(3)为输入训练集中的每个样本分配权重D1=(w11,w12,w13,…,w1m),并且初始状态设定各个样本的权重相等,即i=1,2,3,…,m,m为样本的个数;(4)使用分配权重后的输入训练集迭代训练弱分类器;(5)计算第a次迭代训练得到的弱分类器Ga(·)在当前权重分布下的错误率其中Ga(Yi)为Ga(·)的预测输出;(6)根据错误率ea计算弱分类器Ga(·)在最终强分类器中所占的权重(7)第a+1次迭代训练时样本的权重Da+1=(wa+1,1,wa+1,2,wa+1,3,…,wa+1,m),其中(8)错误率ea大于设定阈值或达到最大迭代次数时,停止迭代,组合全部弱分类器得到强分类器该强分类器即为隧道交通事故持续时间的预测模型,其中,A为弱分类器数量。本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:本专利技术是一种基于PCA和Adaboost的隧道交通事故持续时间预测方法,经过原始数据地导入及预处理阶段,使用PCA方法提取特征向量,并使用弱分类器对隧道交通事故持续时间进行分类,之后使用Adaboost迭代框架将弱分类器组合成强分类器,从而提高了持续时间等级的预测转确率。附图说明图1是本专利技术所述隧道交通事故预测方法的流程示意图。具体实施方式以下结合具体实施实例和附图对本专利技术的技术方案作进一步阐述。一种基于PCA和Adaboost的隧道交通事故持续时间预测方法,如图1所示,包括如下步骤:第一步,从某省的高速公路事件管理中心数据库提取隧道交通事故持续时间相关数据,并对数据集中的持续时间划分等级和输入变量进行处理;(1)根据事故持续时间的长短划分为短、中、长和特长四个等级;(2)对输入变量中的类型进行检验,对于缺失值比例大于30%的变量不予考虑;对于缺失值比例不超过30%的变量使用特定方法填充缺失值;(3)对分类变量进行热编码处理。第二步,使用PAC主成分分析法对输入变量原始数据相关矩阵内部结构关系的分析和计算,生成一系列互不相关的新输入变量;(1)对输入变量进行去归一化处理;(2)计算标准化矩阵的协方差矩阵;(3)计算协方差矩阵的特征值和特征向量;(4)选择若干个数的特征值及相应的特征向量;(5)根据特征向量矩阵和原输入变量计算得到主成分矩阵。第三步,将所得的主成分矩阵和相对应的结果矩阵,即事故持续时间的等级,代入Adaboost模型及逆行训练,最终得到隧道事故持续时间的预测模型。(1)调用弱分类器,并确定弱分类器的迭代次数;(2)初始化每个样本的权重进行构建第一个弱分类器,并得到该训练后的错误率;(3)基于该错误率更新下一次迭代过程中的权重,并构建下一本文档来自技高网
...

【技术保护点】
1.一种基于PCA和Adaboost的隧道交通事故持续时间预测方法,其特征在于,包括如下步骤:/n第一步:从高速公路事件管理中心数据库提取历史隧道交通事故数据,根据事故持续时间划分为短、中、长和特长四个等级,并对数据进行缺失值检验和筛选;/n第二步:使用PAC主成分分析法对第一步得到的数据进行的分析处理;/n第三步:将第二步所得的主成分矩阵和相对应的事故持续时间的等级,代入Adaboost模型及逆行训练,最终得到隧道交通事故持续时间的预测模型。/n

【技术特征摘要】
1.一种基于PCA和Adaboost的隧道交通事故持续时间预测方法,其特征在于,包括如下步骤:
第一步:从高速公路事件管理中心数据库提取历史隧道交通事故数据,根据事故持续时间划分为短、中、长和特长四个等级,并对数据进行缺失值检验和筛选;
第二步:使用PAC主成分分析法对第一步得到的数据进行的分析处理;
第三步:将第二步所得的主成分矩阵和相对应的事故持续时间的等级,代入Adaboost模型及逆行训练,最终得到隧道交通事故持续时间的预测模型。


2.根据权利要求1所述的一种基于PCA和Adaboost的隧道持续时间预测方法,其特征在于,第一步的执行步骤如下:
(1)根据事故持续时间的长短划分为短、中、长和特长四个等级;
(2)对输入变量中的类型进行检验,对于缺失值比例大于30%的变量不予考虑;对于缺失值比例不超过30%的变量使用特定方法填充缺失值;
(3)对分类变量进行热编码处理。


3.根据权利要求1所述的一种基于PCA和Adaboost的隧道持续时间预测方法,其特征在于,第二步的执行步骤如下:
设第一步得到的数据中包含有m个样本,且每个样本维度为n,X={X1,X2,X3,...Xn,}={x11,x12,x13,...,x1n;x21,x22,x23,...,x2n;...;xm1,xm2,xm3,...,xmn},xij为第i个样本中第j个维度;
(1)采用Min-max归一化方法进行归一化,得到标准化矩阵Z;

【专利技术属性】
技术研发人员:杨顺新米梦阳赵凯
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1