【技术实现步骤摘要】
一种动态短时路网交通状态预测模型及预测方法
[0001]本专利技术属于交通大数据技术与应用领域,涉及短时路网交通状态预测,具体是一种基于深度确定性策略梯度算法优化的动态短时路网交通状态预测模型。
技术介绍
[0002]短时路网交通状态预测无论在智能交通系统还是在面向未来的智能车路协同系统中都具有重要的现实作用,它是进行在途路径诱导、路径决策等其他实时交通服务的前提。因此,短时路网交通状态预测精度的高低影响着很多基础交通服务的质量。
[0003]近年来,随着交通检测器的多样化发展和数据存储设备的提升,交通数据采集技术及其相关应用研究得到了长足进步。与之相应地,以交通大数据为驱动的短时路网交通状态预测算法亦层出不穷,主要包括了以K最近邻、支持向量机、决策树等为代表的浅层学习(传统机器学习)模型,和以长短时记忆网络、卷积神经网络及二者组合建模为代表的深度学习模型。
[0004]然而,上述这两类模型往往在利用充沛的历史数据训练和构建,即确定模型的主要架构和超参数,不再随着或只在一定周期地处在应用过程中的模型进行调整。这种“静态”和“半静态”的模型只能更好地拟合历史数据及规律,而不能够快速适应实时交通状态的突发性和随机性变化,并及时做出相应调整。
技术实现思路
[0005]为解决上述技术问题,本专利技术提供了一种动态短时路网交通状态预测模型及预测方法,
[0006]本专利技术完整的技术方案包括:
[0007]一种基于深度确定性策略梯度算法优化的动态短时路网交通状态预测方法,包括如 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度确定性策略梯度算法优化的动态短时路网交通状态预测方法,其特征在于,包括如下步骤:步骤一:数据的收集与处理(1)采集车载的GPS装置在指定时间间隔内向上级系统上传的时间、位置及车辆瞬时速度信息,(2)计算得到时刻t某一路段l上车辆速度的平均值v(t),t时刻及t以前时刻的平均值均为已知,(3)利用上述方法得到由路段l1,l2,
…
,l
n
构成的路段网上相对应的平均速度值集合V
t
=(v1(t),v2(t),
…
,v
n
(t)),n为路段的数量;(4)利用时刻t,及时刻t之前的δ
‑
1个时刻的采集数据计算并聚合成时空矩阵X
t
,X
t
表示时刻t的交通状态,X
t
如公示(1)所示:(5)对X
t
进行处理,对其中每个单一的基准状态点,计算产生基准点的趋势向量并以向量的方式定义交通状态单元X
′
t
,即其中步骤二:构建基于KNN的静态预测模型(1)分别采用欧式距离对基准状态点V
t
间的距离ED
i
进行度量,以及采用余弦距离对趋势向量间的距离CD
i
进行度量,其表达式为:进行度量,其表达式为:式中,为第i个已知的基准状态点数据,为第i个已知的趋势向量,式中带脚标h的表示为采集的样本中已知的历史数据;并以此构建用来度量状态单元相似性的状态距离SD
i
:其中,u=1,2,
…
,M,M为历史样本数,α为平衡欧式距离和余弦距离的系数,取值范围为[0,1];(2)依据相似性度量结果选择K个近邻计算待预测样本X
t+1
和所有已知的历史样本间的状态距离,将距离最小的K个历史样本V
h,1
,V
h,2
,
…
,V
h,K
作为近邻;(3)计算待预测样本的预测值使用增量预测的方法计算预测值对近邻的标签值,即状态距离SD
i
依据距离大小进行高斯加权,
对于X
t
,记其未来在(t+1)时刻状态点X
t+1
为y
t
,所述增量为近邻的y
h,j
与V
h,j
间的差值,对于第j个近邻(j=1,2,
…
,K)其表达式为:
△
y
h,j
=y
h,j
‑
V
h,j
ꢀꢀꢀꢀ
(6)即在预测窗口内交通状态变化量;其次,再通过高斯加权计算未来在(t+1)时刻的预测值为式中,权重2.根据权利要求1所述的一种基于深度确定性策略梯度算法优化的动态短时路网交通状态预测方法,其特征在于,所述步骤二:构建基于KNN的静态预测模型中,还包括:(4)模型参数粗标定利用所采集的真实数据的网格化搜索实验,对该基于KNN的静态预测模型中未确定的参数δ、K和α进行标定,具体为:首先,建立预测效果的评价体系,包括均方根误差MAE和绝对值百分比误差MAPE,得到:首先,建立预测效果的评价体系,包括均方根误差MAE和绝对值百分比误差MAPE,得到:其中,n为路段的数量,N为实验中待预测样本数,分别是第i个待预测样本的预测值和真实值;其次,离散化待标定参数取值范围,并逐一取不同的参数组合进行实验,记录实验结果;选取实验结果最佳的参数组合作为模型参数的标定值。3.根据权利要求2所述的一种基于深度确定性策略梯度算法优化的动态短时路网交通状态预测方法,其特征在于,还包括步骤三:基于DDPG算法动态优化参数α。具体包括:做出如下定义:状态S
t
:包括观测到的外界路网交通状态V
t
和预测模型自身状态P
t
,即S
t
={V
t
,P
t
},其中V
t
为在t时刻观测到的状态单元,P
t
为t时刻预测模型已知最近一次预测的残差;动作a
t
:指决策中选取的参数α值,与KNN模型参数粗标定时不同,α取[0,1]内的连续值,不作离散化处理。即时奖励r
t
:借助粗标定的静态KNN预测模型,定义在执行动作a
t
后的平均指标提升率作为奖励函数,当执行动作a
t
取得的指标均小于粗标定模型取得的指标,则称采取动作a
t
是一次有效的优化;反之,则称采取动作a
t
是一次无效的优化,当采取动作a
t
取得的指标有大
于粗标定模型取得的指标的情况,但又不超过其数值的1%时,称之为不完全有效。据此,定义奖励函数r
t
为:其中,MAE
t
、MAE
′
t
分别为对状态单元X
t
进行预测时静态粗标定模型和选择动作a
t
...
【专利技术属性】
技术研发人员:任毅龙,姜涵,于海洋,晁文杰,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。