【技术实现步骤摘要】
基于层次聚类和分层注意力机制的交通速度预测方法
本专利技术涉及智能交通的交通速度预测,可以预测未来若干个时间段的路段平均速度,交通速度预测可以用于路径规划,也可以用于交通控制、交通诱导和交通管理。
技术介绍
随着交通环境的日益复杂、道路交通车流量的急剧增加,城市道路交通拥堵问题愈加严重。在智能交通系统(IntelligentTransportationSystem,ITS)中,交通速度预测具有重要意义,如果能有效地预测未来一段时间内各个路段的交通速度,便可以提前进行有效的交通管控,能大大缓解甚至避免交通拥堵。在智能交通系统中,交通速度是描述交通流的基本参数,交通速度预测是指预测未来一段时间内通过某条路段的平均速度。交通速度预测方法的研究,不仅有利于旅行者进行路径规划,也有利于交通管理者进行交通信号控制、交通诱导和交通管理。常用的交通速度预测方法主要有自回归差分移动平均模型(AutoregressiveIntegratedMovingAverageModel,ARIMA)、卡尔曼滤波、贝叶斯模型(Bayesian)、支持向量机(SupportVectorMachine,SVM)等。这些方法虽然易于实现,操作简单,但没有充分利用交通流的周期性和时序性,受数据扰动影响较大。近些年,深度学习的迅速发展为交通速度预测提供了更多有效的方法。循环神经网络(RecurrentNeuralNetwork,RNN)具有更优的序列数据处理能力,可以对交通速度的时间依赖性进行分析,获得较优的预测精度。卷积神经网络(Convo ...
【技术保护点】
1.基于层次聚类和分层注意力机制的交通速度预测方法,包括如下步骤:/n(1)获取目标路段及其上下游路段的历史交通速度数据;根据路段中安装的电警卡口装置,采集并记录过车数据;在过车数据的基础上,根据同一辆车在上下游出现的时间差和路段距离,计算各个时间段的路段平均速度;/n(2)数据预处理;由于检测器故障或数据传输失败,采集的数据存在缺失或异常,所以需要进行数据预处理,修正这些异常数据;/n(3)对目标路段的历史交通速度数据进行层次聚类;层次聚类方法的具体过程如下:/ns31.按天划分目标路段的历史交通速度数据;将预处理后的交通速度数据按天进行划分,形成若干个初始簇,所述的初始簇就是层次聚类的底层节点;/ns32.初始化阈值θ和最大相似度SIM_MAX;阈值θ用于判断算法是否结束,根据经验值设定阈值θ的初值;最大相似度SIM_MAX的初值为相对较大的值,远大于阈值θ;/ns33.采用自下而上的聚合策略进行层次聚类;如果当前SIM_MAX大于或等于θ,则采用皮尔森相关系数计算任意两个簇的相似度,并比较这些相似度值,选取相似度最大的两个簇将其合并为一个簇,同时将SIM_MAX的值更新为当前的最 ...
【技术特征摘要】
1.基于层次聚类和分层注意力机制的交通速度预测方法,包括如下步骤:
(1)获取目标路段及其上下游路段的历史交通速度数据;根据路段中安装的电警卡口装置,采集并记录过车数据;在过车数据的基础上,根据同一辆车在上下游出现的时间差和路段距离,计算各个时间段的路段平均速度;
(2)数据预处理;由于检测器故障或数据传输失败,采集的数据存在缺失或异常,所以需要进行数据预处理,修正这些异常数据;
(3)对目标路段的历史交通速度数据进行层次聚类;层次聚类方法的具体过程如下:
s31.按天划分目标路段的历史交通速度数据;将预处理后的交通速度数据按天进行划分,形成若干个初始簇,所述的初始簇就是层次聚类的底层节点;
s32.初始化阈值θ和最大相似度SIM_MAX;阈值θ用于判断算法是否结束,根据经验值设定阈值θ的初值;最大相似度SIM_MAX的初值为相对较大的值,远大于阈值θ;
s33.采用自下而上的聚合策略进行层次聚类;如果当前SIM_MAX大于或等于θ,则采用皮尔森相关系数计算任意两个簇的相似度,并比较这些相似度值,选取相似度最大的两个簇将其合并为一个簇,同时将SIM_MAX的值更新为当前的最大相似度;
s34.重复步骤s33,直至当前SIM_MAX小于阈值θ,最后获得M个簇的交通速度数据,其中M为簇的个数;
(4)设计基于分层注意力机制的神经网络模型;基于分层注意力机制的神经网络模型是以Seq2Seq模型为基础,包括Encoder层、Decoder层和全连接层;在Encoder层,将上下游路段的历史交通速度数据作为输入,利用空间注意力机制来捕捉交通速度数据的空间特征,并通过一个双向LSTM网络来确定每条上下游路段的影响权重;在Decoder层,将Encoder层的输出和目标路段的历史交通速度数据作为输入,利用时间注意力机制来挖掘交通速度数据的时间特征,并通过另外一个双向LSTM网络来确定过去若干个时间段的影响权重;最后,由全连接层计算得到预测结果;
Encoder层主要用于提取上下游路段对目标路段未来交通速度的影响程度,Encoder层的输入为上下游路段的历史交通速度数据S;其中,i取值范围为[1,n],n表示选取的上下游路段数,l表示时间段的个数,t表示某个时间段,而l与t表示过去的某个时间段,如t-l+1表示t时间段之前的第(l-1)个时间段;S表示所选取的n条上下游路段在过去l个时间段的平均交通速度矩阵,Si表示路段i在过去l个时间段的平均交通速度向量,表示路段i在j时间段的平均交通速度,j取值范围为[t-l+1,t];
Encoder层中的空间注意力机制的内部状态变化为:
其中,公式(1)用于计算各个上下游路段在l个时间段的空间权重,表示路段i在t时间段的空间权重,i取值范围为[1,n],t时间段的空间权重向量为m是隐藏层尺寸,是元状态,是隐藏层状态,Si是输入的上下游路段i的历史交通速度数据,是Encoder层中上一次迭代的隐藏层状态、元状态和路段i的交通速度数据的拼接,和是权重项,和是偏置项,且tanh(·)函数是双曲正切函数,为激活函数;公式(2)是Softmax函数,即归一化指数函数,用于空间权重的归一化计算,是路段i在t时间段的归一化空间权重,归一化t时间段的空间权重向量为Encoder层在迭代运算的过程中生成l个时间段的空间权重向量,依次为et-l+1,et-l+2,…,et,相应的归一化空间权重向量为αt-l+1,αt-l+2,…,αt,运算过程总共迭代l次,第一次生成et-l+1和αt-l+1,第二次生成et-l+2和αt-l+2,以此类推,第l次生成et和αt;随后,根据t时间段的空间权重向量,输入的历史交通速度数据被加权转换为:
因此,向量包含了各个上下游路段的空间特征信息,类似地计算出其它时间段加权转换后的历史交通速度数据,即
Encoder层中的双向LSTM网络的内部状态变化为:
he,t=We,tht+be,t(7)
其中,和分别表示前向LSTM网络的隐藏层状态和权重项,和分别表示反向LSTM网络的隐藏层状态和权重项,将两者拼接则得到了双向LSTM的隐藏层状态是对ht的线性变换,用于计算公式(1)的空间权重,是权重项,是偏置项;Encoder层中的双向LSTM网络的输入为加权转换后的历史交通速度数据,即双向LSTM网络将进行l次迭代,每次迭代输出其隐藏层状态,分别为ht-l+1,ht-l+2,…,ht,因此,Encoder层输出的隐藏层状态包含加权转换后的历史交通速度数据;
Decoder层的输入为Encoder层输出的l隐藏层状态和目标路段的历史交通速度数据,分别为ht-l+1,ht-l+2,…,ht和y,其中,y=(yt-l+1,yt-l+2,…,yt),yj是目标路段在j时间段的平均交通速度,j取值范围为[...
【专利技术属性】
技术研发人员:刘端阳,徐鑫博,唐龙峰,范鑫烨,陈雪,沈国江,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。