基于层次聚类和分层注意力机制的交通速度预测方法技术

技术编号：25441333 阅读：11 留言：0更新日期：2020-08-28 22:28

基于层次聚类和分层注意力机制的交通速度预测方法，首先采用层次聚类方法将历史交通速度数据进行划分和聚类；然后，设计基于分层注意力机制的神经网络模型，该模型充分考虑了交通速度数据的时空关联性，有效利用分层注意力机制来捕捉时空特征，并对不同路段和不同历史时间段赋予不同的影响权重。最后，选择合适的簇数据来训练和测试神经网络模型，训练好的模型可以预测目标路段未来若干个时间段的平均交通速度。本发明专利技术方法采用了层次聚类方法对历史数据进行了划分和聚类，簇内数据具有较高相似度，更适合于神经网络模型的训练；同时，采用了分层注意力机制来设计神经网络模型，有效地捕捉了交通速度数据的时空特性，更好地提高了预测准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于层次聚类和分层注意力机制的交通速度预测方法
本专利技术涉及智能交通的交通速度预测，可以预测未来若干个时间段的路段平均速度，交通速度预测可以用于路径规划，也可以用于交通控制、交通诱导和交通管理。
技术介绍
随着交通环境的日益复杂、道路交通车流量的急剧增加，城市道路交通拥堵问题愈加严重。在智能交通系统(IntelligentTransportationSystem，ITS)中，交通速度预测具有重要意义，如果能有效地预测未来一段时间内各个路段的交通速度，便可以提前进行有效的交通管控，能大大缓解甚至避免交通拥堵。在智能交通系统中，交通速度是描述交通流的基本参数，交通速度预测是指预测未来一段时间内通过某条路段的平均速度。交通速度预测方法的研究，不仅有利于旅行者进行路径规划，也有利于交通管理者进行交通信号控制、交通诱导和交通管理。常用的交通速度预测方法主要有自回归差分移动平均模型(AutoregressiveIntegratedMovingAverageModel,ARIMA)、卡尔曼滤波、贝叶斯模型(Bayesian)、支持向量机(SupportVectorMachine,SVM)等。这些方法虽然易于实现，操作简单，但没有充分利用交通流的周期性和时序性，受数据扰动影响较大。近些年，深度学习的迅速发展为交通速度预测提供了更多有效的方法。循环神经网络(RecurrentNeuralNetwork,RNN)具有更优的序列数据处理能力，可以对交通速度的时间依赖性进行分析，获得较优的预测精度。卷积神经网络(Convo...

【技术保护点】
1.基于层次聚类和分层注意力机制的交通速度预测方法，包括如下步骤：/n(1)获取目标路段及其上下游路段的历史交通速度数据；根据路段中安装的电警卡口装置，采集并记录过车数据；在过车数据的基础上，根据同一辆车在上下游出现的时间差和路段距离，计算各个时间段的路段平均速度；/n(2)数据预处理；由于检测器故障或数据传输失败，采集的数据存在缺失或异常，所以需要进行数据预处理，修正这些异常数据；/n(3)对目标路段的历史交通速度数据进行层次聚类；层次聚类方法的具体过程如下：/ns31.按天划分目标路段的历史交通速度数据；将预处理后的交通速度数据按天进行划分，形成若干个初始簇，所述的初始簇就是层次聚类的底层节点；/ns32.初始化阈值θ和最大相似度SIM_MAX；阈值θ用于判断算法是否结束，根据经验值设定阈值θ的初值；最大相似度SIM_MAX的初值为相对较大的值，远大于阈值θ；/ns33.采用自下而上的聚合策略进行层次聚类；如果当前SIM_MAX大于或等于θ，则采用皮尔森相关系数计算任意两个簇的相似度，并比较这些相似度值，选取相似度最大的两个簇将其合并为一个簇，同时将SIM_MAX的值更新为当前的最...

【技术特征摘要】
1.基于层次聚类和分层注意力机制的交通速度预测方法，包括如下步骤：
(1)获取目标路段及其上下游路段的历史交通速度数据；根据路段中安装的电警卡口装置，采集并记录过车数据；在过车数据的基础上，根据同一辆车在上下游出现的时间差和路段距离，计算各个时间段的路段平均速度；
(2)数据预处理；由于检测器故障或数据传输失败，采集的数据存在缺失或异常，所以需要进行数据预处理，修正这些异常数据；
(3)对目标路段的历史交通速度数据进行层次聚类；层次聚类方法的具体过程如下：
s31.按天划分目标路段的历史交通速度数据；将预处理后的交通速度数据按天进行划分，形成若干个初始簇，所述的初始簇就是层次聚类的底层节点；
s32.初始化阈值θ和最大相似度SIM_MAX；阈值θ用于判断算法是否结束，根据经验值设定阈值θ的初值；最大相似度SIM_MAX的初值为相对较大的值，远大于阈值θ；
s33.采用自下而上的聚合策略进行层次聚类；如果当前SIM_MAX大于或等于θ，则采用皮尔森相关系数计算任意两个簇的相似度，并比较这些相似度值，选取相似度最大的两个簇将其合并为一个簇，同时将SIM_MAX的值更新为当前的最大相似度；
s34.重复步骤s33，直至当前SIM_MAX小于阈值θ，最后获得M个簇的交通速度数据，其中M为簇的个数；
(4)设计基于分层注意力机制的神经网络模型；基于分层注意力机制的神经网络模型是以Seq2Seq模型为基础，包括Encoder层、Decoder层和全连接层；在Encoder层，将上下游路段的历史交通速度数据作为输入，利用空间注意力机制来捕捉交通速度数据的空间特征，并通过一个双向LSTM网络来确定每条上下游路段的影响权重；在Decoder层，将Encoder层的输出和目标路段的历史交通速度数据作为输入，利用时间注意力机制来挖掘交通速度数据的时间特征，并通过另外一个双向LSTM网络来确定过去若干个时间段的影响权重；最后，由全连接层计算得到预测结果；
Encoder层主要用于提取上下游路段对目标路段未来交通速度的影响程度，Encoder层的输入为上下游路段的历史交通速度数据S；其中，i取值范围为[1,n]，n表示选取的上下游路段数，l表示时间段的个数，t表示某个时间段，而l与t表示过去的某个时间段，如t-l+1表示t时间段之前的第(l-1)个时间段；S表示所选取的n条上下游路段在过去l个时间段的平均交通速度矩阵，Si表示路段i在过去l个时间段的平均交通速度向量，表示路段i在j时间段的平均交通速度，j取值范围为[t-l+1,t]；
Encoder层中的空间注意力机制的内部状态变化为：

其中，公式(1)用于计算各个上下游路段在l个时间段的空间权重，表示路段i在t时间段的空间权重，i取值范围为[1,n]，t时间段的空间权重向量为m是隐藏层尺寸，是元状态，是隐藏层状态，Si是输入的上下游路段i的历史交通速度数据，是Encoder层中上一次迭代的隐藏层状态、元状态和路段i的交通速度数据的拼接，和是权重项，和是偏置项，且tanh(·)函数是双曲正切函数，为激活函数；公式(2)是Softmax函数，即归一化指数函数，用于空间权重的归一化计算，是路段i在t时间段的归一化空间权重，归一化t时间段的空间权重向量为Encoder层在迭代运算的过程中生成l个时间段的空间权重向量，依次为et-l+1,et-l+2,…,et，相应的归一化空间权重向量为αt-l+1,αt-l+2,…,αt，运算过程总共迭代l次，第一次生成et-l+1和αt-l+1，第二次生成et-l+2和αt-l+2，以此类推，第l次生成et和αt；随后，根据t时间段的空间权重向量，输入的历史交通速度数据被加权转换为：

因此，向量包含了各个上下游路段的空间特征信息，类似地计算出其它时间段加权转换后的历史交通速度数据，即
Encoder层中的双向LSTM网络的内部状态变化为：

he,t＝We,tht+be,t(7)
其中，和分别表示前向LSTM网络的隐藏层状态和权重项，和分别表示反向LSTM网络的隐藏层状态和权重项，将两者拼接则得到了双向LSTM的隐藏层状态是对ht的线性变换，用于计算公式(1)的空间权重，是权重项，是偏置项；Encoder层中的双向LSTM网络的输入为加权转换后的历史交通速度数据，即双向LSTM网络将进行l次迭代，每次迭代输出其隐藏层状态，分别为ht-l+1,ht-l+2,…,ht，因此，Encoder层输出的隐藏层状态包含加权转换后的历史交通速度数据；
Decoder层的输入为Encoder层输出的l隐藏层状态和目标路段的历史交通速度数据，分别为ht-l+1,ht-l+2,…,ht和y，其中，y＝(yt-l+1,yt-l+2,…,yt)，yj是目标路段在j时间段的平均交通速度，j取值范围为[...

【专利技术属性】
技术研发人员：刘端阳，徐鑫博，唐龙峰，范鑫烨，陈雪，沈国江，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人