基于动态时空图卷积注意力模型的交通预测方法及装置制造方法及图纸

技术编号:30318818 阅读:13 留言:0更新日期:2021-10-09 23:23
本发明专利技术公开了一种基于动态时空图卷积注意力模型的交通预测方法及装置,首先,将道路交通网络建模为图结构,利用图结构和图信号对动态时空图卷积注意力模型进行建模,通过所述动态时空图卷积注意力模型的编码器单元,捕获不同时刻传感器节点间的动态空间相关性,捕获历史时刻步长的时间相关性以及多步预测间的时间相关性,以及得到包含每个预测步长的隐藏状态;解码器单元接收每个预测步长的隐藏状态,采用调度采样策略,得到未来一小时所有传感器节点记录速度值的预测结果。实验证明,本发明专利技术方法能有效得到未来一小时的交通预测结果,本发明专利技术方法所述模型超越了SOTA。本发明专利技术方法所述模型超越了SOTA。本发明专利技术方法所述模型超越了SOTA。

【技术实现步骤摘要】
基于动态时空图卷积注意力模型的交通预测方法及装置


[0001]本专利技术属于智能交通领域,具体涉及一种基于动态时空图卷积注意力模型的交通预测方法及装置。

技术介绍

[0002]交通状态预测是智能交通领域(Intelligent Transportation System,ITS)中一项较为关键的任务,交通流量及速度的实时准确预测对于缓解交通压力、协调交通运输管理及智慧城市建设具有重要的作用。交通数据来源于道路边缘设置的传感器,记录周期通常为5mins,由于道路的连通性及数据记录固有的序列相关性,交通数据是典型的时空数据。早期的交通状态预测方法主要是模型驱动model

driven的,例如基于线性回归的方法、基于滑动窗口的自回归算法及卡尔曼滤波算法等。然而这些算法通常独立地在单个交通传感器节点上进行单步预测,忽略了交通节点间的空间依赖性,也无法进行中长时段(30

60min)的多步预测。
[0003]随着机器学习和深度学习的发展以及硬件计算资源的持续升级,一些数据驱动data

driven的方法逐渐应用于计算机视觉、自然语言处理、语音识别及时空序列预测等领域。在深度学习应用的初期阶段,一些研究者开始将基于CNN(Convolution Neural Network卷积神经网络)的模型和基于RNN(Recurrent Neural Network循环神经网络)的模型用于交通状态预测建模,然而由于CNN受限于只能针对栅格数据提取空间特征,而交通传感器并不能采用规则的栅格数据来对其空间依赖性建模。
[0004]GNN(Graph Neural Network图神经网络)擅长在非欧式空间提取数据特征,其可以应用于社交网络、分子结构、道路网络等不规则图结构的各个领域,随着图网络的提出和发展,越来越多的研究者将交通数据建模为图数据,将传感器视作图上的节点,传感器间的连通性视作边。在此我首先介绍一下前人的研究,一些模型例如DCRNN(Diffusion Convolution Recurrent Neural Network Data

Driven Network扩散卷积递归神经网络数据驱动网络)采用了扩散卷积及随机游走(Random Walk)策略来捕捉节点间的空间相关性;STGCN(Spatial

Temporal Graph Convolution Network时空图卷积网络)采用图卷积神经网络(Graph Convolution Network,GCN)对空间相关性建模并利用多尺度一维卷积网络(1D

CNN)来建模时间相关性;GraphWaveNet采用了自适应邻接矩阵来建模交通数据中隐藏的空间依赖性;MRA

BGCN(Multi

Range Attentive Bicomponent Graph Convolution Network多距离注意双分量图卷积网络)对图节点间边的交互关系进行建模,同时考虑到了边与边间的流量连通性和竞争性;DSTGCN采用张量矩阵估计器对拉普拉斯矩阵进行实时分解,以此来建模动态空间相关性;STGAT(Spatial

Temporal Graph Attention Networks)采用了图注意力网络(Graph Attention Network)来聚合节点特征并采用一维门控卷积网络(1D

Gated Temporal Convolution Network)捕捉序列相关性,STGAT为北京交通大学于2020年7月发表的文章,是截止目前在两个公开数据集METR

LA和PEMS

BAY上的SOTA(state

of

the

art)。
[0005]然而上述的基于GCN的模型及其改进大都没有考虑动态的空间相关性,即使最新的研究中已经开始采用自适应邻接矩阵来建模隐藏的空间依赖性(无法根据传感器间距离及连通性来建模得到的),但这个自适应矩阵在所有历史步长下是共享参数的即会导致训练过程中空间相关性维持不变。然而在真实的路网环境中,时空相关性是非平稳的,同一路段下较远相邻节点的相关性会随着时间推移才逐渐增大,不同路段下具有连通性节点的相关性会随着时间推移不断改变。因此,之前研究者所提出的模型不足以对动态空间相关性建模,尽管DSTGCN的作者将张量分解操作加入了端到端的学习框架,然而张量实时分解不可避免的会带来较高的计算复杂度,并且该模型仍然依赖于预定义的邻接矩阵。

技术实现思路

[0006]本专利技术针对上述问题,提供了一种基于动态时空图卷积注意力模型的交通预测方法及装置,首先在不同时间步分别随机初始化所有节点的嵌入向量,通过向量点积获得节点间的隐藏注意力分数,从而自适应的捕获动态空间依赖,以一个较低复杂度来精确的捕捉交通数据中非平稳的时空关系。
[0007]本专利技术的技术方案如下:
[0008]一种基于动态时空图卷积注意力模型的交通预测方法,包括如下步骤:
[0009](1)将道路交通网络建模为图结构,图的节点表示传感器,图的边表示传感器间的连通性,传感器所记录的历史速度数据作为图信号,图信号中包括传感器节点输入数据的特征维度;
[0010](2)利用(1)得到的图结构和图信号,对动态时空图卷积注意力模型进行建模,所述动态时空图卷积注意力模型建模包括序列时间相关性建模和动态空间相关性建模,所述动态时空图卷积注意力模型采用编解码器结构,通过所述动态时空图卷积注意力模型的编码器单元,捕获不同时刻传感器节点间的动态空间相关性,捕获历史时刻步长的时间相关性以及多步预测间的时间相关性,以及得到包含每个预测步长的隐藏状态;
[0011](3)将(2)得到的每个预测步长的隐藏状态输入解码器单元,采用调度采样策略,得到未来一小时所有传感器节点记录速度值的预测结果。
[0012]进一步的,所述动态时空图卷积注意力模型的相关性建模包括空间相关性建模和时间相关性建模两部分,所述空间相关性建模针对图结构中两个节点在某个历史时间步随机初始化两个嵌入向量,利用两个嵌入向量的点积求得这两个节点的空间相关性,然后通过SoftMax归一化指数函数产生时变自适应矩阵,所述时变自适应矩阵可自适应的学习节点在不同时间步长隐藏的空间相关性。
[0013]进一步的,所述空间相关性建模还包括预定义空间依赖性建模,所述预定义空间依赖性建模利用动态聚合邻居节点来更新隐层向量,所述隐层向量动态公式为:
[0014][0015]其中,为时段t节点在l+1层的隐层向量,σ是非线性激活函数,A∈R
N
×
N
表示图卷积网络中的邻接矩阵,I表示节点间的自连接关系,D表示度矩阵,表示前向扩散转
移矩阵,表示反向扩散转移矩阵,K是扩散步数,C
(t)
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态时空图卷积注意力模型的交通预测方法,其特征在于,包括如下步骤:(1)将道路交通网络建模为图结构,图的节点表示传感器,图的边表示传感器间的连通性,传感器所记录的历史速度数据作为图信号,图信号中包括传感器节点输入数据的特征维度;(2)利用(1)得到的图结构和图信号,对动态时空图卷积注意力模型进行建模,所述动态时空图卷积注意力模型建模包括序列时间相关性建模和动态空间相关性建模,所述动态时空图卷积注意力模型采用编解码器结构,通过所述动态时空图卷积注意力模型的编码器单元,捕获不同时刻传感器节点间的动态空间相关性,捕获历史时刻步长的时间相关性以及多步预测间的时间相关性,以及得到包含每个预测步长的隐藏状态;(3)将(2)得到的每个预测步长的隐藏状态输入解码器单元,采用调度采样策略,得到未来一小时所有传感器节点记录速度值的预测结果。2.根据权利要求1所述的一种基于动态时空图卷积注意力模型的交通预测方法,其特征在于,所述动态时空图卷积注意力模型的相关性建模包括空间相关性建模和时间相关性建模两部分,所述空间相关性建模针对图结构中两个节点在某个历史时间步随机初始化两个嵌入向量,利用两个嵌入向量的点积求得这两个节点的空间相关性,然后通过SoftMax归一化指数函数产生时变自适应矩阵,所述时变自适应矩阵可自适应的学习节点在不同时间步长隐藏的空间相关性。3.根据权利要求2所述的一种基于动态时空图卷积注意力模型的交通预测方法,其特征在于,所述空间相关性建模还包括预定义空间依赖性建模,所述预定义空间依赖性建模利用动态聚合邻居节点来更新隐层向量,所述隐层向量动态公式为:其中,为时段t节点在l+1层的隐层向量,σ是非线性激活函数,A∈R
N
×
N
表示图卷积网络中的邻接矩阵,I表示节点间的自连接关系,D表示度矩阵,表示前向扩散转移矩阵,表示反向扩散转移矩阵,K是扩散步数,C
(t)
为t时段的自适应矩阵,W
k1
、W
k2
、W
k3
、W
(t)
为可学习的参数矩阵。4.根据权利要求3所述的一种基于动态时空图卷积注意力模型的交通预测方法,其特征在于,所述动态时空图卷积注意力模型包括动态图卷积注意力网络(DGCAN)、门控循环单元(GRU)和融合注意力模块(Fusion Attention),将所述动态图卷积注意力网络嵌入门控循环单元得到DGAC

GRU模块,所述DGAC

GRU模块包括两层,均输出隐层向量,将第一层和第二层输出的隐层向量进行拼接,将拼接结果作为融合注意力模块的输入,所述融合注意力模块包括全局注意力(Global Attention)单元和局部注意力(Local Attention)单元,所述全局注意力单元接收过去12个...

【专利技术属性】
技术研发人员:张霆廷李睿
申请(专利权)人:哈尔滨工业大学深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1