本发明专利技术公开了一种基于残差校准网络与多尺度融合机制的交通流量预测方法,其特征在于,所述方法包括:获取交通流量数据和外部特征数据;对交通流量数据和外部特征数据进行预处理,得到待测交通图像数据;将待测交通图像数据输入至预先训练好的MS
【技术实现步骤摘要】
一种基于残差校准网络与多尺度融合机制的交通流量预测方法
[0001]本专利技术涉及一种基于残差校准网络与多尺度融合机制的交通流量预测方法,属于交通流 量预测
技术介绍
[0002]在智能交通和科学研究中,交通流量数据是以时空排序的多组随机变量,通常来说,它 是在某个特定空间区域内,相等间隔时间段内依照一定的采样频率对某种潜在过程进行观测 的结果。交通流量数据实际上反映的是某个或者某些出行变量随着时空不断变化的趋势,而 交通流量预测方法主要就是从一系列的流量数据中挖掘出某种规律,并且利用这种规律对未 来的数据进行估值。随着Uber和滴滴出行等打车需求服务的日益普及,共享单车和交通运输 业的不断发展。人们能够不断收集并生成大量的时空图像数据,为交通流量预测提供了坚实 的数据基础。
[0003]针对交通流量预测的问题,研究者们提出的不同方法,一般可以分为两大类:模型驱动 方法和数据驱动方法。模型驱动的方法也被称为参数方法,主要通过预先确定的理论假设, 在此基础上求解出模型参数,并利用求解出的模型完成预测工作。主要有ARIMA(Autoregressive Integrated Moving Average,自回归综合移动平均法)、VAR(Vector Auto regressive, 向量自回归)等。VAR是一种更先进的时间序列模型,可以捕捉所有交通流序列之间的成对 关系。但是这些方法因为城市交通路网和轨迹数据过于复杂,其假设的变量数据无法准确表 示真实的复杂路网和轨迹,在流量预测方面表现不佳。
[0004]数据驱动方法可以分为两类:传统的机器学习方法和基于深度学习的方法。机器学习方法 如KNN(K NearestNeighbour,K近邻)和SVM(SupportVectorMachine,支持向量机)等, 它们可以建模更复杂的数据,但需要详细的特征工程。传统的机器学习方法无法处理高维数 据,难以描述交通路网和轨迹数据中复杂的流量变化。此外,传统机器学习的预测性能很大 程度上依赖于自定义特征,而自定义特征对问题的依赖程度很高,并且依赖于专家经验,因 此,这种方法的通用性较弱。深度学习的方法能够有效地建立高维时空数据模型以及通过层 次表示自动发现复杂的特征。其中,RNN(Recurrent Neural Network,循环神经网络)最先 被运用于交通流量预测之中,但是由于RNN每个神经元之间权值共享,因此导致了梯度爆炸 或者梯度消失的问题,从而难以在较长的时间特征上中取得好的效果。CNN
‑
LSTM (Convolutional Neural Networks
‑
Long Short
‑
Term Memory,卷积长短期记忆网络)的混合模 型为解决时空序列问题提供了新的思路。RNN的变种有GRU(Gated Recurrent Unit,门控循 环单元)、LSTM(Long Short
‑
Term Memory,长短期记忆网络)等。主要通过独特的内部单 元设计,引入了遗忘门、更新门对上一状态的信息加以鉴别并有选择的丢弃或更新。这在一 定程度上解决了RNN的梯度爆炸或梯度消失的问题,但由于GRU和LSTM的内部单元只与 下一时刻的内部单元相连接,因此CNN
‑
LSTM无法很好的捕捉时间的周期特征。基于残差卷 积神经网络可以捕捉时空信息中的依赖关系,尤其是在处理复杂的
时空图像数据,预测大规 模的交通流量方面,具有明显的优势。但残差卷积神经网络在获取城市空间特征时,没有校 准城市交通流空间上各个区域的流量特征,无法避免整个城市空间特征中无关区域对各自区 域的干扰。同时,低层网络的特征信息表征能力弱及高层下采样损失过多信息,从而影响预 测精度。
技术实现思路
[0005]本专利技术的目的在于提供一种基于残差校准网络与多尺度融合机制的交通流量预测方法, 以解决使用低层网络的特征信息预测精度不高及高层下采样损失过多信息的问题。
[0006]一种基于残差校准网络与多尺度融合机制的交通流量预测方法,其特征在于,所述方法 包括:
[0007]获取交通流量数据和外部特征数据;
[0008]对交通流量数据和外部特征数据进行预处理,得到待测交通图像数据;
[0009]将待测交通图像数据输入至预先训练好的MS
‑
ResCNet网络模型中,输出交通流量的预 测的结果。
[0010]进一步地,所述预处理方法包括:
[0011]将交通流量数据和外部特征数据栅格化,生成带有时空信息的交通流图像数据;
[0012]采用批量归一化方法对交通流图像数据进行预处理,得到待测交通图像数据。
[0013]进一步地,所述MS
‑
ResCNet网络模型包括卷积层、残差校准层和残差单元,所述卷积 层由一层卷积网络构成,所述卷积层与残差校准层和残差单元相连,用于提取城市交通流的 时空特征。
[0014]进一步地,所述残差校准层包括卷积层和校准块,所述校准块由多个卷积层分支融合而 成的网络,用于提高时空特征的提取能力。
[0015]进一步地,所述残差单元是由两个卷积块组成,并通过残差连接相连,每个卷积块由批 量归一化层、激活层及卷积层组成,通过多尺度融合机制,将残差校准层及多个残差单元的 各个输入作为流量图像输入特征尺度,将多个特征尺度进行拼接融合,输出多特征尺度数据。
[0016]进一步地,所述卷积层为卷积网络,通过卷积运算,将多特征尺度的输出数据转换为预 测目标值。
[0017]进一步地,所述MS
‑
ResCNet网络模型的训练方法包括:
[0018]将训练样本输入MS
‑
ResCNet网络进行训练,通过预先构建的损失函数不断的优化更新 MS
‑
ResCNet网络中的权重参数W;
[0019]将更新后的权重参数W带入MS
‑
ResCNet网络,并计算损失函数,直至损失函数结果最 小,保存此时的权重矩阵参数W、参数W
b
和偏置参数B
b
,得到训练好的MS
‑
ResCNet网络模 型。
[0020]进一步地,所述样本训练对MS
‑
ResCNet网络模型进行训练之前,首先进行参数初始化, 用平均值为0且标准差为的kaiming正态分布随机初始化重参数W、参数W
b
、偏 置参数B
b
,其中fan_in为输入维度。
[0021]进一步地,所述损失函数表达式如下:
[0022][0023]其中RMSE为损失函数,n为训练样本个数,obs
i
为第i个训练样本的真实值,pre
i
为由 前i
‑
1个训练样本通过MS
‑
ResCNet网络输出的第i个预测值。
[002本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于残差校准网络与多尺度融合机制的交通流量预测方法,其特征在于,所述方法包括:获取交通流量数据和外部特征数据;对交通流量数据和外部特征数据进行预处理,得到待测交通图像数据;将待测交通图像数据输入至预先训练好的MS
‑
ResCNet网络模型中,输出交通流量的预测的结果。2.根据权利要求1所述的基于残差校准网络与多尺度融合机制的交通流量预测方法,其特征在于,所述预处理方法包括:将交通流量数据和外部特征数据栅格化,生成带有时空信息的交通流图像数据;采用批量归一化方法对交通流图像数据进行预处理,得到待测交通图像数据。3.根据权利要求1所述的基于残差校准网络与多尺度融合机制的交通流量预测方法,其特征在于,所述MS
‑
ResCNet网络模型包括卷积层、残差校准层和残差单元,所述卷积层由一层卷积网络构成,所述卷积层与残差校准层和残差单元相连,用于提取城市交通流的时空特征。4.根据权利要求3所述的基于残差校准网络与多尺度融合机制的交通流量预测方法,其特征在于,所述残差校准层包括卷积层和校准块,所述校准块由多个卷积层分支融合而成的网络,用于提高时空特征的提取能力。5.根据权利要求3所述的基于残差校准网络与多尺度融合机制的交通流量预测方法,其特征在于,所述残差单元是由两个卷积块组成,并通过残差连接相连,每个卷积块由批量归一化层、激活层及卷积层组成,通过多尺度融合机制,将残差校准层及多个残差单元的各个输入作为流量图像输入特征尺度,将多个特征尺度进行拼接融合,输出多特征尺度数据。6.根据权利要求5所述的基于残差校准网络与多尺度融合机制的交通流量预测方法,其特征在于,所述卷积层为卷积网络,通过卷积运算,将多特征尺度的输出数据转换为预测目标值。7.根据权利要求1所述的基于残差校准网络与多尺度融合机制...
【专利技术属性】
技术研发人员:丁飞,殷齐,朱跃,顾潮,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。