一种基于相似时间序列对比的交通流量预测方法技术

技术编号:33934435 阅读:14 留言:0更新日期:2022-06-25 22:56
本发明专利技术涉及智慧交通技术领域,具体涉及一种基于相似时间序列对比的交通流量预测方法,包括以下步骤:第一步:根据公开的数据网站获得某地区的交通流量数据,并对交通流量数据进行处理;第二步:挖掘区域流量周期;第三步:预训练编码器;在空间角度上使用深层ResNet网络进行编码,从空间角度上捕获流量图特征,由于相同城市职能的区域流量分布相似,使用多实例对比学习方法,让相似区域之间的特征彼此拉近,从而远离不相似区域的特征;第四步:将预训练好的编码器放入流量预测模型微调,第五步:保存模型。与以往的交通流量预测相比,本发明专利技术具有更少的参数量和训练成本,建模效果明显,预测结果好等特点。预测结果好等特点。预测结果好等特点。

【技术实现步骤摘要】
一种基于相似时间序列对比的交通流量预测方法


[0001]本专利技术涉及智慧交通
,具体涉及一种基于相似时间序列对比的交通流量预测方法。

技术介绍

[0002]随着数据信息化的发展,交通预测在智慧城市领域起着至关重要的作用,准确的交通预测可以辅助路线规划,指导车辆调度,缓解交通拥堵。由于道路网络中不同区域之间复杂且动态的时空依赖关系,该问题具有挑战性。近些年来,人们致力于在这领域投入了大量的研究工作。其中早期的研究集中在传统的机器学习方法上,随着深度学习的发展,卷积神经网络、递归神经网络和前馈神经网络被应用于交通流量预测。基于残差结构在计算机视觉领域的重大突破,研究者将某地交通流量数据分割成的区域,每个区域代表流量大小。根据流量数据的邻近性、周期性和趋势性进行划分,最后设计一个融合机制对未来交通流量进行预测。
[0003]由于对未来交通流量预测需要大量的数据训练,自监督的出现打破了这一局面,自监督可以通过建立一系列辅助任务帮助模型有针对地学习数据本身特性。为了提高交通流量预测的准确性并且减少模型参数量和复杂程度,本专利技术提出一种基于相似时间序列对比的交通流量预测方法。

技术实现思路

[0004]本专利技术提供一种基于相似时间序列对比的交通流量预测方法,本专利技术根据交通流量数据的时空特性,在空间上,具有相似语义功能的区域它们流量分布状况相同;在时间上,区域的流量分布随着时间呈现出周期特性。根据这两个特点,本专利技术将区域按照功能属性划分成几种类别,每种类别的流量分布呈现出不同的周期特性,设计出一个编码器进行相似时间序列对比自监督学习。它的目的是为了使那些具有相似语义功能区域特征彼此相近,而使不同区域特征远离。编码器挖掘了时空流量数据特征,使简单的网络结构能够从数据本身获得强大的表示能力,结合这个预训练编码器微调网络来进行城市流量预测。
[0005]本专利技术是通过以下技术方案实现的:一种基于相似时间序列对比的交通流量预测方法,包括以下步骤:第一步:数据获取,根据公开的数据网站获得某地区的交通流量数据,并对交通流量数据进行处理;第二步:挖掘区域流量周期,发现流量的周期性,按照经纬度对该地区的区域进行划分,将各个区域流量的大小进行DBSCAN聚类划分,流量图按照流量大小划分为若干个区域,基于同一类别的区域具有相似的流量周期特性;第三步:预训练编码器;在空间角度上使用深层ResNet网络进行编码,编码器主体是由卷积网络Conv和若干层Resunit构成,从空间角度上捕获流量图特征,由于相同城市职能的区域流量分布相似,使用多实例对比学习方法,让相似区域之间的特征彼此拉近,从而
远离不相似区域的特征;第四步:将预训练好的编码器放入流量预测模型微调;第五步:保存模型;得到的流量预测模型首先在训练集上进行训练,经过不断的迭代训练,模型中的参数也在不断完善,然后在验证集上进行测试,最后保存具有最好测试效果的模型。
[0006]进一步的,所述交通流量数据进行处理操作如下:由于交通流量数据具有相似性、周期性和趋势性,对流量按照时间间隔划分为相似区间, 例如同一天的连续的不同时刻;周期区间,例如不同天的同一的时刻,趋势区间,例如不同周同一天的同一时刻;其中 分别为相似区间、周期区间和趋势区间的间隔长度是周期长度和趋势长度。
[0007]进一步的,所述预训练编码器的获得的操作如下:分别将相似区间、周期区间、趋势区间的流量数据输入深层ResNet编码器网络得到高层语义特征,得到相似高级语义特征、周期高级语义特征和趋势高级语义特征,在训练过程中,将流量图的大小裁剪为的小块,计算当前小块与其他小块之间的特征距离,设置参数,如果特征距离之间的差距小于参数,将其视为正样本,否则将其视为负样本;通过上述操作得到当前小块的正样本集合和负样本集,设计多实例对比损失函数对高级语义特征进行计算:其中是内积计算,通过上述操作在相似区间、周期区间、趋势区间上进行预训练,得到相似区间预训练编码器、周期区间预训练编码器、趋势区间预训练编码器,保存预训练编码器,用于后续模型微调。
[0008]具体获得预训练编码器的操作如下所示:(1) 相似区域预训练编码器:将 数据进入深层ResNet编码器网络得到高层语义特征;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图 的大小裁剪为的小块,不同小块之间的流量分布周期特性不同,计算当前小块 与其他小块之间的特征距离,设置参数:如果特征距离之间的差距小于参数 ,将其视为正样本,否则将其视为负样本。通过上述操作,得到当前小块的正样本集合和负样本集合 ,设计多实例对比损失函数对高级语义特征进行计算:其中是内积计算,通过上述操作在相似区间上进行预训练,保存预训练编码器,用于后续模型微调;(2)周期区间预训练编码器:将周期区域 的流量数据进入深层ResNet编码器网络得到高层语义特征;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图的大小裁剪为的小块;不同小块之间的流量分布周期特性不同;计算当前小块与其他小块之间的特征距离,设置参数:如果特征距离之间的差距小于参数 ,将其视为正样本,否则将其视为负样本;通过上述操作,得到当前小块的正样本集合
ꢀꢀ
和负样本集合 ,设计多实例对比损失函数对高级语义特征进行计算:
其中 是内积计算,通过上述操作在相似区间上进行预训练,保存编码器;(3)趋势区间预训练编码器:将趋势区间 流量数据进入深层ResNet编码器网络得到高层语义特征;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图的大小裁剪为的小块;不同小块之间的流量分布周期特性不同。计算当前小块与其他小块之间的特征距离,设置参数;如果特征距离之间的差距小于参数,将其视为正样本,否则将其视为负样本;通过上述操作,得到当前小块的正样本集合和负样本集合 ,设计多实例对比损失函数对高级语义特征进行计算:其中 是内积计算,通过上述操作,在相似区间上进行预训练,保存编码器。
[0009]进一步的,所述步骤4的具体操作如下:由于流量数据和外部因素密不可分的关系,外部因素分为连续特征和离散特征,连续特征包括湿度、温度、风速等;离散特征包括天气(阴天、晴天、多云)、时间;将离散特征通过多层感知机编码为,并与连续特征进行向量拼接操作:对外部特征e进行非线性激活函数变换得到外部信息高级语义特征:其中ReLU是激活函数,为权重矩阵,B为偏置矩阵;之后将上一步骤中得到的相似、周期、趋势和外部信息高级语义特征进行信息融合,具体操作如下:其中Conv是卷积降维操作,将融合后的特征H进行未来交通流量预测。
[0010]本专利技术的有益效果体现在:现有的交通流量预测模型依赖于过多的训练数据和复杂的模型,由于自监督可以从数据本身挖掘特性。本专利技术将流量数据中的时空特性进行充分挖掘,在空间上捕获流量邻域信息,在时间上捕获周期特性。在一段时间内,具有相同城市功能的区域它们的流量分布是相似的,通过相似时间序列对比,这些相似区域之可以加强学习特征,从而远离那些不相似的区域本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于相似时间序列对比的交通流量预测方法,其特征在于:包括以下步骤:第一步:数据获取,根据公开的数据网站获得某地区的交通流量数据,并对交通流量数据进行处理;第二步:挖掘区域流量周期,发现流量的周期性,按照经纬度对该地区的区域进行划分,将各个区域流量的大小进行DBSCAN聚类划分,流量图按照流量大小划分为若干个区域,基于同一类别的区域具有相似的流量周期特性;第三步:预训练编码器;在空间角度上使用深层ResNet网络进行编码,编码器主体是由卷积网络Conv和若干层Resunit构成,从空间角度上捕获流量图特征,由于相同城市职能的区域流量分布相似,使用多实例对比学习方法,让相似区域之间的特征彼此拉近,从而远离不相似区域的特征;第四步:将预训练好的编码器放入流量预测模型微调;第五步:保存模型;得到的流量预测模型首先在训练集上进行训练,经过不断的迭代训练,模型中的参数也在不断完善,然后在验证集上进行测试,最后保存具有最好测试效果的模型。2.根据权利要求1所述的基于相似时间序列对比的交通流量预测方法,其特征在于:步骤1中的所述交通流量数据进行处理操作如下:对流量按照时间间隔划分为相似区间;周期区间;趋势区间;其中 分别为相似区间、周期区间和趋势区间的间隔长度;是周期长度和趋势长度。3.根据权利要求2所述的基于相似时间序列对比的交...

【专利技术属性】
技术研发人员:高文飞王辉王瑞雪郭丽丽王磊
申请(专利权)人:山东融瓴科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1