当前位置: 首页 > 专利查询>四川大学专利>正文

一种相似演化模式聚类及动态时区划分的交通流分区模型制造技术

技术编号:30499961 阅读:36 留言:0更新日期:2021-10-27 22:32
本发明专利技术提出了基于相似演化模式聚类及动态时区划分的交通流时间序列分区模型,首次尝试挖掘交通流随时间变化的动态时空特征,解决交通流时间非平稳性在短时交通流预测中的挑战。具体的工作包括:首先使用亲和力传播聚类算法(APC),自动识别出路网内具有相似交通流演化模式的路段。其次针对交通流的日内演化差异,用曲度K

【技术实现步骤摘要】
一种相似演化模式聚类及动态时区划分的交通流分区模型
一、

[0001]本专利技术涉及智能交通领域,尤其涉及短时交通流预测,具体是一种以相似演化模式为标准,对路网各路段交通流数据进行聚类,进而对具有相似演化模式各路段的单日内交通流数据进行动态时区划分的交通流分区模型。
二、
技术介绍

[0002]准确实时的短时交通流预测能够有效缓解城市交通拥堵、降低城市空气污染,具有重要社会意义。交通流数据具有趋势性,周期性和动态随机性等特性。其中趋势性和周期性属于交通流规律特性,主要表现为根据时间规律变化的趋势或波动,是交通流可以被预测的前提。动态随机性由区域路网交通影响因素事件(如信号灯、行人穿行、道路事故、交通管制等)产生的,会使交通流时间序列数据产生波动的特征。动态随机性是导致交通流难以被准确预测的根本原因。
三、
技术实现思路

[0003]本专利技术的目的是进一步挖掘区域路网交通流的时空信息,建立能更加适应路网交通流动态随机性的自适应短时交通流预测模型,以进一步提升模型预测精度。
[0004]在时间维度上,路段不同时段内交通流的时空分布具有明显的差异(如高峰时段和非高峰时段),一个路段的交通流演化模式会随着时间的推移而发生改变,即交通流在单日内会呈现出显著的时间非平稳性。因此,有必要对路段单日内不同时段的交通流进行研究。
[0005]以往交通流预测模型往往采取全时间序列建模或对时间序列的静态时间分区建模。其中,对时间序列的静态时间分区建模往往基于日常生活经验,手动地对路段单日内的交通流量时间序列数据进行时区划分,例如将数据分为5段:0:00

6:00、6:00

9:00、9:00

17:00、17:00

20:00、20:00

23:59,其中6:00

9:00和17:00

20:00为当天的早高峰和晚高峰。但是,这种分区策略往往只根据日常经验手动划分,没有适应交通流真实的数据特点。因此,需要一种动态时间分区策略,以适应路网交通流的时间非平稳性,更细粒度地表征交通流的时空状态特征,以提高短时交通流模型的预测精度。
[0006]基于以上分析,本专利技术提出了基于相似演化模式聚类及动态时区划分的交通流时间序列分区模型(SimilarPatternClusterandDynamicTimeseriesPartition,SPC

DTSP),首次尝试挖掘交通流随时间变化的动态时空特征,解决交通流时间非平稳性在短时交通流预测中带来的挑战。具体地,本章所做工作的贡献如下:
[0007](1)使用亲和力传播聚类算法(AffinityPropagationCluster,APC),自动识别出路网内具有相似交通流演化模式的路段。
[0008](2)针对交通流的日内演化差异,使用曲度K

Means算法(WarpedK

Means,WKMS),对相似演化模式中的交通流进行动态时区划分,更深层次地挖掘路网交通流的时空状态特征。
[0009](3)在相似模式识别和自动时区划分后,对不同模式下的不同时区内的交 通流分别建模,更细粒度地对交通流的状态信息进行量化,使模型的预测精度更 加准确。
[0010](4)使用真实数据集对所提模型的有效性进行验证,并与现有优秀预测模 型进行效果对比,展示所提模型的先进性。
[0011]本专利技术的目的是这样达到的:
[0012]针对现有研究没有充分利用路网各路段交通流单日内的动态随机性,并使用 静态全局固定的模型结构进行预测的问题,本专利技术建立了一个基于相似演化模式 聚类及动态时区划分的交通流时间序列分区模型。首先使用亲和力传播聚类,对 路网内各路段的交通流进行分类,将具有相似演化模式的路段交通流归为一类; 然后使用曲度K

Means算法,对具有相似交通流演化模式的路段进行单日时区划 分,在时间维度上进一步细粒度地标准路段的交通流状态。在此基础上再进行对 交通流的建模预测,预测精度会得到进一步提升。
[0013]具体做法是:
[0014]首先对采集到的美国加州公路管理系统PeMS的交通流数据进行预处理工作, 包括数据聚合、缺失数据填充、异常值处理、数据筛选。以提高数据可用性,提 升模型的预测精度。
[0015](1)数据聚合:PeMS系统原始的数据采样间隔为30s,但过短的采样间隔会 导致收集到的数据呈现出较大程度的分散性和随机性,不利于对交通时间序列数 据的分析研究。PeMS自身提供了多种数据聚合的方法,将采样间隔30s的数据 重新聚合到一个更大的时间间隔内,包括5分钟、15分钟、60分钟,以满足研 究者不同的数据需求。本文聚焦于短时交通流预测,因此选用时间间隔为5分钟 的交通流时间序列数据。
[0016](2)缺失数据填充:由于道路环形探测器长期暴露于室外环境,会受到天气、 地磁、物理撞击等各种因素的影响,从而导致传感器发生故障乃至损害,采集到 的交通流时间序列数据可能出现局部缺失和大片缺失的状况。针对局部缺失数 据,本文采用相邻时间的数据进行线性插值计算。针对大片缺失数据,本文采用 多个相同星期编号的平均时间序列数据进行填补。
[0017](3)异常值处理:异常值体现在交通流时间序列数据中存在数据突变。比如 在早高峰时段中,某路段8:10、8:15、8:20三个采样时间点的车流量数据为520、 20、540,很明显8:15分的数据为异常数据。针对采样数据,本文使用异常点前 后相邻采样时间点的线性均值进行替换。
[0018](4)数据筛选:路段工作日和周末的交通流时间序列数据呈现不同的演化趋 势,工作日的时间序列数据具有较为明显的早高峰和晚高峰,而周末的单高峰时 段也一般出现在中午,这是城市居民在不同时间不同的出行习惯导致的。为了实 验数据的一致性,只选用工作日的交通流时间序列数据作为研究对象。
[0019]在进行完对交通流数据的预处理后,得到可用性更高的数据。之后,需要首 先对各路段所有时间的交通流数据进行特征表示;其次,需要对各路段的交通流 特征数据进行相似演化模式聚类;最后,对具有相似交通流演化模式的数据进行 动态时区划分,得到最后对交通流数据的时间分区结果。
[0020]1.交通流时间序列数据特征表示
[0021]各路段单日内的交通流时间序列数据呈现出一条时变曲线,以5分钟的数据 采样频率为例,该交通流时变曲线以288个交通流数据为组成元素,构成了一条 路段一天的交通流时间序列,曲线的走势反映出来路段单日内的交通流演化模 式。理论上应当对所有采集时间(D天)的交通流时间序列数据进行聚类,然后 再使用某种算法将出现的重叠簇进行过滤和组合,但这种方法加大了预测模型的 复杂度,会带来巨大的计算负载,不利于对及交通流的实时预测。为了简化计算, 对各路段所有采集时间的交通流数据以天为单位进行均值计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种相似演化模式聚类及动态时区划分的交通流时间序列分区模型,其特征在于:通过对不同路段交通流数据的特征表示及聚类,提出了一种基于相似演化模式聚类及动态时区划分的交通流时间序列分区模型(Similar Pattern Cluster and Dynamic Timeseries Partition,SPC

DTSP),首次尝试挖掘交通流随时间变化的动态时空特征,解决交通流时间非平稳性在短时交通流预测中带来的挑战;通过美国加州101公路真实交通数据集的实证研究表明,所提模型相对于传统时空K近邻模型和深度学习模型有更高的预测精度;具体地,首先对路网个路段交通流数据进行特征表示;其次使用亲和力传播聚类算法对路网内具有相似演化模式的路段交通流进行分类;最后使用曲度K

Means算法对分类后的交通流数据进行动态时区划分,得到最终的对交通流数据的时间分区结果;算法步骤:(1)交通流时间序列数据特征表示:各路段单日内的交通流时间序列数据呈现出一条时变曲线,以5分钟的数据采样频率为例,该交通流时变曲线以288个交通流数据为组成元素,构成了一条路段一天的交通流时间序列,曲线的走势反映出来路段单日内的交通流演化模式,理论上应当对所有采集时间(D天)的交通流时间序列数据进行聚类,然后再使用某种算法将出现的重叠簇进行过滤和组合,但这种方法加大了预测模型的复杂度,会带来巨大的计算负载,不利于对及交通流的实时预测,为了简化计算,对各路段所有采集时间的交通流数据以天为单位进行均值计算,获取交通流平均时间序列,表示该路段在统计时间内的日内平均演化交模式,作为亲和力传播聚类算法的交通流数据特征;(2)亲和力传播聚类算法APC算法对路网所有特征序列进行聚类:由于路网内各路段间存在物理上直接或间接的连接,某个路段的交通状态在一定程度上会受其周围路段交通状态的影响,这就形成了路段间的空间相关性和交通流协同演化模式,在进行完交通流数据的特征表示后,本发明使用亲和力聚类传播算法对路网内具有相似演化模式的路段交通流进行分类,使得预测模型的构建范围缩小在一个更加精确的数据范围;(3)构建动态时空加权欧氏距离:曲度K

Means算法的输入是通过APC聚类算法得到的交通流演化模式时间序列集合P,对P中每个交通流演化模式序列分别进行时区划,通过迭代计算,WKMS算法得到离散分布的同质类。2.如权利要求1所述的基于对交通流数据进行特征表示,其特征在于:各路段单日内的交通流时间序列数据呈现出一条时变曲线,以5分钟的数据采样频率为例,该交通流时变曲线以288个交通流数据为组成元素,构成了一条路段一天的交通流时间序列,曲线的走势反映出来路段单日内的交通流演化模式,理论上应当对所有采集时间(D天)的交通流时间序列数据进行聚类,然后再使用某种算法将出现的重叠簇...

【专利技术属性】
技术研发人员:王知远陈良银陈彦如廖俊华刘畅刘诗佳何皓宇盘昊吴迪智袁道华
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1