一种基于因果马尔科夫模型的多模态数据预测方法技术

技术编号:36554047 阅读:12 留言:0更新日期:2023-02-04 17:08
本发明专利技术提供了一种基于因果马尔科夫模型的多模态数据预测方法,属于智能交通技术领域。本发明专利技术方法包括:采集研究区域的区域数据和多模态交通数据,将时间点、区域兴趣点和天气信息视为背景特征变量,将区域吸引力因子、自行车需求因子、出租车需求因子、公交车需求因子、交通速度因子视为物理概念变量,将自行车流量、出租车流量、公交车流量、区域速度视为多模态交通数据观测变量,利用因果马尔科夫过程描述多模态交通量的生成过程;利用神经网络求解因果马尔科夫过程,训练搭建的神经网络,用于多模态交通数据观测。本发明专利技术能够有效地预测多模态交通流,并提升了预测准确度,可进一步用于指导管理人员制定相关交通诱导策略。步用于指导管理人员制定相关交通诱导策略。步用于指导管理人员制定相关交通诱导策略。

【技术实现步骤摘要】
一种基于因果马尔科夫模型的多模态数据预测方法


[0001]本专利技术属于智能交通
,涉及城市交通时空数据的挖掘和预测,具体为一种基于因果马尔科夫模型的多模态数据预测方法。

技术介绍

[0002]城市交通是由多个子系统相互关联聚合而成的多模态复杂系统。不同的模态代表不同的交通方式,例如自行车、出租车、公共汽车和私家车,其目的是满足不同的出行需求,并为居民提供多种出行选择。随着城市化水平的提高和居民消费水平的增长,道路车辆保有量持续增加,城市交通基础设施与管理手段不能与城市居民出行需求相适应,城市交通拥堵问题凸显。人群出行需求分布不均与道路资源不足的矛盾是交通拥堵主要成因,因此对人群出行需求进行全面的分析,是解决交通拥堵的关键所在。多模态的交通量能够准确反映人群出行需求,刻画交通系统的健康程度。城市交通管理者可以根据不同环境下的交通量,制定相应的交通治理策略,提升城市运行的通畅度。因此,多模态的交通预测是城市交通治理的重要一环,为交通管理策略制定,交通诱导等提供重要的数据支持。
[0003]多模态交通预测目的是通过输入多种交通工具的历史流量数据,同步预测这些交通工具的未来流量。目前大多数交通预测方法仅针对单一模态的交通工具流量进行预测,例如自行车流量或者道路速度等。这些工作只是交通系统的局部观测,并不能反映现实场景中的真实情况。这些方法虽然能够用于不同的交通预测,但每种模态都需要建立一个预测模型,这种方式需要消耗大量资源,没有形成端到端的统一框架。近年来,多模态交通联合预测逐渐受到研究者的关注,这些方法通常利用多模态交通量扩展输入特征的通道维度,或者在模型内部融合不同模态的流量特征,其目的均为隐式地提取多模态流量数据的时空相关性。然而,这些方法均缺少因果关系的描述,增加数据特征维度并不能提升模型的预测能力,反而会引入大量混杂因素,降低整体预测效果。
[0004]目前,多模态交通预测方法过分强调流量数据中的时空相关性,忽视了影响流量数据生成的物理概念以及这些概念之间的因果关系。在不同条件的影响下,时空相关性被认为是不稳定的并且可能存在虚假相关性。如图1(a)为北京某区域的街道划分图,该区域中某医院的交通流量如图1(b)所示,在正常条件下,出租车流量和自行车流量具有相似的流量趋势,此时两者具有较高的相关性。这是因为人群在高峰时段到达或离开某个区域的需求是一致的,因此表现出的流量趋势大体一致。然而,当下雨天气时,由于天气变化,人群对自行车的需求量减少,并对出租车的需求量增加,此时两者具有相反的流量趋势。这表明在天气的影响下,出租车流量和自行车流量存在虚假相关性。其次,区域属性与人群的出行需求具有较强的因果关系,如图1(b)和(c)所示,医院附近对于人群具有较高的吸引力,导致该地人群出行需求较高,因此不同模态的交通量展现出明显的早高峰和午高峰,同时该地区交通速度一直处于较低水平。金融街附近是主要的工作区,人群以通勤为主,因此不同模态的交通量展现出明显的早高峰和晚高峰。最后,出租车需求可能影响交通速度,如图1(c)所示,人群出租车需求量大会导致出租车流量提升,进而导致道路上的交通速度下降。

技术实现思路

[0005]导致多模态交通量变化的根本原因是影响流量数据生成的物理概念(区域吸引力因子、不同交通方式的需求因子、交通速度因子)以及这些概念之间的因果关系,过度关注相关关系将会导致不稳定的多模态交通流量预测结果。因此,本专利技术提出了一种基于因果马尔科夫模型的多模态数据预测方法,从多模态交通量的生成过程的角度出发,将影响流量数据生成的核心物理概念分为三组:1)区域在不同时间段对人群的吸引力因子;2)人群在不同条件下选择不同交通方式的需求因子;3)受道路车辆数量影响的交通速度因子。本专利技术方法从背景特征数据和多模态交通数据中学习这些物理概念的因果表示,并进一步探索这些物理概念之间的因果关系,进而更准确地预测多模态交通流量。
[0006]本专利技术提供的一种基于因果马尔科夫模型的多模态数据预测方法,用于预测多模态交通流量,以指导管理人员制定相关交通诱导策略。本专利技术方法包括如下步骤:
[0007]步骤1:采集研究区域的区域数据和交通数据,构建因果马尔科夫过程的因果图;
[0008]首先,获取研究区域的区域划分、区域兴趣点信息、天气信息和多模态交通数据;多模态交通数据包括共享单车订单数据、出租车订单数据、公交车订单数据和道路交通速度数据;
[0009]其次,将时间点信息、区域兴趣点信息和天气信息作为背景特征变量;将区域吸引力因子、自行车需求因子、出租车需求因子、公交车需求因子和交通速度因子作为物理概念变量;
[0010]然后,构建因果马尔科夫过程的因果图,将子区域的自行车流量、出租车流量、公交车流量、区域速度作为交通数据观测变量;由当前时间点的背景特征变量和前一时间点的物理概念变量生成当前时间点的物理概念变量,然后预测当前时间点的交通数据观测变量;将多模态交通数据观测变量的生成过程用物理概念变量与交通数据观测变量的联合分布描述,并将所述联合分布分解为物理概念变量的先验分布和交通数据观测变量的生成分布;用物理概念变量的后验分布描述从背景特征变量和多模态交通数据中提取物理概念变量的过程。
[0011]步骤2,利用神经网络搭建因果马尔科夫模型,求解所述的因果马尔科夫过程;
[0012]所述的因果马尔科夫模型包括先验网络、后验网络、因果效应传播模块和生成网络;先验网络利用输入的背景特征变量学习交通系统中物理概念变量的先验分布;后验网络利用输入的背景特征变量和多模态交通数据,学习物理概念变量的变分后验分布,近似获得物理概念变量的真实后验分布;先验网络和后验网络均包含图门控递归单元,并共享一个因果效应传播模块;因果效应传播模块输入物理概念变量的因果表示,利用预设的因果方程传播因果效应,输出传播了因果效应后的物理概念变量的因果表示;生成网络输入物理概念变量的因果表示,输出对应的多模态交通数据观测变量。
[0013]步骤3:采集研究场景中的历史数据对所述的因果马尔科夫模型进行训练,将训练好的模型部署在交通管理系统上,根据研究区域内各子区域历史自行车流量、出租车流量、公交车流量和区域速度,预测未来的自行车流量、出租车流量、公交车流量和区域速度,以用于预警道路拥堵,辅助管理员指定疏导方案。
[0014]相较于现有技术,本专利技术的优点与积极效果在于:
[0015](1)不同于传统过于关注时空相关性的多模态交通预测方法,本专利技术方法从多模
态交通量生成的角度出发,首先定义交通系统中存在的变量,然后构建不同的变量之间的因果关系图,利用因果马尔科夫过程描述多模态交通量的生成过程,并提出因果马尔科夫模型建模数据的生成过程。本专利技术方法能够有效从背景数据和多模态交通数据中推断影响多模态交通数据生成物理概念的因果表示,并从未来时刻的因果表示中生成未来时刻的多模态交通量,以此作为预测结果。本专利技术方法从因果角度重新思考多模态交通系统的运行过程,使得预测结果更加符合交通运行情况。
[0016](2)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于因果马尔科夫模型的多模态数据预测方法,其特征在于,包括如下步骤:步骤1:采集研究区域的区域数据和交通数据,构建因果马尔科夫过程的因果图;首先,获取研究区域的区域划分、区域兴趣点信息、天气信息和多模态交通数据;多模态交通数据包括共享单车订单数据、出租车订单数据、公交车订单数据和道路交通速度数据;其次,将时间点信息、区域兴趣点信息和天气信息作为背景特征变量;将区域吸引力因子、自行车需求因子、出租车需求因子、公交车需求因子和交通速度因子作为物理概念变量;然后,构建因果马尔科夫过程的因果图,将子区域的自行车流量、出租车流量、公交车流量、区域速度作为交通数据观测变量;由当前时间点的背景特征变量和前一时间点的物理概念变量生成当前时间点的物理概念变量,然后预测当前时间点的交通数据观测变量;将多模态交通数据观测变量的生成过程用物理概念变量与交通数据观测变量的联合分布描述,并将所述联合分布分解为物理概念变量的先验分布和交通数据观测变量的生成分布;用物理概念变量的后验分布描述从背景特征变量和多模态交通数据中提取物理概念变量的过程;步骤2,利用神经网络搭建因果马尔科夫模型,求解所述的因果马尔科夫过程;所述的因果马尔科夫模型包括先验网络、后验网络、因果效应传播模块和生成网络;先验网络利用输入的背景特征变量学习交通系统中物理概念变量的先验分布;后验网络利用输入的背景特征变量和多模态交通数据,学习物理概念变量的变分后验分布,近似获得物理概念变量的真实后验分布;先验网络和后验网络均包含图门控递归单元,并共享一个因果效应传播模块;因果效应传播模块输入物理概念变量的因果表示,利用预设的因果方程传播因果效应,输出加强因果关系后的物理概念变量的因果表示;生成网络输入物理概念变量的因果表示,输出对应的多模态交通数据观测变量;步骤3:采集研究场景中的历史数据对所述的因果马尔科夫模型进行训练,然后利用训练好的因果马尔科夫模型对研究区域内各子区域的多模态交通数据进行预测。2.根据权利要求1所述的方法,其特征在于,所述步骤1中,研究区域进行子区域划分,将订单数据分配到各个子区域中,形成每个子区域的多模态交通流量数据;将子区域内所有道路的交通速度求均值,形成子区域速度数据;多模态交通流量数据和区域速度数据统称为多模态交通数据。3.根据权利要求1所述的方法,其特征在于,所述步骤1中,所述的联合分布分解如下:其中,T表示时间序列长度,t表示时间点t,C
t
、z
t
、x
t
分别表示时间点t的背景特征变量、物理概念变量、交通数据观测变量,z
t
‑1表示时间点t

1的物理概念变量;p
θ
(z
t
|z
t
‑1,C
t
)为物理概念变量的先验分布,表示交通系统中本身存在的自然物理规律;p
θ
(x
t
|z
t
)为交通数据观测变量的生成分布,表示受物理概念变量影响下观测变量生成观测数据的过程;所述的生成分布进一步分解为不同交通模态的生成分布,如下:
其中,为自行车需求因子,出租车需求因子,为公交车需求因子,为交通速度因子,分别为共享单车流量、出租车流量、公交车流量,为区域道路交通速度。4.根据权利要求1或3所述的方法,其特征在于,所述的步骤1中,物理概念变量的后验分布定义...

【专利技术属性】
技术研发人员:邓攀张琳贾晓丰刘岩赵宇刘俊廷汪慕澜
申请(专利权)人:北京市大数据中心北京市西城区科学技术和信息化局北京市西城区大数据管理局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1