一种面向有缺失数据的公交车到站时间预测方法技术

技术编号:30271515 阅读:15 留言:0更新日期:2021-10-09 21:27
本发明专利技术公开了一种面向有缺失数据的公交车到站时间预测方法。本发明专利技术首先设计一种基于密度的聚类方法发现重要地理位置,利用挖掘的地理位置表示每条路线的地理结构构成节点信息,根据地理结构相似度,构建具有交通重要性的有权重边信息,从而组成公共交通网络图;根据公共交通网络图,建立多头时空图注意力网络预测模型从空间和时间的角度学习公交路线之间的相关性,空间注意力模块为具有掩码的多头图注意力模块,时间注意力模块由LSTM层和transformer层构建。本发明专利技术可以准确有效地学习和预测公共交通网络中每条路径的旅行时间,不仅能提高当前旅行记录少的公交线路的到达时间预测准确率,还可以对没有历史记录的处于设计阶段的公交线路提供预计旅行时间。设计阶段的公交线路提供预计旅行时间。设计阶段的公交线路提供预计旅行时间。

【技术实现步骤摘要】
一种面向有缺失数据的公交车到站时间预测方法


[0001]本专利技术涉及公交车到站时间预测领域,具体涉及一种面向有缺失数据的公交车到站时间预测方法,用于对出发时间不确定、GPS设备有问题等有数据缺失情况的公交线路提供准确的到站时间预测。

技术介绍

[0002]公交车网络对快速发展的城市交通至关重要,由于经济,环保等特点,目前公交车仍是城市出行的主要方案。阻碍乘客选择公交的主要因素是其漫长的等待时间和旅程时间的不确定性,因此准确预测公交车的到站时间对于解决这个问题非常重要。它还可以帮助减少交通拥堵,并被用于其他的综合智能交通应用,如行程规划。
[0003]现有的公交车到达或旅行时间预测方法,依赖大量的历史旅行记录和公共交通路线的广泛覆盖。因此,现有方法无法或难以准确预测有数据缺失的公交车到站时间,其原因主要包括:1) 数据稀疏性:对于预测郊区(记录稀少)和正在考虑和设计(没有记录)的交通路线的旅行时间预测,主要问题是它们有大量的缺失数据,无法从历史记录中学习到准确的运行模式,从而无法预测到站时间;2)独立的旅行模式:从空间角度看,为扩大服务覆盖面积,城市公交网络中的公交线路不会有过多重复和重叠,导致公交线路之间难以互相学习运行模式。即使部分站点共享同一道路的部分,由于需求不同,乘客数量的不同,停车的顺序和位置不同,交通网络中的路线具有相对不同和独立的旅行模式;3)复杂的交通状况:公共交通线路的旅行模式比私人车辆更复杂,因为它们也有独特的交通信息。除了受到道路长度、方向和交互数字的影响外,公共交通线路还受到出发时间安排、数量和停靠地点的影响。
[0004]因此,对于具有历史数据缺失的公交车到站时间预测方法的提出是必要且重要的。

技术实现思路

[0005]为了解决对有数据缺失问题的公交车到达时间预测的问题,本专利技术提供一种面向有缺失数据的公交车到站时间预测方法,该方法可以准确有效地学习和预测公共交通网络中每条路径的旅行时间,不仅能提高当前旅行记录少的公交线路的到达时间预测准确率,还可以对没有历史记录的处于设计阶段的公交线路提供预计旅行时间。
[0006]本专利技术的技术方案如下:本专利技术提供了一种面向有缺失数据的公交车到站时间预测方法,其包括如下步骤:1)将历史公交车运行轨迹GPS信息、公共交通站点位置信息与城市兴趣点数据(数据信息包含建筑经纬度和建筑城市功能分类信息)进行数据整合;通过基于密度的聚类方
法从整合后的数据中提取公交网络中重要的地理位置,利用得到的地理位置来表示每条公交路线的地理结构,进行公共交通网络图的节点抽取和边抽取,构建公共交通网络图;2)根据构建的公共交通网络图,建立多头时空图注意力网络预测模型从空间和时间的角度学习公交路线之间的相关性;其中,所述的多头时空图注意力网络预测模型包括顺次连接的空间注意力模块和时间注意力模块;所述空间注意力模块为多头具有掩码的图注意力网络的注意力模块,其应用图注意网络来学习不同节点之间的空间依赖关系,并利用带有掩码的多头图注意块学习不同情况下公交线路之间的全局和局部空间依赖关系;所述时间注意力模块包括一个LSTM层和一个transformer层,分别用于进行局部时间依赖学习和全局时间依赖学习;3)利用多头时空图注意力网络预测模型,对具有缺失数据的公交车到站时间进行预测。
[0007]进一步的,所述的通过基于密度的聚类方法从整合后的数据中提取公交网络中重要的地理位置,具体为:根据整合后的数据中速度为0的GPS点的数量来设置基于密度的聚类方法的参数,通过基于密度的聚类方法得到公交网络中重要的地理位置,并根据每个地理位置包含的GPS点的数量来确定地理位置的权重。
[0008]进一步的,所述的利用得到的重要的地理位置来表示每条路线的地理结构,具体为:用权重来表现交叉口和站点的位置,以代表每条公交路线的地理结构。
[0009]进一步的,所述的节点抽取具体为:在每条公交路线的每两个相邻站点之间选择一个地理位置,将两个站点信息和其之间的被选择的地理位置信息集合作为节点s的信息,以代表两个相邻站点之间的路段。
[0010]进一步的,所述的每两个相邻站点之间选择一个地理位置构成节点信息,具体为:选择公交路线中,与两个相邻站点位置距离最远,且人流量最大的交叉口,将该交叉口信息与两个相邻站点的地理位置信息一起构成节点信息。
[0011]进一步的,所述的边抽取具体为:建立边图来代表路段之间的关系,其中,边上编码的权重是空间相关性强度或相似性;构建三个分别表示地理结构相似度关系、公交路线之间的距离关系、城市功能区域划分关系的邻接矩阵A,得到三种表示不同关系的公共交通网络图。
[0012]优选的,所述邻接矩阵A的构建方法,具体为:建立地理结构相似关系边图,根据提取的节点包含的三个重要地理位置信息,提取出节点的位置信息、节点长度信息,利用DTW算法做相似度比较,建立节点之间的地理结构相似邻接矩阵A
g
;然后,根据每个节点中三个地理位置附近的城市兴趣点数据中包含的建筑类别信息,提取每个节点的城市功能类别,根据城市功能的相似度,建立节点之间的城市功能区域划分关系邻接矩阵A
f
;最后,根据公交路线之间的距离关系,设计了第三种地理距离邻接矩阵A
d
;邻接矩阵中边的权重经过归一化处理,范围在0到1之间。
[0013]进一步的,所述的步骤3)具体为:对具有缺乏数据的公交线路,利用多头时空图注意力网络预测模型并根据公交车运行模式的相似度,学习前h个时间段内具有完整历史数据的公交车运行模式;继而预测具有缺乏数据的公交线路的公交车到站时间。
[0014]与现有技术相比,本专利技术根据每条公共交通线路的地理结构与线路之间的空间

时间依赖关系,利用基于密度聚类方法来定位路线中的重要旅行地点(如车站、交叉口);根据挖掘的重要旅行地点,构建一个具有交通重要性的有权重的公共交通网络图。基于构建的交通网络图,提供了一个多注意图神经网络,从空间和时间的角度学习公交路线之间的相关性。在空间注意力模块中,建立了多头具有掩码的图注意力网络的注意力模块(multi

head GAT),可以学习全局和局部路线在城市功能,路线距离,公交结构相似度三种视图上的重要性,并有效地结合多种影响因素来组合学习的旅行模式。在时间注意力模块中,提出用长短期记忆(LSTM)和transformer层来学习较远和最近时间的公交运行模式。结合空间和时间注意力模块,准确推断和学习具有稀疏和无历史数据的公交路线的旅行(到达)时间。本专利技术不仅能提高当前旅行记录少的公交线路的到达时间的预测准确率,还可以对没有历史记录的处于设计阶段的线路提供预计的站与站之间的旅行时间。
附图说明
[0015]图1为面向有缺失数据的公交车到站时间预测方法的流程图;图2为本专利技术实施例中基于密度的聚类方法的伪代码示意图;图3为本专利技术实施例中选择站点之间的地理位置方法的伪代码示意图;图4为本专利技术方法与对比实验方法的实验结果图。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向有缺失数据的公交车到站时间预测方法,其特征在于,包括如下步骤:1)将历史公交车运行轨迹GPS信息、公共交通站点位置信息与城市兴趣点数据进行数据整合;通过基于密度的聚类方法从公交历史GPS数据中提取公交网络中重要的地理位置,利用得到的地理位置来表示每条公交路线的地理结构,根据站点信息位置和城市兴趣点数据设计公共交通网络图的节点抽取和边权重表示方法,构建公共交通网络图;2)根据构建的公共交通网络图,建立多头时空图注意力网络预测模型从空间和时间的角度学习公交路线之间的相关性;其中,所述的多头时空图注意力网络预测模型包括顺次连接的空间注意力模块和时间注意力模块;所述空间注意力模块为具有掩码的多头图注意力模块,其中多头设计用于学习不同情况下公交线路之间的全局和局部空间依赖关系,掩码设计用于注意重要的具有完全历史数据的公交线路旅行规律;所述时间注意力模块包括一个LSTM层和一个transformer层,分别用于进行局部时间依赖学习和全局时间依赖学习;3)利用多头时空图注意力网络预测模型,对具有缺失数据的公交车到站时间进行预测。2.根据权利要求1所述的面向有缺失数据的公交车到站时间预测方法,其特征在于,所述的通过基于密度的聚类方法从整合后的数据中提取公交网络中重要的地理位置,具体为:根据整合后的数据中速度为0的GPS点的数量来设置基于密度的聚类方法的参数,通过基于密度的聚类方法得到公交网络中重要的地理位置,并根据每个地理位置包含的GPS点的数量来确定地理位置的权重。3.根据权利要求1所述的面向有缺失数据的公交车到站时间预测方法,其特征在于,所述的利用得到的重要的地理位置来表示每条路线的地理结构,具体为:用权重来表现交叉口和站点的位置,以代表每条公交路线的地理结构。4.根据权利要求1所述的面向有缺失数据的公交车到站时间预测方法,其特征在于,所述的节点抽取具体为:在每条公交路线的每两个相邻站点之间选择一个地理位置,将两...

【专利技术属性】
技术研发人员:马佳曼罗喜伶
申请(专利权)人:北京航空航天大学杭州创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1