一种基于GPS轨迹数据和贝叶斯网络的交通方式识别方法技术

技术编号:31308381 阅读:18 留言:0更新日期:2021-12-12 21:32
本发明专利技术提出了一种基于GPS轨迹数据和贝叶斯网络的交通方式识别方法。该方法以个体出行者为研究对象,以智能手机采集的GPS轨迹信息作为数据源,首先对出行者的GPS轨迹数据进行预处理;而后利用K2算法学习贝叶斯网络结构,并采用极大似然估计法学习贝叶斯网络参数;之后,以建立的贝叶斯网络模型为基础,判定出行交通方式。应用本发明专利技术所述的识别方法可以基于GPS轨迹数据实现步行、自行车、电动车、公交车和小汽车共五种出行方式的自动化识别,且识别精度高,可以为交通规划、交通需求预测及管理决策等提供有效的监控手段和数据参考。决策等提供有效的监控手段和数据参考。决策等提供有效的监控手段和数据参考。

【技术实现步骤摘要】
一种基于GPS轨迹数据和贝叶斯网络的交通方式识别方法


[0001]本专利技术涉及出行方式识别
,特指一种基于GPS轨迹数据和贝叶斯网络的交通方式识别方法。

技术介绍

[0002]交通出行方式是居民出行特征及出行行为研究的基本属性。交通方式的识别研究对于出行规律研究、精准化交通信息服务及交通运行状态判别等具有现实意义。出行调查是获取居民出行基础数据的主要手段,也是出行行为分析和建模的主要数据来源。传统出行调查要求志愿者报告调查期间每次出行的起终点、起止时问、出行方式和出行目的等信息,会对志愿者造成较大负担,而且数据精度难以保证。近年来快速普及的GPS专用设备和智能手机在国内外居民出行调查中得到越来越多的应用,基于智能手机的出行调查成本较低,而且调查样本量不受设备限制,适合开展大规模GPS出行调查,将为精准化、精细化的居民出行行为分析及城市交通状况感知提供重要数据支撑。
[0003]基于GPS轨迹数据对出行方式进行推断,其出行方式的推断一般采用规则或数据挖掘算法来实现。规则应用如GIS系统的整合、加速度信息的融合等,但是对数据和城市环境较为敏感,可移植性较差。在数据挖掘算法方面,神经网络、模糊逻辑理论、支持向量机、决策树等方法均在基于GPS轨迹数据的出行方式推断研究中得到了应用,但是非常容易陷入过拟合的困境,尤其是对于小数据集,且泛化能力不强,识别精度有限。
[0004]鉴于此,我们发现如果采用贝叶斯网络,就可以避免GIS等附属信息的高要求,识别方法将具备较好的可移植性,有利于识别方法的推广。而在精确性和效率方面,贝叶斯网络计算简单,有利于节省计算时间,提升效率,并且识别精度也高于一般的神经网络。鉴于此,针对目前利用手机GPS数据识别交通方式的方法在识别可移植性、识别精度和实用性方面的不足,本专利技术提出一种基于GPS轨迹数据和贝叶斯网络的交通方式识别方法。

技术实现思路

[0005]为了克服现有技术识别效率低,精度不高,适用性不足等缺陷,本专利技术提供了一种基于GPS轨迹数据和贝叶斯网络的交通方式识别方法,通过运用GPS移动定位技术采集出行者出行方式的轨迹数据,进行贝叶斯网络结构学习和贝叶斯网络参数学习,构造贝叶斯网络模型,对多种出行方式进行识别,并对识别结果进行了精度检验,具有分类精度高、训练成本低等优势,有良好的普适性和推广价值。
[0006]一种基于GPS轨迹数据和贝叶斯网络的交通方式识别方法,其特征在于,包括以下步骤:
[0007](1)、GPS轨迹数据预处理;
[0008](2)、提取出行特征变量;
[0009](3)、将连续的出行特征变量离散化,划分样本的数据集;
[0010](4)、进行贝叶斯网络结构学习;
[0011](5)、进行贝叶斯网络参数学习;
[0012](6)、贝叶斯网络推断,识别出行交通方式。
[0013]进一步,所述GPS轨迹数据预处理包括以下步骤:
[0014](1.1)获取用户原始交通出行数据,所获取的数据包含时间、经纬度;
[0015](1.2)将收集到的手机GPS数据,通过召回调查的方式获取出行交通方式,并对错误信息进行纠正,处理成为只包含单一的交通方式的出行段,转化为本专利技术使用的数据集。
[0016]进一步,所述出行特征包括:平均速度、95%分位点速度、平均绝对值加速度、出行距离、低速点比例和平均方向改变。
[0017]进一步,所述连续变量离散化过程为:将每个连续变量分成三个相等的部分;平均速度变量可分为高速(H)、中速(M)和低速(L)。
[0018]进一步,所述样本数据集中的训练集和测试集划分的比例为3:1。
[0019]进一步,所述贝叶斯网络结构的学习包括:
[0020](4.1)采用K2算法学习贝叶斯网络结构;
[0021](4.2)运用贪婪搜索算法和贝叶斯评分方法,根据事先确定节点顺序有序加入新节点直到将所有节点加入,得到贝叶斯网络结构。
[0022]进一步,步骤(4.2)所述方法为在指定不同节点顺序的条件下,以训练集作为数据源,通过贝叶斯网络结构学习,得到不同的贝叶斯网络结构;通过遍历所有节点顺序,得到了预测精度最高的贝叶斯网络结构。
[0023]进一步,所述贝叶斯网络参数学习包括:在给定拓扑结构的基础上利用最大似然估计来计算条件概率表集,包括以下步骤:
[0024](5.1)设X={x1,x2,...,x
n
}为特征集,c为分类变量,每个特征变量x
i
∈X,且有r
i
种可能值,而分类变量c有q种可能值,在样本量为m的数据集D中,每个样本都包含特征集X和分类变量c;
[0025](5.2)确定贝叶斯网络的条件独立性假设如下,其中表示变量x
i
的父节点集合:
[0026](5.3)通过极大似然估计得到使样本数据出现可能性最大的参数组合,可以表示为:B
p
=argmax
T
{P(D|B
s
,T)},其中,D表示数据集,T表示条件概率表,出行方式是其他所有节点的父节点,因此其对应的条件概率表为先验概率,即样本数据中各出行方式的样本频率。
[0027]进一步,所述贝叶斯网络推断为:以样本数据特征变量作为输入,预测的样本类别可以表示为:y=argmax
j
{P(x1,x2,...,x
n
,c
j
|B)},则贝叶斯网络模型将概率最大的类别输出为数据所属类别,得到样本交通方式。
附图说明
[0028]图1表示本专利技术的基于GPS轨迹数据和贝叶斯网络的交通方式识别方法的流程示意图。
[0029]图2表示本专利技术实施方式中的出行变量的贝叶斯网络结构图。
[0030]图3表示本专利技术实施方式中的出行距离节点条件概率图。
[0031]图4表示本专利技术实施方式中的贝叶斯网络模型识别出行方式的混淆矩阵。
[0032]图5表示本专利技术与SVM模型、MNL模型和BP神经网络的出行方式识别效果对比图。
具体实施方式
[0033]下面结合附图及本专利技术的实施例对本专利技术的方法作进一步详细的说明。
[0034]一种基于GPS轨迹数据和贝叶斯网络的交通方式识别方法,包括以下步骤:
[0035](1)、GPS轨迹数据预处理;
[0036](2)、提取出行特征变量;
[0037](3)、将连续的出行特征变量离散化,划分样本的数据集;
[0038](4)、进行贝叶斯网络结构学习;
[0039](5)、进行贝叶斯网络参数学习;
[0040](6)、贝叶斯网络推断,识别出行交通方式。
[0041]进一步的,所述GPS轨迹数据预处理包括以下步骤:
[0042](1.1)获取用户原始交通出行数据,所获取的数据包含时间、经纬度;
[0043](1.2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于GPS轨迹数据和贝叶斯网络的交通方式识别方法,其特征在于,包括以下步骤:(1)、GPS轨迹数据预处理;(2)、提取出行特征变量;(3)、将连续的出行特征变量离散化,划分样本的数据集;(4)、进行贝叶斯网络结构学习;(5)、进行贝叶斯网络参数学习;(6)、贝叶斯网络推断,识别出行交通方式。2.根据权利要求1中所述的基于GPS轨迹数据和贝叶斯网络的交通方式识别方法,其特征在于:所述GPS轨迹数据预处理包括以下步骤:(1.1)获取用户原始交通出行数据,所获取的数据包含时间、经纬度;(1.2)将收集到的手机GPS数据,通过召回调查的方式获取出行交通方式,并对错误信息进行纠正,处理成为只包含单一的交通方式的出行段,转化为本发明使用的数据集。3.根据权利要求1中所述的基于GPS轨迹数据和贝叶斯网络的交通方式识别方法,其特征在于:所述出行特征包括:平均速度、95%分位点速度、平均绝对值加速度、出行距离、低速点比例和平均方向改变。4.根据权利要求1中所述的基于GPS轨迹数据和贝叶斯网络的交通方式识别方法,其特征在于:所述连续变量离散化过程为:将每个连续变量分成三个相等的部分;平均速度变量可分为高速(H)、中速(M)和低速(L),所述样本数据集中的训练集和测试集划分的比例为3∶1。5.根据权利要求1中所述的基于GPS轨迹数据和贝叶斯网络的交通方式识别方法,其特征在于:所述贝叶斯网络结构的学习包括以下步骤:(4.1)采用K2算法学习贝叶斯网络结构;(4.2)运用贪婪搜索算法和贝叶斯评分方法,根据事先确定节点顺序有序加入新节点直到将所有节点加入,得到贝叶斯网络结构。6.根据权利要求5中所述的基于GPS轨迹数据和贝叶斯网络的交通方式识别方法,其...

【专利技术属性】
技术研发人员:肖光年肖宇崔庆安顾邦平王瑞楠陆琼雯王梓豪汪传旭吉双焱崔文雅
申请(专利权)人:上海海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1