当前位置: 首页 > 专利查询>东南大学专利>正文

一种手机信令数据驱动的居民出行方式可靠辨识方法技术

技术编号:37352679 阅读:19 留言:0更新日期:2023-04-27 07:04
本发明专利技术提供了一种手机信令数据驱动的居民出行方式可靠辨识方法,包括:获取手机信令原始数据并预处理;获取居民出行调查数据,并与手机信令数据匹配,获得带有出行方式标签的手机信令数据;提取居民出行特征并结合出行方式标签进行相关性分析;构建基于信息论的贝叶斯网络结构和基于概率论的贝叶斯网络结构,构建融合贝叶斯网络模型;将连续出行特征处理为有序的离散状态,完成贝叶斯网络模型节点参数学习,完成基于贝叶斯网络模型的居民出行方式可靠辨识模型构建。本发明专利技术从信息论和概率论角度分别构建贝叶斯网络,考虑到了出行方式特征之间的隐性关系,运用BIC函数进行网络评分,对出行方式的辨识具有更高的可靠度和精度。出行方式的辨识具有更高的可靠度和精度。出行方式的辨识具有更高的可靠度和精度。

【技术实现步骤摘要】
一种手机信令数据驱动的居民出行方式可靠辨识方法


[0001]本专利技术涉及出行方式辨识
,具体但不限于涉及一种手机信令数据驱动的居民出行方式可靠辨识方法。

技术介绍

[0002]近年来,随着我国经济社会快速发展和居民生活水平的不断提升,消费理念、消费内容、消费层次都不断升级,人们的出行需求、出行方式以及居民出行结构正在发生深刻的变化。机动车数量的不断增长、新型绿色出行方式的兴起,影响着城市多模式交通出行结构,给城市交通出行方式辨识提出了新的挑战。居民出行方式结构数据作为城市多模式交通出行需求的重要表征,对于调整优化出行方式结构、构建交通规划辅助决策平台、缓解交通拥堵以及推广实施交通减排政策等具有基础性作用。受限于传统居民出行行为调查采集数据的低样本特性及城市空间结构等快速变化等导致的出行特征变化,基于传统“四阶段”交通规划理论方法的居民出行划分方法难以准确、可靠估计上述决策应用的多方式出行需求与结构。
[0003]现有的出行方式辨识的方法主要有:(1)基于规则的模型,通过逻辑特征确定规则,进行出行特征值的判断。规则及阈值通常依据研究者的专业知识和经验而设定;(2)无监督聚类法,聚合手机信令数据的关键特征,对研究样本进行分类。将未标记数据分组,并利用先验知识或结合其他数据源分析各聚类簇的特性人为判定聚类簇对应的出行方式;(3)基于活动理论的分析方法,对个体活动出行在时间维度集计分析的基础上,考虑时空约束、家庭结构、家庭背景、个人属性等因素,对个体活动

出行决策中的方式选择行为进行建模;(4)统计分析模型根据特征变量之间是否存在因果关系分为多种模型。明确的因果关系特征通常可以利用logit回归、树结构、神经网络等模型进行研究;若因果关系不明确,则通常采用独立性分析、相关性分析等方法进行研究。
[0004]现有的出行方式辨识的缺点在于:(1)现有研究中GPS调查数据驱动的居民出行方式辨识方法,未考虑到数据的缺失问题,对于数据精度要求较高。GPS调查数据只能提取少量样本人群的出行活动轨迹特征,数据偏度特性明显,挖掘出的出行规律亦不具备普适性与代表性。(2)现有研究中采用的机器学习方法,无法有效揭示影响因素和结果变量之间的相互作用关系,具有不可解释性。(3)现有研究中对交通出行数据的定量分析,未考虑到各类出行方式交通出行特性的不确定性。出行特性不仅和交通工具的固有属性相关,还会受交通运行状况的影响而表现出时间差异性。(4)现有研究中多是基于规则的模型通过逻辑特征设定规则,阈值选取具有较高的主观性。(5)既有研究存在个体活动

出行决策行为异质性刻画不足与出行方式选择行为因果机理揭示缺乏等问题。
[0005]因此目前亟需更符合时代特征的交通研究数据基础和交通出行方式可靠辨识方法,实现对城市交通出行方式结构的可靠把握,为相关部门进行交通规划、管理和决策提供有效支撑。面对日益丰富的交通出行方式,既有出行方式辨识研究所使用传统的人工问卷调查数据和手机GPS定位数据存在数据获取成本高、数据样本有限等问题。移动通信技术的
发展为交通出行方式辨识研究提供了低成本、大样本的数据来源。现有利用手机信令数据辨识出行方式的研究多采用基于规则的模型、机器学习模型以及统计分析模型这类确定性模型,存在对交通出行特征的不确定性考虑不足、对非完备手机信令数据的利用不够充分等问题。
[0006]有鉴于此,需要提供一种新的方法,以期解决上述至少部分问题。

技术实现思路

[0007]针对现有技术中的一个或多个问题,本专利技术提出了一种手机信令数据驱动的居民出行方式可靠辨识方法,基于手机信令数据,从交通出行特征的时间特异性和不确定性角度设计居民出行特征有效提取方法,面向居民交通出行方式可靠辨识问题,设计贝叶斯网络模型框架,通过交通出行特征时间特异性量化表征,最终构建考虑交通出行特征不确定性的居民交通出行方式可靠辨识模型。本专利技术可以为相关部门把握新时期城市交通出行方式结构,制定交通出行方式结构优化政策,促进绿色交通、低碳交通发展提供有效的基础数据支撑。
[0008]实现本专利技术目的的技术解决方案为:
[0009]一种手机信令数据驱动的居民出行方式可靠辨识方法,包括:
[0010]S1、获取手机信令原始数据,并对手机信令原始数据进行预处理,得到预处理后的手机信令数据;
[0011]S2、获取居民出行调查数据,每条居民出行调查数据包括出发时间、到达时间、出发地点、到达地点,其中出发地点和到达地点采用交通小区编号表示,并将手机信令数据与居民出行调查数据进行特征匹配,获得带有出行方式标签的手机信令数据;
[0012]S3、将待辨识区域划分为若干个交通小区,基于交通出行特征的时间特异性和不确定性,提取居民出行特征,所述居民出行特征包括交通环境特征、出行者个体特征、交通出行行为特征,并结合出行方式标签对居民出行特征进行相关性分析,以数学指标量化交通出行特征之间的相关性;
[0013]S4、设计面向居民出行方式可靠辨识的贝叶斯网络模型框架:根据居民出行特征之间的相关性,结合先验知识判断居民出行特征的因果联系,构建第一出行特征关系网络;基于样本数据采用机器学习方法构建第二出行特征关系网络;用BIC函数进行模型评分,综合第一出行特征关系网络和第二出行特征关系网络优化并构建贝叶斯网络模型;
[0014]S5、针对贝叶斯网络模型输入特征进行不确定性量化表征,将连续出行特征处理为有序的离散状态,将样本数据集划分为训练集与测试集,利用训练样本数据集,完成贝叶斯网络模型各节点参数学习,通过测试样本数据集评估模型精度,最终完成基于贝叶斯网络模型的居民出行方式可靠辨识模型构建。
[0015]进一步的,S1中预处理的具体步骤包括:
[0016]S1

1、无效冗余数据过滤:筛选手机信令原始数据中的无效数据和重复记录数据并剔除,所述无效数据是指缺失位置区编码和蜂窝小区编码的数据;
[0017]S1

2、乒乓数据处理:将乒乓数据的第一条信令数据的开始时间和最后一条信令数据的结束时间更新为新信令数据的开始时间和结束时间,并将重复数据的记录时长作为新信令数据的记录时长;
[0018]S1

3、漂移数据处理:
[0019]判断每条信令数据记录的起始小区和结束小区对应的手机基站间的空间距离是否超过距离阈值,并以空间距离除以信令数据记录时长,判别切换速度是否超过切换速度阈值,超过距离阈值和切换速度阈值的信令数据识别为漂移数据;
[0020]合并相邻漂移数据记录:将前一条信令数据的开始时间和后一条信令数据的结束时间字段更新为新信令数据的开始时间和结束时间字段,并将漂移数据的记录时长求和作为新信令数据的记录时长。
[0021]进一步的,S2中将手机信令数据与居民出行调查数据进行匹配的具体步骤包括:
[0022]S2

1、根据每一条居民出行调查数据中出行者的性别特征,对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种手机信令数据驱动的居民出行方式可靠辨识方法,其特征在于,包括:S1、获取手机信令原始数据,并对手机信令原始数据进行预处理,得到预处理后的手机信令数据;S2、获取居民出行调查数据,每条居民出行调查数据包括出发时间、到达时间、出发地点、到达地点,其中出发地点和到达地点采用交通小区编号表示,并将手机信令数据与居民出行调查数据进行特征匹配,获得带有出行方式标签的手机信令数据;S3、将待辨识区域划分为若干个交通小区,基于交通出行特征的时间特异性和不确定性,提取居民出行特征,所述居民出行特征包括交通环境特征、出行者个体特征、交通出行行为特征,并结合出行方式标签对居民出行特征进行相关性分析,以数学指标量化交通出行特征之间的相关性;S4、设计面向居民出行方式可靠辨识的贝叶斯网络模型框架:根据居民出行特征之间的相关性,结合先验知识判断居民出行特征的因果联系,构建第一出行特征关系网络;基于样本数据采用机器学习方法构建第二出行特征关系网络;用BIC函数进行模型评分,综合第一出行特征关系网络和第二出行特征关系网络优化并构建贝叶斯网络模型;S5、针对贝叶斯网络模型输入特征进行不确定性量化表征,将连续出行特征处理为有序的离散状态,将样本数据集划分为训练集与测试集,利用训练样本数据集,完成贝叶斯网络模型各节点参数学习,通过测试样本数据集评估模型精度,最终完成基于贝叶斯网络模型的居民出行方式可靠辨识模型构建。2.根据权利要求1所述的手机信令数据驱动的居民出行方式可靠辨识方法,其特征在于,S1中预处理的具体步骤包括:S1

1、无效冗余数据过滤:筛选手机信令原始数据中的无效数据和重复记录数据并剔除,所述无效数据是指缺失位置区编码和蜂窝小区编码的数据;S1

2、乒乓数据处理:将乒乓数据的第一条信令数据的开始时间和最后一条信令数据的结束时间更新为新信令数据的开始时间和结束时间,并将重复数据的记录时长作为新信令数据的记录时长;S1

3、漂移数据处理:判断每条信令数据记录的起始小区和结束小区对应的手机基站间的空间距离是否超过距离阈值,并以空间距离除以信令数据记录时长,判别切换速度是否超过切换速度阈值,超过距离阈值和切换速度阈值的信令数据识别为漂移数据;合并相邻漂移数据记录:将前一条信令数据的开始时间和后一条信令数据的结束时间字段更新为新信令数据的开始时间和结束时间字段,并将漂移数据的记录时长求和作为新信令数据的记录时长。3.根据权利要求1所述的手机信令数据驱动的居民出行方式可靠辨识方法,其特征在于,S2中将手机信令数据与居民出行调查数据进行匹配的具体步骤包括:S2

1、根据每一条居民出行调查数据中出行者的性别特征,对手机信令数据中的用户性别特征进行筛选,并保留与居民出行调查数据中出行者性别特征相同的手机信令数据;S2

2、根据每一条居民出行调查数据中出行者的年龄特征属性,对手机信令数据进行筛选,保留年龄差≤2岁的手机信令数据;S2

3、统计每一条居民出行调查数据所匹配的手机信令数据中的元素个数N,若N=0,
即该条居民出行调查数据没有成功匹配的手机信令数据,则将该条居民出行调查数据从居民出行调查数据集中剔除;若N=1,即该条居民出行调查数据成功匹配了唯一一条手机信令数据,则将该条居民出行调查数据保留;若N≥1,即该条居民出行调查数据存在多条手机信令数据与其匹配,则将该条居民出行调查数据从居民出行调查数据集中剔除。4.根据权利要求1所述的手机信令数据驱动的居民出行方式可靠辨识方法,其特征在于,S3的具体步骤包括:S3

1、提取交通环境特征,并计算各交通小区的交通设施指标数据,包括公交站点覆盖率、公交线路重复度、交叉口密度、路网密度和用地混合度;S3

2、提取出行者个体特征,包括性别和年龄;S3

3、提取交通出行行为特征,包括出行时长、出行距离和出行平均速度;S3

4、引入互信息值表征上述居民出行特征与出行方式之间的相关性,考虑时间特异性影响,在高峰时段和平峰时段分别计算最大互信息数并构建出行特征信息矩阵,其中,最大互信息数公式计算公式如下:其中,MIC(X,Y)表示最大互信息数,x,y分别是网格中的行元素和列元素,n
X
,n
Y
分别代表横轴和纵轴上的网格数,约束条件为网格数n
X
n
Y
<B,(B=n
0.6
),n代表全体样本数,p(x,y)是两元素的联合概率密度函数,p(...

【专利技术属性】
技术研发人员:彩晨刘欢陆振波贺洋何静刘娟安成川夏井新
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1