【技术实现步骤摘要】
一种手机信令数据驱动的居民出行方式可靠辨识方法
[0001]本专利技术涉及出行方式辨识
,具体但不限于涉及一种手机信令数据驱动的居民出行方式可靠辨识方法。
技术介绍
[0002]近年来,随着我国经济社会快速发展和居民生活水平的不断提升,消费理念、消费内容、消费层次都不断升级,人们的出行需求、出行方式以及居民出行结构正在发生深刻的变化。机动车数量的不断增长、新型绿色出行方式的兴起,影响着城市多模式交通出行结构,给城市交通出行方式辨识提出了新的挑战。居民出行方式结构数据作为城市多模式交通出行需求的重要表征,对于调整优化出行方式结构、构建交通规划辅助决策平台、缓解交通拥堵以及推广实施交通减排政策等具有基础性作用。受限于传统居民出行行为调查采集数据的低样本特性及城市空间结构等快速变化等导致的出行特征变化,基于传统“四阶段”交通规划理论方法的居民出行划分方法难以准确、可靠估计上述决策应用的多方式出行需求与结构。
[0003]现有的出行方式辨识的方法主要有:(1)基于规则的模型,通过逻辑特征确定规则,进行出行特征值的判断。规则及阈值通常依据研究者的专业知识和经验而设定;(2)无监督聚类法,聚合手机信令数据的关键特征,对研究样本进行分类。将未标记数据分组,并利用先验知识或结合其他数据源分析各聚类簇的特性人为判定聚类簇对应的出行方式;(3)基于活动理论的分析方法,对个体活动出行在时间维度集计分析的基础上,考虑时空约束、家庭结构、家庭背景、个人属性等因素,对个体活动
‑
出行决策中的方式选择行为进行建模; ...
【技术保护点】
【技术特征摘要】
1.一种手机信令数据驱动的居民出行方式可靠辨识方法,其特征在于,包括:S1、获取手机信令原始数据,并对手机信令原始数据进行预处理,得到预处理后的手机信令数据;S2、获取居民出行调查数据,每条居民出行调查数据包括出发时间、到达时间、出发地点、到达地点,其中出发地点和到达地点采用交通小区编号表示,并将手机信令数据与居民出行调查数据进行特征匹配,获得带有出行方式标签的手机信令数据;S3、将待辨识区域划分为若干个交通小区,基于交通出行特征的时间特异性和不确定性,提取居民出行特征,所述居民出行特征包括交通环境特征、出行者个体特征、交通出行行为特征,并结合出行方式标签对居民出行特征进行相关性分析,以数学指标量化交通出行特征之间的相关性;S4、设计面向居民出行方式可靠辨识的贝叶斯网络模型框架:根据居民出行特征之间的相关性,结合先验知识判断居民出行特征的因果联系,构建第一出行特征关系网络;基于样本数据采用机器学习方法构建第二出行特征关系网络;用BIC函数进行模型评分,综合第一出行特征关系网络和第二出行特征关系网络优化并构建贝叶斯网络模型;S5、针对贝叶斯网络模型输入特征进行不确定性量化表征,将连续出行特征处理为有序的离散状态,将样本数据集划分为训练集与测试集,利用训练样本数据集,完成贝叶斯网络模型各节点参数学习,通过测试样本数据集评估模型精度,最终完成基于贝叶斯网络模型的居民出行方式可靠辨识模型构建。2.根据权利要求1所述的手机信令数据驱动的居民出行方式可靠辨识方法,其特征在于,S1中预处理的具体步骤包括:S1
‑
1、无效冗余数据过滤:筛选手机信令原始数据中的无效数据和重复记录数据并剔除,所述无效数据是指缺失位置区编码和蜂窝小区编码的数据;S1
‑
2、乒乓数据处理:将乒乓数据的第一条信令数据的开始时间和最后一条信令数据的结束时间更新为新信令数据的开始时间和结束时间,并将重复数据的记录时长作为新信令数据的记录时长;S1
‑
3、漂移数据处理:判断每条信令数据记录的起始小区和结束小区对应的手机基站间的空间距离是否超过距离阈值,并以空间距离除以信令数据记录时长,判别切换速度是否超过切换速度阈值,超过距离阈值和切换速度阈值的信令数据识别为漂移数据;合并相邻漂移数据记录:将前一条信令数据的开始时间和后一条信令数据的结束时间字段更新为新信令数据的开始时间和结束时间字段,并将漂移数据的记录时长求和作为新信令数据的记录时长。3.根据权利要求1所述的手机信令数据驱动的居民出行方式可靠辨识方法,其特征在于,S2中将手机信令数据与居民出行调查数据进行匹配的具体步骤包括:S2
‑
1、根据每一条居民出行调查数据中出行者的性别特征,对手机信令数据中的用户性别特征进行筛选,并保留与居民出行调查数据中出行者性别特征相同的手机信令数据;S2
‑
2、根据每一条居民出行调查数据中出行者的年龄特征属性,对手机信令数据进行筛选,保留年龄差≤2岁的手机信令数据;S2
‑
3、统计每一条居民出行调查数据所匹配的手机信令数据中的元素个数N,若N=0,
即该条居民出行调查数据没有成功匹配的手机信令数据,则将该条居民出行调查数据从居民出行调查数据集中剔除;若N=1,即该条居民出行调查数据成功匹配了唯一一条手机信令数据,则将该条居民出行调查数据保留;若N≥1,即该条居民出行调查数据存在多条手机信令数据与其匹配,则将该条居民出行调查数据从居民出行调查数据集中剔除。4.根据权利要求1所述的手机信令数据驱动的居民出行方式可靠辨识方法,其特征在于,S3的具体步骤包括:S3
‑
1、提取交通环境特征,并计算各交通小区的交通设施指标数据,包括公交站点覆盖率、公交线路重复度、交叉口密度、路网密度和用地混合度;S3
‑
2、提取出行者个体特征,包括性别和年龄;S3
‑
3、提取交通出行行为特征,包括出行时长、出行距离和出行平均速度;S3
‑
4、引入互信息值表征上述居民出行特征与出行方式之间的相关性,考虑时间特异性影响,在高峰时段和平峰时段分别计算最大互信息数并构建出行特征信息矩阵,其中,最大互信息数公式计算公式如下:其中,MIC(X,Y)表示最大互信息数,x,y分别是网格中的行元素和列元素,n
X
,n
Y
分别代表横轴和纵轴上的网格数,约束条件为网格数n
X
n
Y
<B,(B=n
0.6
),n代表全体样本数,p(x,y)是两元素的联合概率密度函数,p(...
【专利技术属性】
技术研发人员:彩晨,刘欢,陆振波,贺洋,何静,刘娟,安成川,夏井新,
申请(专利权)人:东南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。