一种大数据环境下个体时空活动鲁棒性的计算方法技术

技术编号：35498423 阅读：22 留言：0更新日期：2022-11-05 17:01

本发明专利技术的目的是利用移动终端个体在指定时间范围内的空间活动数据集，挖掘大量个体的时空轨迹数据，插值拟合后获得等时间隔的个体时空轨迹，将其投射到二维格网空间中对其进行聚类并计算鲁棒性，最后通过统计随机个体的时空格网序列的鲁棒性计算值的分布特征获得校验区间，对个体的时空活动鲁棒性进行校验，以此可低成本、自动化、便捷地获取指定时间范围内大量人口的时空活动轨迹，为交通出行需求的预测提供微观行为基础。预测提供微观行为基础。预测提供微观行为基础。

全部详细技术资料下载

【技术实现步骤摘要】
一种大数据环境下个体时空活动鲁棒性的计算方法

[0001]本专利技术涉及一种基于海量匿名加密时间序列定位数据的个体时空活动鲁棒性计算方法，属于大数据分析

技术介绍

[0002]近年来，随着信息技术的发展，数据信息量呈现爆炸式增长，数据来源越来越多，数据量也越来越庞大。其中，手机终端设备与运营商基站之间持续产生的信号控制指令信息，形成了记录用户出行活动轨迹的一系列手机信令数据集，较为完备地记录了海量个体持续时间段内的相对完整的空间出行活动轨迹，为人类行为动力学特征分析提供了很好的数据支持。
[0003]鲁棒性指的是系统受外部冲击带来的扰动程度，鲁棒性越高，系统受外部冲击产生的影响越小。若将个体的出行范围和频次看作一个系统，其时空活动鲁棒性越高，则其日常出行越规律，也越具可预测性。因而，对整个城市来说，大量居民的个体时空活动鲁棒性的计算，对总体居民日常出行规律性的把握具有重要的现实意义。

技术实现思路

[0004]本专利技术的目的是利用移动终端个体在较长时间范围（建议3个月以上）内的空间活动数据集，对大量个体的日常时空活动数据进行提取，通过比较分析个体在不同时间段内空间活动的规律性，进而计算个体时空活动的鲁棒性，并对其结果进行校验获取其显著性指标。为了达到上述目的，本专利技术的技术方案提供了一种大数据环境下个体时空活动鲁棒性计算方法，包括以下步骤：步骤1、读取从传感器运营商获取匿名加密移动终端传感器数据，提取个体的出行数据，构建个体出行轨迹数据集，以T时间为间隔对出行数据的空间位置进行插...

【技术保护点】

【技术特征摘要】
1.一种大数据环境下个体时空活动鲁棒性的计算方法，其特征在于，包括以下步骤：步骤1、读取从传感器运营商获取匿名加密移动终端传感器数据，提取个体的出行数据，构建个体出行轨迹数据集，以T时间为间隔对出行数据的空间位置进行插值，构建等时间间隔的个体时空活动轨迹，将时空活动轨迹投射到M
×
N大小的二维空间格网中，建立个体时空格网序列；步骤2、在鲁棒性概念中引入模糊思想，设计个体时空活动鲁棒性的计算方法，通过两两比较个体时空格网序列中等位点之间的模糊相似度，计算两两时空格网序列之间的相似性，进而对时空格网序列进行初步聚类，对每个聚类中的个体时空活动的鲁棒性进行数值计算；步骤3、通过统计大量随机生成的个体时空格网序列样本的鲁棒性分布规律，设计个体时空活动鲁棒性校验方法，对计算得到的个体鲁棒性值进行校验。2.如权利要求1所述的一种大数据环境下个体时空活动鲁棒性的计算方法，其特征在于，所述步骤1包括：步骤1.1、读取从传感器运营商获取匿名后的个体加密移动终端传感器数据，构建由个体和固定传感器通信记录构成的初步的个体出行数据；步骤1.2、根据步骤1.1得到的个体出行数据，按时间顺序排序，采用二次曲线拟合个体连续的出行轨迹连续函数，以T为时间间隔计算个体在各个时间点的X
‑
Y坐标，生成一系列插值点，根据插值点构建个体时空活动轨迹；步骤1.3、以个体所在城市的空间范围为边界，生成一个M
×
N的二维格网去覆盖整个城市，然后将个体时空活动轨迹投射到二维格网中，以格网的X
‑
Y编号替代个体时空活动轨迹中的X
‑
Y坐标，建立个体的时空格网序列。3.如权利要求1所述的一种大数据境下个体时空活动鲁棒性的计算方法，其特征在于，所述步骤2包括：步骤2.1、以时间间隔IT为单位，将个体的时空格网序列截断为多条可比的序列；步骤2.2、基于等位节点比较的思想，考虑到时空插值中不可避免的误差存在，引入模糊思想，设计两两时空格网序列的模糊比较算法，计算两条序列之间的模糊相似度，其中序列内等位点之间的模糊相似度计算公式可表示为：式中，表示两条序列的等位点t的相似性，其上限为k；k表示两条序列的等位点所在空间位置完全一致情况下的权重；表示序列i在点位t所在的格网；表示序列i在点位t所在格网的邻居，如冯诺依曼邻居、摩尔邻居和扩展摩尔邻居等；表示距离
衰减系数；表示两条序列为点位t的格网距离，；在此基础上，两条序列i和j之间的模糊相似度计算公式可表示为：式中，表示序列i和序列j之间的相似性，其上限为k；T表示两条序列的时间节点数；步骤2.3 基于序列之间的模糊相似度计算方...

【专利技术属性】
技术研发人员：张颖，顾高翔，刘杰，
申请(专利权)人：上海世脉信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人