一种基于人类行为的稀疏轨迹数据高效时空聚类方法技术

技术编号:36543832 阅读:27 留言:0更新日期:2023-02-01 16:50
本发明专利技术提供了一种基于人类行为的稀疏轨迹数据高效时空聚类方法,包括以下步骤:步骤1,对手机数据进行预处理,发现时空轨迹数据的空间重复性和时间周期性;步骤2,对于经过步骤1处理过的手机轨迹数据,通过提取个体的活动点,实现轨迹数据的简化与补齐;步骤3,对于经过步骤2处理过的手机轨迹活动数据,度量其相似性;步骤4,利用经过步骤3得到的活动点轨迹数据,进行层次聚类;步骤5,针对获得的各类轨迹,进行群体行为特征识别。本发明专利技术的有益效果是:本发明专利技术提供的一种基于人类行为的稀疏轨迹数据高效时空聚类方法可以实现大规模轨迹数据的高效处理与时空多分辨率行为模式的智能提取,支撑大规模人类活动分析。支撑大规模人类活动分析。支撑大规模人类活动分析。

【技术实现步骤摘要】
一种基于人类行为的稀疏轨迹数据高效时空聚类方法


[0001]本专利技术涉及数据处理领域,尤其涉及一种基于人类行为的稀疏轨迹数据高效时空聚类方法。

技术介绍

[0002]常规的海洋通信网络主要包括海上无线通信系统、海洋卫星通信系统和基于陆地蜂窝网络的岸基移动通信系统。由于这些通信系统的通信方式互不兼容、通信带宽高低不一、覆盖范围存在盲区、缺乏高效统一的管理机制,常规海洋通信网络越来越难满足日益增长的海洋数据传输和海上通信要求。
[0003]目前,一些国家提出了集成海洋通信网络的概念,通过近岸的船舶/浮标与地面专用基站或蜂窝基站通过海上无线链路相连,远海的船舶/浮标通过卫星链路与海洋通信卫星相连,最后通过卫星和地面基站形成一个有效的海洋通信网络,以确保海上稳定、高效的通信服务。我国陆地公共移动通信系统发展极为迅猛,在近岸区域,岸基4G移动通信系统可作为海上无线通信和卫星通信的补充。同时,我国利用北斗卫星导航系统和海洋卫星通信系统作为远海通信的手段,但是没有一种很好的融合卫星、无人机、岸基、船舶之间的通信手段。
[0004]手机轨迹数据记录了个体的时间及位置,蕴含了大体量的个体活动及其出行信息,在网约车调度、智能交通、城市规划、移动位置服务等领域中显示了相当的潜力。挖掘大规模手机轨迹数据中的模式可以发现个体活动的规律,刻画居民与建筑物、POI等的精细化交互过程,为数据驱动的城市规划和城市智能运行提供基础性的人类活动数据支撑。然而,手机轨迹数据受限于GPS、WiFi等空间定位方法,其空间定位精度一般从几十米到几公里不等,时间采样间隔从几秒钟到几个小时不等,缺乏诸如活动类型、活动时间等重要语义信息,难以进行高效率的轨迹聚类,发现群体行为模式非常困难。

技术实现思路

[0005]本专利技术提供了一种基于人类行为的稀疏轨迹数据高效时空聚类方法,包括以下步骤:
[0006]步骤1,对手机数据进行预处理,发现时空轨迹数据的空间重复性和时间周期性。
[0007]步骤2,对于经过步骤1处理过的手机轨迹数据,通过提取个体的活动点,实现轨迹数据的简化与补齐。
[0008]步骤3,对于经过步骤2处理过的手机轨迹活动数据,度量其相似性。
[0009]步骤4,利用经过步骤3得到的活动点轨迹数据,进行层次聚类。
[0010]步骤5,针对获得的各类轨迹,进行群体行为特征识别。
[0011]作为本专利技术的进一步改进,在所述步骤1中,包括:
[0012]步骤11,对手机数据进行质量清洗。
[0013]步骤12,求取清洗后的手机轨迹数据的个体时序轨迹。
[0014]步骤13,统计清洗后的手机数据的空间位置。
[0015]步骤14,统计清洗后的手机数据的时间标记。
[0016]作为本专利技术的进一步改进,在所述步骤11中,对手机数据进行质量清洗,包括去除重复数据,去除属性缺失的数据,去除时间和空间不在研究范围内的数据,去除用户点数量小于或大于一定阈值的用户数据。
[0017]在所述步骤12中,对于清洗后的手机轨迹数据,首先按照个体序号排序,然后按照时间进行排序,得到个体时序轨迹。
[0018]作为本专利技术的进一步改进,在所述步骤13中,将前K个频繁出现的空间位置视作空间上的重要地点集合S,K取值为6,根据重要地点集合S中元素出现的次数和时间顺序,计算手机轨迹数据的多重空间重复性。
[0019]在所述步骤14中,将前K个频繁出现的时间标记视作时间维上的重要时刻集合T,根据大量手机轨迹数据的统计经验,K取值为6,根据重要时刻集合T中元素出现的时间顺序,计算手机轨迹数据的多重时间周期性。
[0020]作为本专利技术的进一步改进,在所述步骤2中,提取活动点的方法主要通过设定时间和空间的规则来判定,具体包括:
[0021]步骤21,利用个体时序手机轨迹,计算其进入和离开每个位置的时间。
[0022]步骤22,随着时间沿着个体时序轨迹移动,计算时序轨迹中每一点与已有的活动点轨迹中的活动点的空间距离与时间差值,直到时序轨迹中所有点全部计算完毕,得到候选活动点轨迹。
[0023]步骤23,对于候选活动点轨迹,针对工作日的手机轨迹段,将工作日手机轨迹段的时间周期性率>a的确定为高度时间周期性手机轨迹。
[0024]步骤24,针对高度时间周期性的手机轨迹段,如果对应工作时段存在轨迹活动点缺失情况,根据时间周期性补齐。
[0025]作为本专利技术的进一步改进,在所述步骤21中,第一个位置设为手机轨迹中的第一个活动点。
[0026]在所述步骤22中,若空间距离小于设定阈值,并且时间差值小于设定阈值,则将该点加入到该活动点,否则,该点设为新的活动点。
[0027]作为本专利技术的进一步改进,在所述步骤23中,时间周期性率=重复的工作日数量/手机轨迹数据覆盖的工作日数量,a值设置为0.6。
[0028]在所述步骤24中,对应工作时段是9:00

17:00。
[0029]作为本专利技术的进一步改进,在所述步骤3中,具体包括:
[0030]步骤31,提取手机轨迹数据中最高频地点(x
o
,Y
o
),将个体时空轨迹减去最高频地点的坐标,进行手机轨迹数据的中心化,去掉绝对坐标值的影响。
[0031]步骤32,定义时空轨迹点p,q之间的距离如下:
[0032]D
pq
=sqrt((x
p

x
q
)(x
p

x
q
)+(y
p

y
q
)(y
p

y
q
)+v(t
p

t
q
)(t
p

t
q
))
[0033]其中x,y为位置,t为时间,v为城市中平均运动速度。
[0034]步骤33,对于两条手机轨迹活动数据A和B,以A上的时序活动轨迹为基础,进行轨迹活动点匹配,根据匹配结果形成若干个共享边界的三角形和梯形,将所有三角形面积之和与梯形的面积之和S
b
的相加值定义为两条轨迹相似度S
pq

[0035]S
pq
=∑S
a
+∑S
b
[0036]其中,S
a
表示两条手机轨迹活动数据之间所有三角形面积之和。
[0037]步骤34,计算所有轨迹对之间相似度,并进行归一化:
[0038][0039]作为本专利技术的进一步改进,在所述步骤4中,具体包括:
[0040]步骤41,将步骤3中的轨迹对按照相似度S

pq
从小到大排序,将每条轨迹视作一类。
[0041]步骤42,按照相似度S
′本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人类行为的稀疏轨迹数据高效时空聚类方法,其特征在于,包括以下步骤:步骤1,对手机数据进行预处理,发现时空轨迹数据的空间重复性和时间周期性;步骤2,对于经过步骤1处理过的手机轨迹数据,通过提取个体的活动点,实现轨迹数据的简化与补齐;步骤3,对于经过步骤2处理过的手机轨迹活动数据,度量其相似性;步骤4,利用经过步骤3得到的活动点轨迹数据,进行层次聚类;步骤5,针对获得的各类轨迹,进行群体行为特征识别。2.根据权利要求1所述的稀疏轨迹数据高效时空聚类方法,其特征在于,在所述步骤1中,包括:步骤11,对手机数据进行质量清洗;步骤12,求取清洗后的手机轨迹数据的个体时序轨迹;步骤13,统计清洗后的手机数据的空间位置;步骤14,统计清洗后的手机数据的时间标记。3.根据权利要求2所述的稀疏轨迹数据高效时空聚类方法,其特征在于:在所述步骤11中,对手机数据进行质量清洗,包括去除重复数据,去除属性缺失的数据,去除时间和空间不在研究范围内的数据,去除用户点数量小于或大于一定阈值的用户数据;在所述步骤12中,对于清洗后的手机轨迹数据,首先按照个体序号排序,然后按照时间进行排序,得到个体时序轨迹。4.根据权利要求2所述的稀疏轨迹数据高效时空聚类方法,其特征在于:在所述步骤13中,将前K个频繁出现的空间位置视作空间上的重要地点集合S,K取值为6,根据重要地点集合S中元素出现的次数和时间顺序,计算手机轨迹数据的多重空间重复性;在所述步骤14中,将前K个频繁出现的时间标记视作时间维上的重要时刻集合T,根据大量手机轨迹数据的统计经验,K取值为6,根据重要时刻集合T中元素出现的时间顺序,计算手机轨迹数据的多重时间周期性。5.根据权利要求1所述的稀疏轨迹数据高效时空聚类方法,其特征在于,在所述步骤2中,提取活动点的方法主要通过设定时间和空间的规则来判定,具体包括:步骤21,利用个体时序手机轨迹,计算其进入和离开每个位置的时间;步骤22,随着时间沿着个体时序轨迹移动,计算时序轨迹中每一点与已有的活动点轨迹中的活动点的空间距离与时间差值,直到时序轨迹中所有点全部计算完毕,得到候选活动点轨迹;步骤23,对于候选活动点轨迹,针对工作日的手机轨迹段,将工作日手机轨迹段的时间周期性率>a的确定为高度时间周期性手机轨迹;步骤24,针对高度时间周期性的手机轨迹段,如果对应工作时段存在轨迹活动点缺失情况,根据时间周期性补齐。6.根据权利要求5所述的稀疏轨迹数据高效时空聚类方法,其特征在于:在所述步骤21中,第一个位置设为手机轨迹中的第一个活动点;在所述步骤22中,若空间距离小于设定阈值,并且时间差值小于设定阈值,则将该点加
入到该活动点,否则,该点设为新的活动点。7.根据权利要求5所述的稀疏轨迹数据高效时空聚类方法,其特征在于:在所述步骤23中,时间...

【专利技术属性】
技术研发人员:周淑媛
申请(专利权)人:深圳航天智慧城市系统技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利