一种利用手机定位数据判断用户移动与停留状态的方法技术

技术编号:14120057 阅读:207 留言:0更新日期:2016-12-08 12:11
本发明专利技术公开了一种利用手机定位数据判断用户移动与停留状态的方法,属于交通运输技术领域。以用户手机定位产生的连续轨迹数据,建立基于朴素贝叶斯分类器的移动或停留状态识别方法,具体包括:一是建立朴素贝叶斯分类器,利用一定量的训练样本,进行用户分类,计算移动和停留状态的概率以及发生停留或移动状态时特征参数值(方向夹角和最小覆盖圆直径)发生的概率;二是利用朴素贝叶斯分类器对手机定位数据进行移动或停留状态判别,首先进行异常数据过滤,根据数据的稀疏程度进行聚合与填补,然后进行用户分类,计算特征参数方向夹角和最小覆盖圆直径的值,最后利用建立好的朴素贝叶斯分类器,计算类别的条件概率,判断用户状态的类别归属。

【技术实现步骤摘要】

本专利技术属于交通运输
可根据手机用户在城市空间内移动的轨迹数据准确地判断用户处于移动或者停留状态,用于获取城市居民出行信息。
技术介绍
居民日常出行活动是城市交通需求的直接反映,通常采用出行OD、出行时间、时行耗时、出行结构等指标表征,目前这些表征指标的获取主要利用人工调查手段,费时、费力且精度低,北京市于2014的开展的第5次居民出行调查,花费约3000万,耗时近一年时间,抽样率不足1%,能够调查到的信息非常有限。随着移动通信技术的发展,利用手机定位数据对居民出行过程进行追踪成为可能,通过对轨迹数据的分析,得到出行表征指标,轨迹数据分析的核心内容就是判别用户的移动或停留状态,只有判断出用户的移动停留状态后,才能精准计算出行表征指标。因此,移动或停留状态的识别,是利用手机定位数据进行交通需求分析的关键。但手机定位数据具有定位精度低、时间间隔不均匀、离散性大等特征,对判别移动或停留状态的方法提出了较高的要求。
技术实现思路
本专利技术提供一种判断手机定位轨迹数据移动或停留状态方法,为手机定位数据的应用奠定了基础,方法分为两部分,过程如下:一是建立朴素贝叶斯分类器,利用一定量的训练样本,进行用户分类,计算移动和停留状态的概率以及发生停留或移动状态时特征参数值(方向夹角和最小覆盖圆直径)发生的概率;二是利用朴素贝叶斯分类器对手机定位数据进行移动或停留状态判别,首先进行异常数据过滤,根据数据的稀疏程度进行聚合与填补,然后进行用户分类,计算特征参数方向夹角和最小覆盖圆直径的值,最后利用建立好的朴素贝叶斯分类器,计算类别的条件概率,判断用户状态的类别归属。一种利用手机定位数据判断用户移动状态的方法,本方法包括以下步骤,步骤1:异常数据过滤,对同一用户的手机定位数据按时间先后顺序排序,第n个用户的第i条手机数据记为其中UserIDn表示第n个用户的唯一标识码,表示n个用户第i条记录所处的位置横坐标,Yin表示n个用户第i条记录所处的位置纵坐标,Tin表示n个用户第i条记录发生的时间点,对排序数据进行降噪处理,任意记录点与前后时间相邻点的速度Vin大于阈值VT、且距离大于阈值DT时,去掉该记录点;步骤2:在上一步异常数据过滤后的基础上,把用户记录按一定的时间间隔TI进行聚合与填补,TI的取值由数据的稀疏程度决定,参考取值范围在5-30分钟,将一天24小时按等时间间隔TI均匀划分,形成集合CI={c1,c2...cm本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201610539286.html" title="一种利用手机定位数据判断用户移动与停留状态的方法原文来自X技术">利用手机定位数据判断用户移动与停留状态的方法</a>

【技术保护点】
一种利用手机定位数据判断用户移动状态的方法,其特征在于:本方法包括以下步骤,步骤1:异常数据过滤,对同一用户的手机定位数据按时间先后顺序排序,第n个用户的第i条手机数据记为其中UserIDn表示第n个用户的唯一标识码,表示n个用户第i条记录所处的位置横坐标,Yin表示n个用户第i条记录所处的位置纵坐标,Tin表示n个用户第i条记录发生的时间点,对排序数据进行降噪处理,任意记录点与前后时间相邻点的速度Vin大于阈值VT、且距离大于阈值DT时,去掉该记录点;步骤2:在上一步异常数据过滤后的基础上,把用户记录按一定的时间间隔TI进行聚合与填补,TI的取值由数据的稀疏程度决定,参考取值范围在5‑30分钟,将一天24小时按等时间间隔TI均匀划分,形成集合CI={c1,c2...cm},c1,c2...cm表示集合CI的各元素,cm表示从0点开始,以时间间隔TI均匀递增,处于第m个时间间隔的时间戳,把用户的任意记录手机数据的时间值Tin与集合CI进行比较,按时间距离就近原则建立对应关系,即cm中对应多条或没有一条对应;建立标准间隔用户记录用于表示用户n在第m个时间间隔处的记录,其中m、n意义同前,计算过程如下:(1)当存在多条手机数据对应cm时,进行数据聚合,和取对应的多个Yin的平均值,表示第m个时间间隔处的时间戳cm;(2)当不存在一条手机数据对应cm时,进行数据填补,根据cm前后邻近的记录,由线性插值计算得到和仍由第m个时间间隔处的时间戳cm表示,当前后邻近的时间大于阈值TE时,TE取值大于24小时,认为用户数据缺失严重,不宜填补;步骤3:用户分类,受手机定位数据采集原理的影响,不同用户根据空间活动范围的大小,产生的手机定位数据呈现出的位置精度误差存在一定差异,根据用户的活动范围大小进行分类,针对不同类别的用户,分别建立对应的移动停留状态分类器,活动范围是指用户在白天工作时段和夜晚休息时段,所处位置的平均加权中心点之间的空间距离,白天工作时段和夜晚休息时段的时间范围根据城市上下班时间定,各时段的选定如下:白天工作时段从上午9时至11:30,以及下午13:30至15:00,夜晚休息时段从22:00至次日早上5时,根据距离值的大小划分为若干类别,下表中的类别划分可供参考:类别活动范围(单位:米)A[0,600)B[600,1500)C[1500,3000)D[3000,+∞)步骤4:利用步骤2聚合填补后的数据,计算用于描述用户移动停留状态的特征参数:方向夹角和周围点最小覆盖圆直径,过程如下,(1)构建方向向量m,n意义同前,由和中的三个变量X,Y,T的差值构成,其中计算方向向量与标准向量形成的方向夹角PI为圆周率常数;(2)计算周围点最小覆盖圆直径,用于表征用户的运动速度,它是指为中心,时间范围内的记录所构成的空间点集的最小覆盖圆的直径λ取整数,其范围为2‑4;步骤5:建立面向不同类别的朴素贝叶斯分类器,分类器的关键指标计算过程如下:(1)假定有一定样本量的数据,用于训练分类器,已先验掌握其处于移动或停留状态,记为该数据能够通过人工跟踪调查或者判断得到,定义特征属性集合M,它包括方向夹角A和周围点最小覆盖圆直径Φ两个变量;(2)根据步骤3,把中的数据按用户进行分类,针对同一类别的数据,分别计算处于移动状态的概率Pmove=Qmove/Q,Qmove表示移动状态的记录数量,Q表示训练样本的总数量;处于停留状态的概率Pstay=Qstay/Q,Qstay表示停留状态的记录数量;(3)计算移动状态下不同方向夹角值A发生的离散概率表示训练样本中,处于移动状态下方向夹角值为Ai的样本量;计算移动状态下周围点最小覆盖圆直径Φ发生的离散概率表示训练样本中,处于移动状态下周围点最小覆盖圆直径为Φi的样本量;(4)计算停留状态下不同方向夹角值A发生的离散概率表示训练样本中,处于停留状态下方向夹角值为Ai的样本量;计算停留状态下周围点最小覆盖圆直径Φ发生的离散概率表示训练样本中,处于停留状态下周围点最小覆盖圆直径为Φi的样本量;步骤6:计算归属于移动或停留状态的概率,其中移动状态概率表示用户n的第m条记录,在方向夹角为最小覆盖圆的直径的条件下,用户处于移动状态的概率,同理,处于停留状态概率用表示,计算过程如下:Pmn(move|Amn,Φminmn)=P(Φmn|move)·P(Amn|move)·Pmove/PM]]>Pmn(stay|Amn,Φminmn)=P(Φmn|stay)·P(Amn|stay)·Pstay/PM]]>其中:表示在移动状态下,周围点最小覆盖圆直径为时发生的概率,通过从步骤5建立的朴素贝叶斯分类器中的P(Φ|move)寻...

【技术特征摘要】
1.一种利用手机定位数据判断用户移动状态的方法,其特征在于:本方法包括以下步骤,步骤1:异常数据过滤,对同一用户的手机定位数据按时间先后顺序排序,第n个用户的第i条手机数据记为其中UserIDn表示第n个用户的唯一标识码,表示n个用户第i条记录所处的位置横坐标,Yin表示n个用户第i条记录所处的位置纵坐标,Tin表示n个用户第i条记录发生的...

【专利技术属性】
技术研发人员:赖见辉陈艳艳张政张文池洪潮陈晓峰方珊珊
申请(专利权)人:北京工业大学北京亿阳信通科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1