一种分析用户轨迹的方法及装置制造方法及图纸

技术编号:13799867 阅读:142 留言:0更新日期:2016-10-07 03:02
本发明专利技术提供了一种分析用户轨迹的方法及装置,该方法包括:对采集到的用户的信令数据进行清洗;根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹,本发明专利技术的方法能简单、高效地分析信令数据。

【技术实现步骤摘要】

本专利技术涉及移动通信及数据挖掘
,特别涉及一种分析用户轨迹的方法及装置
技术介绍
分析用户轨迹可以预测用户位置,挖掘用户移动的行为特征。目前基于信令数据的用户位置分析系统,尤其是在移动通信领域中通过信令数据来挖掘用户轨迹特征、预测用户位置的方法有:第一种,通过用户移动设备上安装终端工具,收集用户一定量的轨迹数据,对其进行抽象化处理,调用PrefixSpan挖掘算法得到基于用户位置信息的运动模式并进行建模,构造模式树(模式树包含所有运动模式及其采用不同起点和终点的概率),同时分析用户在线运动情况得到按照起点和终点位置数据进行组织的运动模式集,将运动模式集结果和挖掘出的运动模式进行匹配和查找来预测用户位置。第二种,通过移动通信网用户无线上网信息采集用户实时位置数据如时间字段信息、地点字段信息,同时对获取到的用户移动数据进行清洗处理,输出一个已处理的用户移动数据信息,并结合根据用户的历史移动行为分析得到的转移概率矩阵,构造马尔科夫模型进行分析计算,从而预测其访问各个地点的可能性,做出用户最大可能访问的地点预测。但这两种方法存在如下缺点:对信令数据采用的分析方法复杂且计算量大,同时缺少对历史数据的优化处理。
技术实现思路
本专利技术实施例的目的在于提供一种分析用户轨迹的方法及装置,能简单、高效地分析信令数据。为了达到上述目的,本专利技术的实施例提供了一种分析用户轨迹的方法,该方法包括:对采集到的用户的信令数据进行清洗;根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹。其中,对采集到的用户的信令数据进行清洗的步骤包括:对采集到的用户的信令数据中的残缺信令数据进行补全;根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据;若是错误信令数据,则纠正该错误信令数据;对纠正后的用户的信令数据进行去重处理。其中,根据清洗后的信令数据,得到用户的运动轨迹参数的步骤包括:从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序;根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。其中,根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;判断该给定用户进入该小区的平均时间是否在第二预设时间段内;若该给定用户进入该小区的平均时间在第二预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段;若该给定用户在该小区的停留时间覆盖第三预设时间段,则确定该小区为该给定用户的居住地。其中,根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该
给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据的步骤之后,方法还包括:判断该给定用户进入该小区的平均时间是否在第四预设时间段内;若该给定用户进入该小区的平均时间在第四预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段;若该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段,则确定该小区为该给定用户的工作地。其中,根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。其中,根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。本专利技术的实施例还提供了一种分析用户轨迹的装置,该装置包括:清洗模块,用于对采集到的用户的信令数据进行清洗;获得模块,用于根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;确定模块,用于根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹。其中,清洗模块包括:补全单元,用于对采集到的用户的信令数据中的残缺信令数据进行补全;判断单元,用于根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据,并当补全后的用户的信令数据是错误信令数据时,触发纠正单元;纠正单元,用于根据判断单元的触发,纠正该错误信令数据;去重单元,用于对纠正后的用户的信令数据进行去重处理。其中,获得模块包括:第一单元,用于从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序;第二单元,用于根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;第三单元,用于根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。其中,确定模块包括:第四单元,用于根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;第五单元,用于判断该给定用户进入该小区的平均时间是否在第二预设时间段内,并当该给定用户进入该小区的平均时间在第二预设时间段内时,触发第六单元;第六单元,用于根据第五单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段,并当该给定用户在该小区的停留时间覆盖第三预设时间段时,确定该小区为该给定用户的居住地。其中,确定模块还包括:第七单元,用于判断该给定用户进入该小区的平均时间是否在第四预设时间段内,并当该给定用户进入该小区的平均时间在第四预设时间段内时,触发第八单元;第八单元,用于根据第七单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段,并当该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段时,确定该小区为该给定
用户的工作地。其中,确定模块还包括:第九单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。其中,确定模块还包括:第十单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间本文档来自技高网
...

【技术保护点】
一种分析用户轨迹的方法,其特征在于,包括:对采集到的用户的信令数据进行清洗;根据清洗后的信令数据,得到用户的运动轨迹参数,所述运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹。

【技术特征摘要】
1.一种分析用户轨迹的方法,其特征在于,包括:对采集到的用户的信令数据进行清洗;根据清洗后的信令数据,得到用户的运动轨迹参数,所述运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹。2.如权利要求1所述的方法,其特征在于,所述对采集到的用户的信令数据进行清洗的步骤包括:对采集到的用户的信令数据中的残缺信令数据进行补全;根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据;若是错误信令数据,则纠正该错误信令数据;对纠正后的用户的信令数据进行去重处理。3.如权利要求1所述的方法,其特征在于,所述根据清洗后的信令数据,得到用户的运动轨迹参数的步骤包括:从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序;根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,所述每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。4.如权利要求1所述的方法,其特征在于,所述根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:根据给定用户的唯一标识,通过扫描所述用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;判断该给定用户进入该小区的平均时间是否在第二预设时间段内;若该给定用户进入该小区的平均时间在第二预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段;若该给定用户在该小区的停留时间覆盖第三预设时间段,则确定该小区为该给定用户的居住地。5.如权利要求4所述的方法,其特征在于,所述根据给定用户的唯一标识,通过扫描所述用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据的步骤之后,所述方法还包括:判断该给定用户进入该小区的平均时间是否在第四预设时间段内;若该给定用户进入该小区的平均时间在第四预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段;若该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段,则确定该小区为该给定用户的工作地。6.如权利要求1所述的方法,其特征在于,所述根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描所述用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。7.如权利要求1所述的方法,其特征在于,所述根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描所述用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。...

【专利技术属性】
技术研发人员:杨魁
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1