基于车站MAC扫描数据的同行人关联分析方法和装置制造方法及图纸

技术编号:14843940 阅读:103 留言:0更新日期:2017-03-17 11:12
本发明专利技术实施例公开了一种基于车站MAC扫描数据的同行人关联分析方法和装置。其中基于车站MAC扫描数据的同行人关联分析方法包括:根据车站MAC扫描数据生成当前n项集,根据车站MAC扫描数据计算n项集的相对频度,根据相对频度确定基于n项集的频繁n项集,通过逐层搜索的迭代方法搜索全部频繁项集,分析全部频繁项集中除频繁1项集以外的频繁项集,获得目标人员之间的同行人关系。本发明专利技术实施例的方案可实现通过十分有限的车站MAC扫描数据信息挖掘分析出统计意义上的同行人关系,一定程度上满足用户需要,尤其能有效提高公安部门刑侦追查的效率,和方便车站公共网络安全管理。

【技术实现步骤摘要】

本专利技术涉及网络公共安全和数据挖掘
,尤其涉及一种基于车站MAC扫描数据的同行人关联分析方法和装置
技术介绍
公安部门常通过对目标数据集进行分析,找出与目标人物具有同行关系的同行人。在网络公共安全分析中,挖掘被观察人员之间的关联关系往往基于某些特定的基础数据来进行,例如,通过铁路运营系统的购票数据、居民他身份登记数据、旅馆住宿登记数据等。基于上述基础数据进行挖掘分析,往往能够掌握很直观、准确的关联人关系。但在具体的实施过程中,由于数据源的管理部门之间的协调配合问题,公安人员所能调动的数据一般不包括上述直观、准确的基础数据信息,当缺乏这些基础数据信息时,现有技术则不能根据表面的数据信息挖掘分析被观察人员之间关联关系的方法。
技术实现思路
为解决相关技术问题,本专利技术提供一种基于车站MAC扫描数据的同行人关联分析方法和装置,以根据车站MAC扫描设备采集到的数据,挖掘出被观察人员之间行为模式上的某种共同特性,并分析这些共同特性获得被观察人员之间的关联关系。为实现上述目的,本专利技术实施例采用如下技术方案:第一方面,本专利技术实施例提供一种基于车站MAC扫描数据的同行人关联分析方法,包括:根据所述车站MAC扫描数据生成当前n项集,其中,所述n项集为客户端MAC地址的集合,n为正整数,所述车站MAC扫描数据包括客户端MAC地址、扫描设备MAC地址、历史SSID、采集时间和采集地点编号根据所述车站MAC扫描数据计算所述n项集的相对频度;根据所述相对频度确定基于所述n项集的频繁n项集;通过逐层搜索的迭代方法搜索全部频繁项集;分析所述全部频繁项集中除频繁1项集以外的频繁项集,获得目标人员之间的同行人关系。第二方面,本专利技术实施例还对应提供一种基于车站MAC扫描数据的同行人关联分析装置,包括:n项集生成模块,用于根据所述车站MAC扫描数据生成当前n项集,其中,所述n项集为客户端MAC地址的集合,n为正整数,所述车站MAC扫描数据包括客户端MAC地址、扫描设备MAC地址、历史SSID、采集时间和采集地点编号相对频度计算模块,用于根据所述车站MAC扫描数据计算所述n项集的相对频度;频繁n项集确定模块,用于根据所述相对频度确定基于所述n项集的频繁n项集;频繁项集搜索模块,用于通过逐层搜索的迭代方法搜索全部频繁项集;同行人关系分析模块,用于分析所述全部频繁项集中除频繁1项集以外的频繁项集,获得目标人员之间的同行人关系。本专利技术实施例提供的技术方案带来的有益效果:本技术方案中,根据车站MAC扫描数据生成n项集并计算相应的相对频度,根据相对频度及预设规则确定n项集的频繁n项集,通过逐层搜索的迭代方法搜索全部频繁项集,分析除频繁1项集以外的频繁项集,获得目标人员之间的同行人关系;本方案可实现根据十分有限的数据信息挖掘分析出统计意义上的同行人关系,一定程度上满足用户需要,尤其能有效提高公安部门刑侦追查的效率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本专利技术实施例的内容和这些附图获得其他的附图。图1是本专利技术实施例一提供的基于车站MAC扫描数据的同行人关联分析方法的流程示意图;图2A是本专利技术实施例二提供的基于车站MAC扫描数据的同行人关联分析方法的流程示意图;图2B是图2A中S230的可选实施方式的流程示意图;图2C是图2A中S240的可选实施方式的流程示意图;图3是本专利技术实施例三提供的基于车站MAC扫描数据的同行人关联分析装置的架构示意图;图4A是本专利技术实施例四提供的基于车站MAC扫描数据的同行人关联分析装置的架构示意图;图4B是图4A中相对频度计算模块430的可选实施方式的架构示意图;图4C是图4A中频繁n项集确定模块440的可选实施方式的架构示意图。具体实施方式为使本专利技术解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本专利技术实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一请参考图1,其是本专利技术实施例一提供的基于车站MAC扫描数据的同行人关联分析方法的流程示意图。本实施例的方法可以由计算机来执行,适用于铁路公共安全管理或公安部门刑侦追查等应用场景。本实施例方案主要采用Apirori算法的一种改进方法来挖掘分析同行人关联关系。基于车站MAC(Media/MediumAccessControl,介质访问控制)扫描数据的同行人关联分析方法,可以包括如下步骤:S110:根据车站MAC扫描数据生成当前n项集。示例性的,车站MAC扫描数据包括客户端MAC地址、扫描设备MAC地址、历史SSID(ServiceSetIdentifier,服务集标识)、采集时间和采集地点编号等数据,客户端MAC地址表示目标人员的手机、平板等手持客户端的MAC地址,其作为目标人员的身份标识,扫描设备MAC地址表示车站的MAC扫描设备的MAC地址,采集时间为MAC扫描设备扫描客户端采集到客户端MAC地址时的时间点,采集地点编号为MAC扫描设备所处位置在车站区域内的地点编号。项的集合称为项集,包含n个项的项集称为n项集,n项集为客户端MAC地址的集合,n为正整数。根据车站MAC扫描数据中的各客户端MAC地址,生成当前的n项集。S120:根据车站MAC扫描数据计算n项集的相对频度。示例性的,由于在挖掘同行人关联关系时,希望找到的只是同时出现的多个客户端MAC地址,而对于这多个客户端MAC地址同时出现的次数,在统计所有客户端MAC地址出现的次数中的比重没有要求。因此某一个特定项集相对于整体数据集出现的概率对于最终的结果没有任何影响,根据这一点,在下述S130确定频繁项集的过程中不需要引入原Apirori算法的“支持度”这个概念,转而使用“相对频度”作为筛选频繁项集的评判标准,举例来说,相对频度的物理意义为:当两个人员出现在车站中,若他们在大部分时间都在一起,则可判定这两个人为统计意义上的同行关系。根据车站MAC扫描数据中的客户端MAC地址、扫描设备MAC地址、采集时间和采集地点编号,计算n项集的相对频度。S130:根据相对频度确定基于n项集的频繁n项集。示例性的,与原Apirori算法确定频繁项集的方法类似,以相对频度替换原Apirori算法中的支持度,即相对频度不小于预设阈值时,则与该相对频度相对应的n项集为频繁n项集。S140:通过逐层搜索的迭代方法搜索全部频繁项集。示例性的,与原Apirori算法的处理方式相同,首先找出频繁1项集,通过频繁1项集找出频繁2项集,通过频繁2项集找出频繁3项集,如此逐层搜索,直到无法找到新的k项集,至此可找出全部的频繁项集。生成k项集的方式为:对已有的k-1项集进行自连接,原则是保证前k-2项相同,并按照字典顺序连接。S150:分析全部频繁项集中除频繁1项集以外的频繁项集,获得目标人员之间的同行人关系。示例性的,由于本方案实际需求为挖掘同行人关联关系,因此频繁1项本文档来自技高网...
基于车站MAC扫描数据的同行人关联分析方法和装置

【技术保护点】
一种基于车站MAC扫描数据的同行人关联分析方法,其特征在于,包括:根据所述车站MAC扫描数据生成当前n项集,其中,所述n项集为客户端MAC地址的集合,n为正整数,所述车站MAC扫描数据包括客户端MAC地址、扫描设备MAC地址、历史SSID、采集时间和采集地点编号;根据所述车站MAC扫描数据计算所述n项集的相对频度;根据所述相对频度确定基于所述n项集的频繁n项集;通过逐层搜索的迭代方法搜索全部频繁项集;分析所述全部频繁项集中除频繁1项集以外的频繁项集,获得目标人员之间的同行人关系。

【技术特征摘要】
1.一种基于车站MAC扫描数据的同行人关联分析方法,其特征在于,包括:根据所述车站MAC扫描数据生成当前n项集,其中,所述n项集为客户端MAC地址的集合,n为正整数,所述车站MAC扫描数据包括客户端MAC地址、扫描设备MAC地址、历史SSID、采集时间和采集地点编号;根据所述车站MAC扫描数据计算所述n项集的相对频度;根据所述相...

【专利技术属性】
技术研发人员:张聃
申请(专利权)人:北京锐安科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1