本发明专利技术涉及一种刷量工具检测方法,所述方法包括:获取应用信息,所述应用信息包括应用的渠道标识;获取安装所述应用的用户信息,所述用户信息包括用户的应用安装列表;采用SimHash算法计算所述应用安装列表的SimHash值;根据所述SimHash值对用户进行聚类统计;根据所述聚类统计结果检测所述渠道标识对应的应用渠道是否使用了刷量工具。本发明专利技术还提供一种刷量工具检测装置。本发明专利技术不受一些好的刷量工具因硬件属性的分布情况与正常情况下的一致性所带来的局限性,且检测结果准确。
【技术实现步骤摘要】
本专利技术涉及网络数据检测领域,特别是涉及一种刷量工具检测方法和装置。
技术介绍
移动终端(以手机为例)上的应用是指通过手机通信终端接入或办理相关应用型功能的软件,应用渠道就是指所有可以获取手机应用安装包和用户信息的平台,主要包括ios渠道(如APPStore)和Android渠道(如手机助手)两大类。每一个用户在注册或登录了手机应用的账号后,手机应用的供应商都要给应用渠道支付一定的推广费用。目前,一些应用渠道为了骗取推广费用,就会利用刷量工具来进行作弊。刷量工具指安装到手机上可以在同一部手机上生成多个虚假新用户的应用,这类应用可以随机或基于已有用户数据文件生成手机设备号IMEI(InternationalMobileEquipmentIdentity,国际移动设备身份码)、IMSI(InternationalMobileSubscriberIdentificationNumber,国际移动用户识别号码)、MAC地址、屏幕分辨率、机型、SIM卡号、手机号、运营商编号或名称、手机操作系统(OS)版本等各种参数。其中,IMEI是由15位数字组成的\电子串号\,每个手机在组装完成后都将被赋予一个全球唯一的一组号码,这个号码从生产到交付使用都将被制造生产的厂商所记录,每个不同的IMEI代表一个新的用户;IMSI是储存在SIM卡中用于区别移动用户的标志,可用于区别移动用户的有效信息。为了防止这种作弊事件的发生,很有必要检测应用渠道是否使用了刷量工具。传统的检测方法主要有两种:第一种检测方法是检测当前应用渠道下硬件属性的分布是否正常。比如,若当前应用渠道下用户的手机机型(手机所属的厂家及型号,如samsung_GN708T)分布情况与正常情况下用户的手机机型分布情况有很大差异,则当前应用渠道可能使用了刷量工具,或者如果当前应用渠道下用户的手机OS版本(如android4.0.1)分布情况与正常情况下用户的手机OS版本分布情况有很大差异,则当前应用渠道可能使用了刷量工具,针对其他硬件属性的分布异常检测类似。第二种检测方法是检测应用渠道的留存率(登录用户数/新用户数*100%)是否正常,因为刷量工具生成的新用户可能不会再次登录,使得其留存率出现异常。然而,好的刷量工具生成的虚假新用户所对应的硬件属性与正常情况下的硬件属性在分布上是一致,这使得第一种检测方法具有一定的局限性;而留存率更多地作为评价手机应用质量的指标,留存率越高代表手机应用越好,这使得第二种检测方法得到的检测结果不够准确。
技术实现思路
基于此,有必要针对传统检测方法具有局限性和检测结果不准确的技术问题,提供一种刷量工具检测方法和装置。一种刷量工具检测方法,所述方法包括:获取应用信息,所述应用信息包括应用的渠道标识;获取安装所述应用的用户信息,所述用户信息包括用户的应用安装列表;采用SimHash算法计算所述应用安装列表的SimHash值;根据所述SimHash值对用户进行聚类统计;根据所述聚类统计结果检测所述渠道标识对应的应用渠道是否使用了刷量工具。一种刷量工具检测装置,所述装置包括:第一获取模块,用于获取应用信息,所述应用信息包括应用的渠道标识;第二获取模块,用于获取安装所述应用的用户信息,所述用户信息包括用户的应用安装列表;计算模块,用于采用SimHash算法计算所述应用安装列表的SimHash值;聚类统计模块,用于根据所述SimHash值对用户进行聚类统计;检测模块,用于根据所述聚类统计结果检测所述渠道标识对应的应用渠道是否使用了刷量工具。上述刷量工具检测方法和装置,考虑到刷量工具可以在一个移动终端上生成多个虚假新用户,但这个移动终端上安装的都是同样的应用,因此通过采用SimHash算法计算所述应用安装列表的SimHash值,并根据所述SimHash值对用户进行聚类统计,这样可以找到具有相同应用安装列表的用户集合以获得应用渠道作弊更为直接的证据,根据所述聚类统计结果检测应用渠道是否使用了刷量工具,这样不会受一些好的刷量工具因硬件属性的分布情况与正常情况下的一致性所带来的局限性,刷量工具的使用会直接导致很多用户的应用安装列表相同,因此,应用安装列表的相似性比留存率更能准确地反应出应用渠道是否使用了刷量工具。附图说明图1为一个实施例中刷量工具检测系统的应用环境图;图2为一个实施例中服务器的结构示意图;图3为一个实施例中刷量工具检测方法的流程示意图;图4为一个实施例中采用SimHash算法计算应用安装列表的SimHash值的方法流程示意图;图5为一个实施例中根据SimHash值对用户进行聚类统计的方法流程示意图;图6为一个实施例中根据所述聚类统计结果检测所述渠道标识对应的应用渠道是否使用了刷量工具的方法流程示意图;图7为一个具体应用场景中手机与服务器的交互示意图;图8为一个实施例中刷量工具检测装置的结构框图;图9为一个实施例中计算模块的结构框图;图10为一个实施例中聚类统计模块的结构框图;图11为一个实施例中检测模块的结构框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,在一个实施例中,提供了一种刷量工具检测系统,包括多个移动终端102、服务器104。其中,移动终端102上运行有应用程序,至少提供应用信息和用户信息的发送功能,所述应用信息包括应用的渠道标识,所述用户信息包括用户的应用安装列表。正常情况下,每个移动终端102对应唯一的用户。服务器104用于接收所述移动终端102发送的应用信息和用户信息,并检测所述渠道标识对应的应用渠道是否使用了刷量工具。在一个实施例中,上述图1中的服务器104的内部结构图如图2所示。服务器104包括通过系统总线连接的处理器、内存、存储介质、网络接口和输出设备。其中,该服务器的存储介质存储有操作系统和一种刷量工具检测装置,该刷量工具检测装置用于实现一种刷量工具检测方法。该服务器的处理器被配置为执行一种刷量工具检测方法。该输出设备包括显示屏。如图3所示,在一个实施例中,提供了一种刷量工具检测方法,本实施例以该方法应用于上述图2中的服务器来举例说明。该刷量工具检测方法具体包括如下步骤:步骤S302:获取应用信息,所述应用信息包括应用的渠道标识。具体地,渠道标识是指定的为用户提供应用安装包的应用渠道的唯一标识。用户通过某个应用渠道下载的应用安装包中都会自带有相应的渠道标识。渠道标识可以是包括数字、字母和标点符号中的至少一种的字符的字符串。步骤S302可以在步骤304之前或之后执行。步骤S304:获取安装所述应用的用户信息,所述用户信息包括用户的应用安装列表。具体地,应用安装列表是指移动终端的用户安装的APP名称的集合。移动终端可以直接向服务器发送用户信息,所述用户信息包括APP安装列表,服务器也可以使用第三方工具获得用户对应的移动终端的软硬件属性。举例说明,如果移动终端对应的A用户通过第三方电子市场这么一个应用渠道下载了一个网络聊天工具的应用安装包,那么这个应用安装包中会自带有渠道标识。当移动终端给服务器上报数据时,服务器可本文档来自技高网...
【技术保护点】
一种刷量工具检测方法,所述方法包括:获取应用信息,所述应用信息包括应用的渠道标识;获取安装所述应用的用户信息,所述用户信息包括用户的应用安装列表;采用SimHash算法计算所述应用安装列表的SimHash值;根据所述SimHash值对用户进行聚类统计;根据所述聚类统计结果检测所述渠道标识对应的应用渠道是否使用了刷量工具。
【技术特征摘要】
1.一种刷量工具检测方法,所述方法包括:获取应用信息,所述应用信息包括应用的渠道标识;获取安装所述应用的用户信息,所述用户信息包括用户的应用安装列表;采用SimHash算法计算所述应用安装列表的SimHash值;根据所述SimHash值对用户进行聚类统计;根据所述聚类统计结果检测所述渠道标识对应的应用渠道是否使用了刷量工具。2.根据权利要求1所述的方法,其特征在于,所述采用SimHash算法计算所述应用安装列表的SimHash值的步骤,包括:将所述应用安装列表按应用属性进行排序;以相邻两个应用名称组成的字符串作为一个特征构造特征集合;采用SimHash算法计算所述特征集合的SimHash值。3.根据权利要求1所述的方法,其特征在于,根据所述SimHash值对用户进行聚类统计的步骤,包括:将具有相同SimHash值的用户聚类到一个簇中;统计所述簇的不同属性值。4.根据权利要求3所述的方法,其特征在于,所述根据所述聚类统计结果检测所述渠道标识对应的应用渠道是否使用了刷量工具的步骤,包括:将所述簇的不同属性值与相应的属性阈值进行比较;根据比较结果检测所述渠道标识对应的应用渠道是否使用了刷量工具。5.根据权利要求4所述的方法,其特征在于,所述根据所述比较结果检测所述渠道标识对应的应用渠道是否使用了刷量工具的步骤,包括:检测所述簇的不同属性值中是否至少有一个属性值大于等于其相应的属性阈值,若是,则所述渠道标识对应的应用渠...
【专利技术属性】
技术研发人员:贺海军,孔蓓蓓,熊健,熊焰,杨剑鸣,
申请(专利权)人:深圳市腾讯计算机系统有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。