本发明专利技术公开了一种用户刷单行为检测方法,包括:步骤1)获取用户的原始DNS日志和原始Radius日志;其中,DNS日志中包括:源IP、源端口、目的IP、目的端口、ID、域名、请求类型、解析结果、解析时间、状态码、请求;Radius日志中包括:用户账户、上线时间、下线时间、外网IP、内网IP、外网起始端口、外网结束端口;其中,DNS日志中的源IP地址和Radius日志中的外网IP地址相对应;步骤2)统计用户每天访问各种APP的访问行为,包括:进入APP、浏览APP内容、下单、支付行为,其中,每个APP中不同的访问行为会对应相应的DNS域名;步骤3)根据以上统计绘制用户每天的APP访问曲线;步骤4)基于APP访问曲线,使用傅立叶级数逼近算法统计出规律性访问、下单、支付的用户,以此发现具有刷单嫌疑的用户。
【技术实现步骤摘要】
本专利技术属于移动互联网领域,属于一种用户刷单行为检测方法和装置。
技术介绍
随着互联网技术的迅猛发展,越来越多的用户开始接入并频繁的使用互联网,互联网厂商,尤其是APP厂商在推广APP的时候推出大量的用户补贴方式,导致越来越多的刷单行为,APP厂商开始大力的打击这种刷单行为,但是由于这些刷单使用的是真实的账户、手机,导致APP厂商定位这些刷单用户越来越艰难。当刷单用户使用真实的手机号以及网上的实名账户进行认证后,当前的算法失去了相应的作用。
技术实现思路
本专利技术所要解决的技术问题是提供一种用户刷单行为检测方法和装置,用于克服现有技术中当刷单用户采用真实账户上网而无法检测的缺点。本专利技术解决上述技术问题所采取的技术方案如下:一种用户刷单行为检测方法,其特征在于,包括:步骤1)获取用户的原始DNS日志和原始Radius日志;其中,DNS日志中包括:源IP、源端口、目的IP、目的端口、ID、域名、请求类型、解析结果、解析时间、状态码、请求;Radius日志中包括:用户账户、上线时间、下线时间、外网IP、内网IP、外网起始端口、外网结束端口;其中,DNS日志中的源IP地址和Radius日志中的外网IP地址相对应;步骤2)统计用户每天访问各种APP的访问行为,包括:进入APP、浏览APP内容、下单、支付行为,其中,每个APP中不同的访问行为会对应相应的DNS域名;步骤3)根据以上统计绘制用户每天的APP访问曲线;步骤4)基于APP访问曲线,使用傅立叶级数逼近算法统计出规律性访问、下单、支付的用户,以此发现具有刷单嫌疑的用户。优选的是,步骤2)中,进一步包括:通过对用户1天24小时内每个小时对APP的访问行为统计,得出单个用户一天内对于APP的所有访问记录,绘制访问曲线,横坐标是时间,纵坐标是访问次数。优选的是,所述步骤1)中原始数据使用的是3天共72小时的原始DSN日志。优选的是,使用傅立叶级数逼近算法统计出规律性访问、下单、支付的用户,包括:T是总时间段,N是一个足够大的数,f(t)是访问流量的曲线,假设整段时间T被分成了N段,是其中N个点的数据;利用傅立叶级数逼近函数f(t),这里l取值0,1,2,…N-1.对不同的计算cost function可以设定lmax,以及一个足够小的数e,如果存在某个l<lmax,Cl<e,可以此时的是一个原函数f(t)的一个近似,并且是一些正弦,余弦函数的叠加,最短的周期是其中,当前24项正弦余弦数值之和几乎等于所有追踪点正弦余弦之和,数值越接近,说明规律越强,也就是越接近机器人。一种用户刷单行为检测装置,包括:日志获取单元,用于获取用户的原始DNS日志和原始Radius日志;其中,DNS日志中包括:源IP、源端口、目的IP、目的端口、ID、域名、 请求类型、解析结果、解析时间、状态码、请求;Radius日志中包括:用户账户、上线时间、下线时间、外网IP、内网IP、外网起始端口、外网结束端口;其中,DNS日志中的源IP地址和Radius日志中的外网IP地址相对应;统计单元,用于统计用户每天访问各种APP的访问行为,包括:进入APP、浏览APP内容、下单、支付行为,其中,每个APP中不同的访问行为会对应相应的DNS域名;用户分析单元,用于根据以上统计绘制用户每天的APP访问曲线;基于APP访问曲线,使用傅立叶级数逼近算法统计出规律性访问、下单、支付的用户,以此发现具有刷单嫌疑的用户。优选的是,所述用户分析单元,进一步用于:通过对用户1天24小时内每个小时对APP的访问行为统计,得出单个用户一天内对于APP的所有访问记录,绘制访问曲线,横坐标是时间,纵坐标是访问次数。优选的是,所述步骤1)中原始数据使用的是3天共72小时的原始DSN日志。优选的是,所述用户分析单元,使用傅立叶级数逼近算法统计出规律性访问、下单、支付的用户,具体包括:T是总时间段,N是一个足够大的数,f(t)是访问流量的曲线,假设整段时间T被分成了N段,是其中N个点的数据;利用傅立叶级数逼近函数f(t),这里l取值0,1,2,…N-1.对不同的计算cost function可以设定lmax,以及一个足够小的数e,如果存在某个l<lmax,Cl<e,可以此时的是一个原函数f(t)的一个近似,并且是一些正弦,余弦函数的叠加,最短的周期是其中,当前24项正弦余弦数值之和几乎等于所有追踪点正弦余弦之和,数值越接近,说明规律越强,也就是越接近机器人。本专利技术采取了上述方案以后,其通过大数据存储、计算平台抽象、分析用户行为,使用傅立叶级数逼近算法,计算、分析出规律性访问的用户,针对此类用户,结合GPS数据,发现是否属于刷单用户。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明下面结合附图对本专利技术进行详细的描述,以使得本专利技术的上述优点更加明确。其中,图1是本专利技术用户刷单行为检测方法的流程示意图;图2是本专利技术用户刷单行为检测方法的一个实施例的绘制曲线示意图;图3是本专利技术用户刷单行为检测装置的结构示意图。具体实施方式以下将结合附图及实施例来详细说明本专利技术的实施方式,借此对本专利技术如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本专利技术中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本专利技术的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。实施例一:如图1所示,一种用户刷单行为检测方法,包括:步骤1)获取用户的原始DNS日志和原始Radius日志;其中,DNS日志中包括:源IP、源端口、目的IP、目的端口、ID、域名、请求类型、解析结果、解析时间、状态码、请求;Radius日志中包括:用户账户、上线时间、下线时间、外网IP、内网IP、外网起始端口、外网结束端口;其中,DNS日志中的源IP地址和Radius日志中的外网IP地址相对应;步骤2)统计用户每天访问各种APP的访问行为,包括:进入APP、浏览APP内容、下单、支付行为,其中,每个APP中不同的访问行为会对应相应的DNS域名;步骤3)根据以上统计绘制用户每天的APP访问曲线;步骤4)基于APP访问曲线,使用傅立叶级数逼近算法统计出规律性访问、下单、支付的用户,以此发现具有刷单嫌疑的用户。也就是说,本专利技术依托于Hadoop大数据存储、分析平台,依赖原始DNS日志、原始Radius日志,首先计算用户每天对于APP的访问行为,包括进入APP、浏览APP内容、下单、支付等行为(每个APP中不同的行为会对应相应的DNS域名),由此,根据计算结果,绘制用户每天的APP访问曲线,基于用户每天的访问曲线,使用傅立叶级数逼近算法统计出规律性访问、下单、支付的用户。实施例二:进一步地对实施例一进行说明,其中,具体来说:当用户通过域名(www.baidu.com)访问网站时,由于以太网传输过程中是根据IP地址来寻址本文档来自技高网...
【技术保护点】
一种用户刷单行为检测方法,其特征在于,包括:步骤1)获取用户的原始DNS日志和原始Radius日志;其中,DNS日志中包括:源IP、源端口、目的IP、目的端口、ID、域名、请求类型、解析结果、解析时间、状态码、请求;Radius日志中包括:用户账户、上线时间、下线时间、外网IP、内网IP、外网起始端口、外网结束端口;其中,DNS日志中的源IP地址和Radius日志中的外网IP地址相对应;步骤2)统计用户每天访问各种APP的访问行为,包括:进入APP、浏览APP内容、下单、支付行为,其中,每个APP中不同的访问行为会对应相应的DNS域名;步骤3)根据以上统计绘制用户每天的APP访问曲线;步骤4)基于APP访问曲线,使用傅立叶级数逼近算法统计出规律性访问、下单、支付的用户,以此发现具有刷单嫌疑的用户。
【技术特征摘要】
1.一种用户刷单行为检测方法,其特征在于,包括:步骤1)获取用户的原始DNS日志和原始Radius日志;其中,DNS日志中包括:源IP、源端口、目的IP、目的端口、ID、域名、请求类型、解析结果、解析时间、状态码、请求;Radius日志中包括:用户账户、上线时间、下线时间、外网IP、内网IP、外网起始端口、外网结束端口;其中,DNS日志中的源IP地址和Radius日志中的外网IP地址相对应;步骤2)统计用户每天访问各种APP的访问行为,包括:进入APP、浏览APP内容、下单、支付行为,其中,每个APP中不同的访问行为会对应相应的DNS域名;步骤3)根据以上统计绘制用户每天的APP访问曲线;步骤4)基于APP访问曲线,使用傅立叶级数逼近算法统计出规律性访问、下单、支付的用户,以此发现具有刷单嫌疑的用户。2.根据权利要求1所述的用户刷单行为检测方法,其特征在于,步骤2)中,进一步包括:通过对用户1天24小时内每个小时对APP的访问行为统计,得出单个用户一天内对于APP的所有访问记录,绘制访问曲线,横坐标是时间,纵坐标是访问次数。3.根据权利要求1所述的用户刷单行为检测方法,其特征在于,所述步骤1)中原始数据使用的是3天共72小时的原始DSN日志。4.根据权利要求1所述的用户刷单行为检测方法,其特征在于,使用傅立叶级数逼近算法统计出规律性访问、下单、支付的用户,包括:T是总时间段,N是一个足够大的数,f(t)是访问流量的曲线,假设整段时间T被分成了N段,是其中N个点的数据;利用傅立叶级数逼近函数f(t),这里l取值0,1,2,…N-1.对不同的计算cost function可以设定lmax,以及一个足够小的数e,如果存在某个l<lmax,Cl<e,可以此时的是一个原函数f(t)的一个近似,并且是一些正弦,余弦函数的叠加,最短的周期是;其中,当前24项正弦余弦数值之和几乎等于所有追踪点正弦余弦之和,数值越接近,说明规律越强,也就是越接近机器人。5.一种用户刷单行为检测...
【专利技术属性】
技术研发人员:丁文涛,尹嘉路,
申请(专利权)人:久远谦长北京技术服务有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。