网页访问量作弊的检测方法和装置制造方法及图纸

技术编号:9694761 阅读:161 留言:0更新日期:2014-02-21 01:09
本发明专利技术公开了一种网页访问量作弊的检测方法和装置。该网页访问量作弊的检测方法包括:获取目标网页的访问量;判断访问量是否满足预定条件;如果访问量满足预定条件,获取目标网页的访问来源信息;以及根据访问来源信息判断目标网页的访问量是否作弊,通过判断获取到的目标网页的访问量是否满足预设条件,当访问量满足预设条件时,认定为目标网页访问量作弊。通过本发明专利技术,解决了对网页访问量作弊的识别不准确的问题,进而达到了准确识别目标网页的访问量作弊的效果。

【技术实现步骤摘要】
网页访问量作弊的检测方法和装置
本专利技术涉及互联网领域,具体而言,涉及一种网页访问量作弊的检测方法和装置。
技术介绍
随着越来越多的广告主选择互联网进行广告投放,网络广告费用支出逐年递增,对互联网广告投放效果的定量评估和第三方权威检测已经成为广告主的刚性需求。但是,与传统媒体行业不同,互联网广告行业的技术门槛更高、数据结构更为复杂、评估指标维度更多、投放技术要求更高。而这些都为互联网广告作弊提供了可操作的空间,损害了广告主的利益。下面对上述中一些术语进行介绍:互联网广告作弊:媒体为了刷广告流量而进行的作弊。广告主:是广告活动的发布者,是在网上销售或宣传自己产品和服务的商家,是联盟营销广告的提供者。任何推广、销售其产品或服务的商家都可以作为广告主。广告主发布广告活动,并按照网站主完成的广告活动中规定的营销效果的总数量及单位效果价格向网站主支付费用。目前,网络搜索服务商所经营的竞价广告业务以及搜索排名服务中很多都有点击量作弊的行为。根据业内人士估计,搜索引擎广告的总点击量中两成以上是子虚乌有的。一般地,点击量作弊的方法分“自动”和“手工”两类。前者往往是通过“机器人”(能够自动执行一系列循环点击、页面刷新操作的脚本程序)来不断点击出现在网站和搜索结果页面上的网幅图像广告Banner。后者则是采取“人海战术”,以较低的成本雇用廉价劳动力来进行人工点击各类广告链接——这种难以通过技术手段侦测的作弊方式如今正呈上升趋势,而一些闹得沸沸扬扬的网络评选作弊事件其实也都与这种作弊方式有关。在网页中嵌入内联框架iframe是互联网广告作弊最常用的技巧。该方法一般是在自己的网页上嵌入大小为0X0或1X1的iframe,也就是用户不可见的iframe。通过iframe打开其他页面,使得用户打开了并非自己想要进入的网页,在用户看不见的情况下刷流量。传统的反作弊方法难以有效识别这种采用“人海战术”和嵌入iframe的作弊方式,导致点击量作弊情况难以有效抑制。互联网广告作弊归根结底都是网站主为了刷访问量而实施的作弊行为,因此第三方权威检测机构对广告网页刷访问量的作弊行为进行检测,能有效地保护广告主的利益。但是现有技术中,很少有能够识别网页访问量作弊的方案。针对现有技术中对网页访问量作弊识别不准确的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种网页访问量作弊的检测方法和装置,以解决现有技术中对网页访问量作弊识别不准确的问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种网页访问量作弊的检测方法。根据本专利技术的网页访问量作弊的检测方法包括:获取目标网页的访问量;判断访问量是否满足预定条件;如果访问量满足预定条件,获取目标网页的访问来源信息;以及根据访问来源信息判断目标网页的访问量是否作弊。进一步地,获取目标网页的访问量包括获取目标网页的历史访问量和当前访问量,判断访问量是否满足预定条件包括:获取历史访问量和当前访问量的比值;判断比值是否超出第一设定阈值;如果比值超出第一设定阈值,则确定访问量满足预定条件;如果比值未超出第一设定阈值,则确定访问量不满足预定条件。进一步地,获取目标网页的访问量包括获取目标网页的历史访问量和当前访问量,判断访问量是否满足预定条件包括:获取历史访问量和当前访问量的差值;判断差值是否超出第二设定阈值;如果差值超出第二设定阈值,则确定访问量满足预定条件;如果差值未超出第二设定阈值,则确定访问量不满足预定条件。进一步地,获取目标网页的访问来源信息包括:获取目标网页的源代码;在源代码中加入检测代码以获取目标网页的访问IP地址;将访问IP地址作为访问来源信息。根据访问来源信息判断目标网页的访问量是否作弊包括:获取访问IP地址中的第一访问IP地址的第一访问量,第一访问IP地址为访问IP地址中访问目标网页最多的一个访问IP地址;计算第一访问量与访问量的比值;判断第一访问量与访问量的比值是否超出第三设定阈值;如果第一访问量与访问量的比值超出第三设定阈值,则确定目标网页的访问量作弊,如果第一访问量与访问量的比值未超出第三设定阈值,则确定目标网页的访问量未作弊。进一步地,确定目标网页的访问量作弊包括:获取第一访问IP的访问停留时间;判断访问停留时间是否超出第四设定阈值;如果访问停留时间未超出第四设定阈值,则确定目标网页的访问量作弊;如果访问停留时间超出第四设定阈值,则确定目标网页的访问量未作弊。进一步地,在获取目标网页的访问量之前,网页访问量作弊的检测方法还包括:获取目标网页的源代码;检测源代码中是否存在大小为0*0或者1*1的内联框架iframe ;如果源代码中不存在i frame,则获取目标网页的访问量。为了实现上述目的,根据本专利技术的另一方面,提供了一种网页访问量作弊的检测装置。根据本专利技术的网页访问量作弊的检测装置包括:第一获取单元,用于获取目标网页的访问量;第一判断单元,用于判断访问量是否满足预定条件;第二获取单元,用于当访问量满足预定条件时,获取目标网页的访问来源信息;第二判断单元,用于根据访问来源信息判断目标网页的访问量是否作弊。进一步地,第一获取单元还用于获取目标网页的历史访问量和当前访问量,其中,第一判断单元包括:第一获取模块,用于获取历史访问量和当前访问量的比值;第一判断模块,用于判断比值是否超出第一设定阈值;第一确定模块,用于当比值超出第一设定阈值时,确定访问量满足预定条件,当比值未超出第一设定阈值时,确定访问量不满足预定条件。进一步地,第一获取单元还用于获取目标网页的历史访问量和当前访问量,其中:第一判断单元包括:第二获取模块,用于获取历史访问量和当前访问量的差值;第二判断模块,用于判断差值是否超出第二设定阈值;第二确定模块,用于当差值超出第二设定阈值时,确定访问量满足预定条件,当差值未超出第二设定阈值时,确定访问量不满足预定条件。进一步地,第二获取单元包括:第三获取模块,用于获取目标网页的源代码;第四获取模块,用于在源代码中加入检测代码以获取目标网页的访问IP地址;生成模块,用于将访问IP地址作为访问来源信息;第二判断单元包括:第五获取模块,用于获取访问IP地址中的第一访问IP地址的第一访问量,第一访问IP地址为访问IP地址中访问目标网页最多的一个访问IP地址;计算模块,用于计算第一访问量与访问量的比值;第三判断模块,用于判断第一访问量与访问量的比值是否超出第三设定阈值;第三确定模块,用于当第一访问量与访问量的比值超出第三设定阈值时,确定目标网页的访问量作弊,当第一访问量与访问量的比值未超出第三设定阈值时,确定目标网页的访问量未作弊。进一步地,第三确定模块包括:获取子模块,用于获取第一访问IP的访问停留时间;判断子模块,用于判断访问停留时间是否超出第四设定阈值;确定子模块,用于当访问停留时间未超出第四设定阈值时,确定目标网页的访问量作弊,当访问停留时间超出第四设定阈值时,确定目标网页的访问量未作弊。进一步地,网页访问量作弊的检测装置还包括:第三获取单元,用于在获取目标网页的访问量之前,获取目标网页的源代码;检测单元,用于检测源代码中是否存在大小为0*0或者1*1的内联框架iframe ;确定单元,用于当源代码中不存在iframe时,获取目标网页的访问量本文档来自技高网
...
网页访问量作弊的检测方法和装置

【技术保护点】
一种网页访问量作弊的检测方法,其特征在于,包括:获取目标网页的访问量;判断所述访问量是否满足预定条件;如果所述访问量满足预定条件,获取所述目标网页的访问来源信息;以及根据所述访问来源信息判断所述目标网页的访问量是否作弊。

【技术特征摘要】
1.一种网页访问量作弊的检测方法,其特征在于,包括: 获取目标网页的访问量; 判断所述访问量是否满足预定条件; 如果所述访问量满足预定条件,获取所述目标网页的访问来源信息;以及 根据所述访问来源信息判断所述目标网页的访问量是否作弊。2.根据权利要求1所述的网页访问量作弊的检测方法,其特征在于,获取目标网页的访问量包括获取所述目标网页的历史访问量和当前访问量,判断所述访问量是否满足预定条件包括: 获取所述历史访问量和所述当前访问量的比值; 判断所述比值是否超出第一设定阈值; 如果所述比值超出所述第一设定阈值,则确定所述访问量满足所述预定条件;以及 如果所述比值未超出所述第一设定阈值,则确定所述访问量不满足所述预定条件。3.根据权利要求1所述的网页访问量作弊的检测方法,其特征在于,获取目标网页的访问量包括获取所述目标网页的历史访问量和当前访问量,判断所述访问量是否满足预定条件包括: 获取所述历史访问量和所述当前访问量的差值; 判断所述差值是否超出第二设定阈值;· 如果所述差值超出所述第二设定阈值,则确定所述访问量满足所述预定条件;以及 如果所述差值未超出所述第二设定阈值,则确定所述访问量不满足所述预定条件。4.根据权利要求1所述的网页访问量作弊的检测方法,其特征在于, 获取所述目标网页的访问来源信息包括:获取所述目标网页的源代码;在所述源代码中加入检测代码以获取所述目标网页的访问IP地址;将所述访问IP地址作为所述访问来源信息; 根据所述访问来源信息判断所述目标网页的访问量是否作弊包括:获取所述访问IP地址中的第一访问IP地址的第一访问量,所述第一访问IP地址为所述访问IP地址中访问所述目标网页最多的一个访问IP地址; 计算所述第一访问量与所述访问量的比值; 判断所述第一访问量与所述访问量的比值是否超出第三设定阈值; 如果所述第一访问量与所述访问量的比值超出所述第三设定阈值,则确定所述目标网页的访问量作弊,以及 如果所述第一访问量与所述访问量的比值未超出所述第三设定阈值,则确定所述目标网页的访问量未作弊。5.根据权利要求4所述的网页访问量作弊的检测方法,其特征在于,确定所述目标网页的访问量作弊包括: 获取所述第一访问IP的访问停留时间; 判断所述访问停留时间是否超出第四设定阈值; 如果所述访问停留时间未超出所述第四设定阈值,则确定所述目标网页的访问量作弊;以及 如果所述访问停留时间超出所述第四设定阈值,则确定所述目标网页的访问量未作弊。6.根据权利要求1所述的网页访问量作弊的检测方法,其特征在于,在获取目标网页的访问量之前,所述网页访问量作弊的检测方法还包括: 获取所述目标网页的源代码; 检测所述源代码中是否存在大小为0*0或者1*1的内联框架iframe ;以及 如果所述源代码中不存在所述iframe,则获取所述目标网页的访问量。7.—种网页访问量作弊的检测装置,其特征在于,包括: 第一获取单元,用于获取目标网页的访问量; 第一判断单元,用于判断所述访问量是否满足...

【专利技术属性】
技术研发人员:祁国晟吴充马燕龙杨韬戴飞余德乐
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1