网络爬虫的识别方法及系统技术方案

技术编号：13180690 阅读：156 留言：0更新日期：2016-05-11 12:35

本发明专利技术公开了一种网络爬虫的识别方法及系统，该识别方法包括：客户端将预设URL链接的请求发送至服务器；服务器根据请求生成一第一密钥值，并将加密后的第一密钥值以及生成的JS解密脚本发送至客户端；客户端根据加密后的第一密钥值和JS解密脚本生成第二密钥值，并将其发送至服务器；服务器判断是否存在与第二密钥值相同的第一密钥值，若否，则确定客户端对应的用户为网络爬虫。与现有技术相比，本发明专利技术可以使得网络爬虫在首次访问服务器时就将其识别出来，无需进行大量访问频率的检测，节约了CPU资源，提高了识别效率。同时，无需对不同URL链接的请求进行第一密钥值的储存，大大节约了服务器的存储空间。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机
，特别涉及一种网络爬虫的识别方法及系统。
技术介绍
随着互联网的发展，目前互联网上的爬虫量日益增加，爬虫会伪造用户行为，不断地访问服务器从而获取信息，这样会大大拖慢服务器的运行速度，尤其是当请求的链接需要大量的计算才能得出的时候，同时还会有信息被批量获取的风险。目前主流的反爬虫手段是根据访问频率，对高频率访问的客户端IP地址进行一定的限制。这种做法有以下缺点：首先，需要记录大量的数据，对服务器的存储空间有极高的要求；其次，具有一定的滞后性，需要爬虫访问一定的时间才可以确定对方是爬虫，而这个时候爬虫已经拿到足够的信息了；最后，由于计算量频繁，即使没有爬虫也需要不断地运算，对服务器造成的压力很大。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中根据访问频率识别网络爬虫存在占用服务器存储空间、具有滞后性以及计算量频繁的缺陷，提供一种网络爬虫首次访问就能被识别以及节约服务器存储空间的网络爬虫识别方法及系统。本专利技术是通过下述技术方案来解决上述技术问题的：一种网络爬虫的识别方法，其特点在于，包括以下步骤：S1、客户端将一预设URL(UniformResourceLocator，统一资源定位符)链接的请求发送至服务器；S2、该服务器根据该预设URL链接的请求生成一第一密钥值，在对该第一密钥值进行加密的过程中生成一JS(JavaScript

【技术保护点】
一种网络爬虫的识别方法，其特征在于，包括以下步骤：S1、客户端将一预设URL链接的请求发送至服务器；S2、该服务器根据该预设URL链接的请求生成一第一密钥值，在对该第一密钥值进行加密的过程中生成一JS解密脚本，并将加密后的第一密钥值以及该JS解密脚本发送至该客户端，其中，该JS解密脚本用于对该加密后的第一密钥值进行解密；S3、该客户端根据该加密后的第一密钥值和该JS解密脚本生成一第二密钥值，并将该第二密钥值发送至该服务器；S4、该服务器判断是否存在与该第二密钥值相同的第一密钥值，若否，则确定该客户端对应的用户为网络爬虫。

【技术特征摘要】
1.一种网络爬虫的识别方法，其特征在于，包括以下步骤：
S1、客户端将一预设URL链接的请求发送至服务器；
S2、该服务器根据该预设URL链接的请求生成一第一密钥值，在对该
第一密钥值进行加密的过程中生成一JS解密脚本，并将加密后的第一密钥
值以及该JS解密脚本发送至该客户端，其中，该JS解密脚本用于对该加密
后的第一密钥值进行解密；
S3、该客户端根据该加密后的第一密钥值和该JS解密脚本生成一第二
密钥值，并将该第二密钥值发送至该服务器；
S4、该服务器判断是否存在与该第二密钥值相同的第一密钥值，若否，
则确定该客户端对应的用户为网络爬虫。
2.如权利要求1所述的识别方法，其特征在于，将步骤S2替换为步骤
S2’：
S2’、该服务器根据该预设URL链接的请求每隔一时间段生成一个第一
密钥值，在对当前第一密钥值进行加密的过程中生成一JS解密脚本，并将
加密后的第一密钥值以及该JS解密脚本发送至该客户端，其中，该JS解密
脚本用于对该加密后的第一密钥值进行解密。
3.如权利要求1或2所述的识别方法，其特征在于，步骤S4还包括：
该服务器在判断不存在与该第二密钥值相同的第一密钥值时，将该客户端发
出的所有请求进行拦截，或，向该客户端发送一虚假信息。
4.如权利要求3所述的识别方法，其特征在于，
步骤S3还包括：该客户端将一目标URL链接的请求发送至该服务器；
步骤S4还包括：该服务器在判断存在与该第二密钥值相同的第一密钥值
时，根据该目标URL链接的请求查找与该目标URL链接所对应的一目标信
息，并将该目标信息发送至该客户端。
5.如权利要求1所述的识别方法，其特征在于，第一密钥值和第二密
钥值均...

【专利技术属性】
技术研发人员：崔广宇，李巍，
申请(专利权)人：携程计算机技术上海有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人