本发明专利技术公开了一种网页设置系统及方法,方法包括以下步骤:S1、生成一用于表征网页数据的流媒体,并将所述流媒体固定设置于网页底层;S2、生成至少一个用于响应用户点击操作的浮动层,并将所述浮动层设置于网页顶层;S3、查询网页中用于响应用户点击操作的至少一个点击区域,并提取所述点击区域在所述流媒体中的位置坐标;S4、设置每一个浮动层与一点击区域的对应关系,并根据位置坐标将每一个浮动层设置为与对应的点击区域相重合。本发明专利技术从根本上封堵目前基于文本信息抓取数据的爬虫,避免网页数据被爬虫抓取,减轻网络由于爬虫抓取所占用的宽带资源,并且不会损害用户体验,保护企业数据不被他人批量抓取利用。
【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种,方法包括以下步骤:S1、生成一用于表征网页数据的流媒体,并将所述流媒体固定设置于网页底层;S2、生成至少一个用于响应用户点击操作的浮动层,并将所述浮动层设置于网页顶层;S3、查询网页中用于响应用户点击操作的至少一个点击区域,并提取所述点击区域在所述流媒体中的位置坐标;S4、设置每一个浮动层与一点击区域的对应关系,并根据位置坐标将每一个浮动层设置为与对应的点击区域相重合。本专利技术从根本上封堵目前基于文本信息抓取数据的爬虫,避免网页数据被爬虫抓取,减轻网络由于爬虫抓取所占用的宽带资源,并且不会损害用户体验,保护企业数据不被他人批量抓取利用。【专利说明】
本专利技术涉及一种互联网领域,特别是涉及一种。
技术介绍
传统网页上的信息都是通过HTML (超文本标记语言)方式以明文传送,虽然有JS(—种动态类型、弱类型、基于原型的语言)等技术手段进行一定的加密或乱序等,但是对于浏览器最终解析出来之后,最终的D0M(文件对象类型)都是明文的,因此通过爬虫程序等都可以轻松实现解码并取得其中的信息。 目前的ONLINE(在线)以及手机端浏览器页面,无法避免地会被网络爬虫抓取数据,信息安全无法得到有效的保障。现有技术中也存在一些反爬虫措施,但是存在以下不足: 无法在第一时间封锁爬虫的抓取行为,必须在抓取量达到某一阈值之后,才会触发封锁措施;常见的封锁措施都是基于IP(网络之间互连的协议)地址的,即封锁当事IP,以达到目的,但是很多爬虫都是分布式、且基于动态IP的,上述封锁措施无法实现彻底封锁;而且如果IP地址封锁过多,会导致真实请求被屏蔽,直接影响网站的流量和客户体验,间接导致网站盈利能力下降。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中网页数据会被爬虫爬取,并且反爬虫措施存在很多不足的缺陷,提供一种。 本专利技术是通过下述技术方案来解决上述技术问题的: 本专利技术提供了一种网页设置方法,其特点在于,包括以下步骤: S1、生成一用于表征网页数据的流媒体,并将所述流媒体固定设置于网页底层; S2、生成至少一个用于响应用户点击操作的浮动层,并将所述浮动层设置于网页顶层; S3、查询网页中用于响应用户点击操作的至少一个点击区域,并提取所述点击区域在所述流媒体中的位置坐标; S4、设置每一个浮动层与一点击区域的对应关系,并根据位置坐标将每一个浮动层设置为与对应的点击区域相重合。 较佳地,所述流媒体的帧数为I帧。 较佳地,步骤S4包括: S41、设置每一个浮动层与一点击区域的对应关系,并设置所述浮动层的长和宽,以使得所述浮动层与对应的点击区域尺寸相同; S42、提取所述点击区域的左上角的位置坐标,并以所述左上角的位置坐标作为所述浮动层的起始坐标、以步骤S41中的长和宽设置所述浮动层,以使得所述浮动层与对应的点击区域相重合。 本专利技术的目的在于还提供了一种网页设置系统,其特点在于,包括: 一流媒体生成模块,用于生成一用于表征网页数据的流媒体,并将所述流媒体固定设置于网页底层; 一浮动层生成模块,用于生成至少一个用于响应用户点击操作的浮动层,并将所述浮动层设置于网页顶层; 一查询模块,用于查询网页中用于响应用户点击操作的至少一个点击区域,并提取所述点击区域在所述流媒体中的位置坐标; 一浮动层设置模块,用于设置每一个浮动层与一点击区域的对应关系,并根据位置坐标将每一个浮动层设置为与对应的点击区域相重合。 较佳地,所述流媒体的帧数为I帧。 较佳地,所述浮动层设置模块包括一第一设置单元及一第二设置单元,所述第一设置单元用于设置每一个浮动层与一点击区域的对应关系,并设置所述浮动层的长和宽,以使得所述浮动层与对应的点击区域尺寸相同;所述第二设置单元用于提取所述点击区域的左上角的位置坐标,并以所述左上角的位置坐标作为所述浮动层的起始坐标、以所述长和宽设置所述浮动层,以使得所述浮动层与对应的点击区域相重合。 本专利技术的积极进步效果在于:本专利技术从根本上封堵目前基于文本信息抓取数据的爬虫,避免网页数据被爬虫抓取,减轻网络由于爬虫抓取所占用的宽带资源,并且不会损害用户体验,保护企业数据不被他人批量抓取利用;并且本专利技术完整保留了用户的操作习惯,用户无需为新的网页页面付出任何学习成本,用户的肉眼直观感受与以往无异,使得爬虫无法采用目前主流的方式进行数据抓取,直接保护了企业数据的私密性。 【专利附图】【附图说明】 图1为本专利技术的一实施例的网页设置系统的模块示意图。 图2为本专利技术的一实施例的网页设置方法的流程图。 【具体实施方式】 下面通过实施例的方式进一步说明本专利技术,但并不因此将本专利技术限制在所述的实施例范围之中。 如图1所示,本专利技术的网页设置系统包括一流媒体生成模块1、一浮动层生成模块2、一查询模块3以及一浮动层设置模块4,本专利技术能够有效地封堵爬虫抓取网页数据,具体地,所述流媒体生成模块I会生成帧数为I帧的用于表征网页数据的流媒体,用于通过I帧流媒体来展现网页数据,并将所述流媒体固定设置于网页底层;当然,在本专利技术的具体实施过程中,对流媒体还可以添加更多的帧数,从而提供更绚丽的加载效果,或显示额外信息。 所述浮动层生成模块2则生成至少一个用于响应用户点击操作的浮动层,具体数量可根据实际需要进行生成,以前端JS动态绑定各浮动层对应的事件(如点击事件、鼠标移动事件等),所述查询模块3则查询网页中用于响应用户点击操作的至少一个点击区域,并提取所述点击区域在所述流媒体中的位置坐标,而所述浮动层设置模块4则会设置每一个浮动层与一点击区域的对应关系,并根据位置坐标将每一个浮动层设置为与对应的点击区域相重合,以实现对各浮动层的精确定位,确保页面上的用户点击区域与下层流媒体显示的相应内容完全重合。 其中,所述浮动层设置模块4具体包括一第一设置单元41及一第二设置单元42,所述第一设置单元41用于设置每一个浮动层与一个点击区域的对应关系,并设置所述浮动层的长和宽,以使得所述浮动层与对应的点击区域尺寸相同;所述第二设置单元42则提取所述点击区域的左上角的位置坐标,并以所述左上角的位置坐标作为所述浮动层的起始坐标、以所述长和宽设置所述浮动层,以使得所述浮动层与对应的点击区域相重合。 本专利技术在通过上述模块设置好网页页面后,就可以动态加载上述各项内容,实现页面无刷新更新,以符合现有的用户操作习惯,综上可以看出,在本专利技术中,真实用户的各项操作习惯均被保留,页面展现也与以往无异,使得用户可以正确识别页面中的各个元素和内容,鼠标和键盘操作也完全保留。本专利技术实现了将原本以明文传送的信息,全部以流媒体形式进行传递,杜绝了爬虫爬取文本的操作。 本专利技术的具体原理为:将网页数据区域的背景成流媒体的显示区域,由于尺寸是预先设定好的,因此可以精确地知道流媒体上每个区域所代表的的含义,在流媒体的上层,设置多个透明浮动层,并定位其至既定坐标,与下层流媒体的背景特定区域重合,顶层浮动层仅响应鼠标与键盘等操作,并不显示任何有价值的文本,或仅根据页面实际需要,显示某些常规提示信息,以此用来适当减小流媒体的体积,加快页面展现速度。这样,普通的基于文本的爬虫在抓取网页信息时,将得不到任何有价本文档来自技高网...
【技术保护点】
一种网页设置方法,其特征在于,包括以下步骤:S1、生成一用于表征网页数据的流媒体,并将所述流媒体固定设置于网页底层;S2、生成至少一个用于响应用户点击操作的浮动层,并将所述浮动层设置于网页顶层;S3、查询网页中用于响应用户点击操作的至少一个点击区域,并提取所述点击区域在所述流媒体中的位置坐标;S4、设置每一个浮动层与一点击区域的对应关系,并根据位置坐标将每一个浮动层设置为与对应的点击区域相重合。
【技术特征摘要】
【专利技术属性】
技术研发人员:吴凌峰,吴鹏越,
申请(专利权)人:携程计算机技术上海有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。