防止网页文本信息被自动抓取的方法和系统技术方案

技术编号:10782868 阅读:134 留言:0更新日期:2014-12-17 04:13
本发明专利技术提供一种防止网页文本信息被自动抓取的方法和系统,方法包括:页面图形控件向转换服务器发送转换请求;转换服务器解密密文信息,得到解密后的信息,判断解密后的信息是否为标识信息,如果是,则从数据库中提取标识信息所对应的网页展示明文信息,如果不是,则将解密后的信息直接作为网页展示明文信息;将得到的网页展示明文信息绘制为图片格式网页信息,再写入Http输出流中;将Http输出流发送给页面图形控件;页面图形控件解析Http输出流,获得图片格式网页信息,然后以图片格式显示所述网页信息。以图片格式展示网站所发布的信息,从而达到防止网站所发布的信息被自动抓取的效果。

【技术实现步骤摘要】
防止网页文本信息被自动抓取的方法和系统
本专利技术属于信息处理
,具体涉及一种防止网页文本信息被自动抓取的方法和系统。
技术介绍
在当前网络信息时代,用户常常向特定网站的网页发布文本格式信息,例如:证件号码、手机号、商品价格等。现有技术中,出现了网络蜘蛛或类似的网页信息自动抓取工具,通过该种工具,能够自动获取网页中展示的文本格式信息。但是,以商品价格为例,当网站A发布商品A的价格后,其他网站通过自动抓取工具进行全网抓取,从而抓取到众多网站所发布的商品A价格,然后对商品A价格进行比对,制定商品A经营策略,从而不利于网站A。因此,如何有效保护用户在网站所发布的信息,防止其被网页信息自动抓取工具所抓取到,具有重要意义。
技术实现思路
针对现有技术存在的缺陷,本专利技术提供一种防止网页文本信息被自动抓取的方法和系统,以图片格式展示网站所发布的信息,从而达到防止网站所发布的信息被自动抓取的效果。本专利技术采用的技术方案如下:本专利技术提供一种防止网页文本信息被自动抓取的方法,包括以下步骤:S1,web服务器从数据库中读取待处理明文信息;其中,所述待处理明文信息包括网页展示明文信息或与所述网页展示明文信息对应的标识信息;其中,所述网页展示明文信息为文本形式;S2,所述web服务器加密所述待处理明文信息,得到密文信息;S3,所述web服务器生成页面图形控件需要的转换服务器请求地址,然后将所述转换服务器请求地址发送给所述页面图形控件;其中,所述转换服务器请求地址还携带所述密文信息;S4,基于所述转换服务器请求地址,所述页面图形控件向所述转换服务器发送转换请求;其中,所述转换请求携带所述密文信息;S5,所述转换服务器解密所述密文信息,得到解密后的信息;S6,所述转换服务器判断所述解密后的信息是否为标识信息,如果是,则从所述数据库中提取所述标识信息所对应的网页展示明文信息,然后执行S7;如果不是,则将解密后的信息直接作为网页展示明文信息,然后执行S7;S7,所述转换服务器将S6得到的所述网页展示明文信息绘制为图片格式网页信息,再将所述图片格式网页信息写入Http输出流中;S8,所述转换服务器将已写入图片格式网页信息的Http输出流发送给所述页面图形控件;S9,所述页面图形控件解析所述已写入图片格式网页信息的Http输出流,获得图片格式网页信息,然后以图片格式显示所述网页信息。优选的,S2具体为:所述web服务器使用DES算法加密所述待处理明文信息,得到密文信息。优选的,S9中,所述页面图形控件以图片格式显示所述网页信息具体为:所述页面图形控件预先定义需要显示的图片的属性;然后基于所述图片的属性,以图片格式显示所述网页信息。优选的,所述图片的属性包括图片的长度信息、图片的宽度信息、图片的分辨率信息、图片中字符显示的位置信息、图片中字符颜色信息、图片中字符字体信息和图片中字符大小信息中的一种或几种。本专利技术还提供一种防止网页文本信息被自动抓取的系统,包括:web服务器、页面图形控件和转换服务器;所述web服务器用于:从数据库中读取待处理明文信息;其中,所述待处理明文信息包括网页展示明文信息或与所述网页展示明文信息对应的标识信息;其中,所述网页展示明文信息为文本形式;加密所述待处理明文信息,得到密文信息;生成页面图形控件需要的转换服务器请求地址,然后将所述转换服务器请求地址发送给所述页面图形控件;其中,所述转换服务器请求地址还携带所述密文信息;所述页面图形控件用于:接收所述web服务器发送的转换服务器请求地址,基于所述转换服务器请求地址,向所述转换服务器发送转换请求;其中,所述转换请求携带所述密文信息;所述转换服务器用于:接收所述页面图形控件发送的转换请求,解密所述密文信息,得到解密后的信息;判断所述解密后的信息是否为标识信息,如果是,则从所述数据库中提取所述标识信息所对应的网页展示明文信息,如果不是,则将解密后的信息直接作为网页展示明文信息;然后,将得到的网页展示明文信息绘制为图片格式网页信息,再将所述图片格式网页信息写入Http输出流中,将已写入图片格式网页信息的Http输出流发送给所述页面图形控件;所述页面图形控件还用于:接收所述转换服务器发送的Http输出流,解析所述已写入图片格式网页信息的Http输出流,获得图片格式网页信息,然后以图片格式显示所述网页信息。本专利技术的有益效果如下:本专利技术提供一种防止网页文本信息被自动抓取的方法和系统,以图片格式展示网站所发布的信息,既能达到防止网站所发布的信息被自动抓取的效果;还具有安全、高效、简洁、易用的优点。附图说明图1为本专利技术提供的防止网页文本信息被自动抓取的方法流程示意图;图2为本专利技术提供的防止网页文本信息被自动抓取的系统结构示意图。具体实施方式以下结合附图对本专利技术进行详细说明:如图1所示,本专利技术提供一种防止网页文本信息被自动抓取的方法,包括以下步骤:S1,web服务器从数据库中读取待处理明文信息;其中,所述待处理明文信息包括网页展示明文信息或与所述网页展示明文信息对应的标识信息;其中,所述网页展示明文信息为文本形式;S2,所述web服务器加密所述待处理明文信息,得到密文信息;本专利技术对具体的加密算法并不限制,可以为DES算法。通过对待处理明文信息进行加密,可以提高web服务器到转换服务器之间信息传输的安全性。S3,所述web服务器生成页面图形控件需要的转换服务器请求地址,然后将所述转换服务器请求地址发送给所述页面图形控件;其中,所述转换服务器请求地址还携带所述密文信息;S4,基于所述转换服务器请求地址,所述页面图形控件向所述转换服务器发送转换请求;其中,所述转换请求携带所述密文信息;S5,所述转换服务器解密所述密文信息,得到解密后的信息;S6,所述转换服务器判断所述解密后的信息是否为标识信息,如果是,则从所述数据库中提取所述标识信息所对应的网页展示明文信息,然后执行S7;如果不是,则将解密后的信息直接作为网页展示明文信息,然后执行S7;S7,所述转换服务器将S6得到的所述网页展示明文信息绘制为图片格式网页信息,再将所述图片格式网页信息写入Http输出流中;需要强调的是,本步骤中,将图片格式网页信息以流的形式写入Http输出流中,因此,转换服务器向页面图形控件返回的为数据流,而不是图片格式,由于流小于图片的大小,因此,可以提高数据传输的速度;另外,以流的方式传输,不容易被黑客破解,从而提高数据传输的安全性。S8,所述转换服务器将已写入图片格式网页信息的Http输出流发送给所述页面图形控件;S9,所述页面图形控件解析所述已写入图片格式网页信息的Http输出流,获得图片格式网页信息,然后以图片格式显示所述网页信息。具体的,页面图形控件预先定义需要显示的图片的属性;然后基于所述图片的属性,以图片格式显示所述网页信息。其中,图片的属性包括图片的长度信息、图片的宽度信息、图片的分辨率信息、图片中字符显示的位置信息、图片中字符颜色信息、图片中字符字体信息和图片中字符大小信息中的一种或几种。如图2所示,本专利技术还提供一种防止网页文本信息被自动抓取的系统,包括:web服务器、页面图形控件和转换服务器;所述web服务器用于:从数据库中读取待处理明文信息;其中,所述待处理明文信息包括网页展示明文信息或与本文档来自技高网...
防止网页文本信息被自动抓取的方法和系统

【技术保护点】
一种防止网页文本信息被自动抓取的方法,其特征在于,包括以下步骤:S1,web服务器从数据库中读取待处理明文信息;其中,所述待处理明文信息包括网页展示明文信息或与所述网页展示明文信息对应的标识信息;其中,所述网页展示明文信息为文本形式;S2,所述web服务器加密所述待处理明文信息,得到密文信息;S3,所述web服务器生成页面图形控件需要的转换服务器请求地址,然后将所述转换服务器请求地址发送给所述页面图形控件;其中,所述转换服务器请求地址还携带所述密文信息;S4,基于所述转换服务器请求地址,所述页面图形控件向所述转换服务器发送转换请求;其中,所述转换请求携带所述密文信息;S5,所述转换服务器解密所述密文信息,得到解密后的信息;S6,所述转换服务器判断所述解密后的信息是否为标识信息,如果是,则从所述数据库中提取所述标识信息所对应的网页展示明文信息,然后执行S7;如果不是,则将解密后的信息直接作为网页展示明文信息,然后执行S7;S7,所述转换服务器将S6得到的所述网页展示明文信息绘制为图片格式网页信息,再将所述图片格式网页信息写入Http输出流中;S8,所述转换服务器将已写入图片格式网页信息的Http输出流发送给所述页面图形控件;S9,所述页面图形控件解析所述已写入图片格式网页信息的Http输出流,获得图片格式网页信息,然后以图片格式显示所述网页信息。...

【技术特征摘要】
1.一种防止网页文本信息被自动抓取的方法,其特征在于,包括以下步骤:S1,web服务器从数据库中读取待处理明文信息;其中,所述待处理明文信息包括网页展示明文信息或与所述网页展示明文信息对应的标识信息;其中,所述网页展示明文信息为文本形式;S2,所述web服务器加密所述待处理明文信息,得到密文信息;S3,所述web服务器生成页面图形控件需要的转换服务器请求地址,然后将所述转换服务器请求地址发送给所述页面图形控件;其中,所述转换服务器请求地址还携带所述密文信息;S4,基于所述转换服务器请求地址,所述页面图形控件向所述转换服务器发送转换请求;其中,所述转换请求携带所述密文信息;S5,所述转换服务器解密所述密文信息,得到解密后的信息;S6,所述转换服务器判断所述解密后的信息是否为标识信息,如果是,则从所述数据库中提取所述标识信息所对应的网页展示明文信息,然后执行S7;如果不是,则将解密后的信息直接作为网页展示明文信息,然后执行S7;S7,所述转换服务器将S6得到的所述网页展示明文信息绘制为图片格式网页信息,再将所述图片格式网页信息写入Http输出流中;S8,所述转换服务器将已写入图片格式网页信息的Http输出流发送给所述页面图形控件;S9,所述页面图形控件解析所述已写入图片格式网页信息的Http输出流,获得图片格式网页信息,然后以图片格式显示所述网页信息;其中,S2具体为:所述web服务器使用DES算法加密所述待处理明文信息,得到密文信息;其中,S9中,所述页面图形控件以图片格式显示所述网页信息具体为:所述页面图形控件预先定义需要显示的图片的属性;然后基于所述图片的属性,以图...

【专利技术属性】
技术研发人员:韩华
申请(专利权)人:北京齐尔布莱特科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1