本发明专利技术公开了一种搜索网站关键字的阻塞方法、装置,所述方法包括:获得在搜索引擎上输入的关键字,并输出与所述关键字关联的一条以上搜索结果;获得针对所述一条以上搜索结果中其中一条搜索结果的访问请求消息;从所述访问请求消息中解析出HTTP Referer数据;解析所述HTTP Referer数据中的URL数据,得到待搜索网站的域名和关键字;将所述待搜索网站的域名和关键字与预设的规则进行匹配,并在匹配成功时阻塞所述访问请求消息。
【技术实现步骤摘要】
本专利技术涉及网络搜索管理技术,尤其涉及一种搜索网站关键字的阻塞方法、装置。
技术介绍
随着互联网的快速发展,网络在人们的工作和生活越来越普及,对互联网的依赖也与日倶增,而搜索网站常作为上网的入口,因此对搜索引擎的研究引起了各方的关注和兴趣。搜索网站最重要的功能是根据用户的搜索关键字反馈搜索内容,而其中某些搜索内容会对各方面造成负面影响或危害,因此对搜索关键字的阻塞就显得比较切实和重要。现在越来越多的搜索引擎为了保护用户隐私和提高网站自身安全,采用了基于安全的超文本传输协议(HTTPS,Hyper Text Transfer Protocol over Secure SocketLayer)加密协议对数据进行加密;而且大多数搜索网站为了给用户更优质的体验,提供了一些联想搜索和实时搜索的特色功能。这些特色功能只是对搜索关键字的阻塞造成了数据干扰,但是加密特性使得对HTTPS类型的搜索网站关键字进行阻塞造成了巨大地难度。现在常用的HTTPS解密技术方案是:使用中间人技术,劫持用户的HTTPS请求,再将HTTPS加密数据解密成HTTP明文数据,然后分析搜索引擎产生的多条相关请求数据,因此需要解析所有包括搜索关键字的统一资源定位符(URL,Uniform Resource Locator),并对比得出独特的URL进行搜索关键字阻塞。此方法主要存在几个重要问题:需要能正确识别HTTPS的流量;使用中间人技术需要一定条件的部署方式,而且不是所有的HTTPS都可以劫持成功的;大多数浏览器都可以检查到HTTPS数据被劫持,并触发告警,导致用户敏感;对比得出的独特URL有时不只有一条,所以数据的准确性比较低;劫持和解析HTTPS数据的性能比较低。
技术实现思路
为解决上述技术问题,本专利技术实施例提供了一种搜索网站关键字的阻塞方法、装置。本专利技术实施例提供的搜索网站关键字的阻塞方法包括:获得在搜索引擎上输入的关键字,并输出与所述关键字关联的一条以上搜索结果;获得针对所述一条以上搜索结果中其中一条搜索结果的访问请求消息;从所述访问请求消息中解析出超文本传输协议HTTP Referer数据;解析所述HTTP Referer数据中的URL数据,得到待搜索网站的域名和关键字;将所述待搜索网站的域名和关键字与预设的规则进行匹配,并在匹配成功时阻塞所述访问请求消息。本专利技术实施例中,所述获得针对所述一条以上搜索结果中其中一条搜索结果的访问请求消息后,所述方法还包括:对所述访问请求消息进行过滤,得到HTTP数据;所述从所述访问请求消息中解析出超文本传输协议HTTP Referer数据,包括:从所述HTTP数据中解析出超文本传输协议HTTP Referer数据。本专利技术实施例中,所述从所述HTTP数据中解析出超文本传输协议HTTP Referer数据之前,所述方法还包括:判断所述HTTP数据的方法(Method)是否为获取(GET);当所述HTTP数据的Method为GET时,判断所述HTTP数据是否包含HTTP Referer数据;当所述HTTP数据包含HTTP Referer数据时,解析所述HTTP Referer数据。本专利技术实施例中,所述得到待搜索网站的域名和关键字之前,所述方法还包括:解析所述HTTP Referer数据时,判断是否使用基于安全的超文本传输协议HTTPS ; 当使用所述HTTPS协议时,解析所述HTTP Referer数据中的URL数据,得到待搜索网站的域名和关键字。本专利技术实施例中,所述将所述待搜索网站的域名和关键字与预设的规则进行匹配,并在匹配成功时阻塞所述访问请求消息,包括:将所述待搜索网站的域名与预设的搜索网站的域名进行匹配;当所述待搜索网站的域名与预设的搜索网站的域名匹配成功时,判断是否阻塞所述待搜索网站的域名的所有搜索操作,是时阻塞所述待搜索网站的域名的所有搜索操作;当不阻塞所述待搜索网站的域名的所有搜索操作时,将所述待搜索网站的关键字与预设的搜索网站的关键字进行匹配;当所述待搜索网站的关键字与预设的搜索网站的关键字匹配时,阻塞所述访问请求消息。本专利技术实施例中,所述方法还包括:当阻塞所述访问请求消息时,输出阻塞提示信息。本专利技术实施例提供的搜索网站关键字的阻塞装置包括:关键字获取单元,用于获得在搜索引擎上输入的关键字;输出单元,用于输出与所述关键字关联的一条以上搜索结果;访问请求获取单元,用于获得针对所述一条以上搜索结果中其中一条搜索结果的访问请求消息;数据解析单元,用于从所述访问请求消息中解析出HTTP Referer数据;解析所述HTTP Referer数据中的URL数据,得到待搜索网站的域名和关键字;控制单元,用于将所述待搜索网站的域名和关键字与预设的规则进行匹配,并在匹配成功时阻塞所述访问请求消息。本专利技术实施例中,所述装置还包括:数据过滤单元,用于对所述访问请求消息进行过滤,得到HTTP数据;所述数据解析单元,还用于从所述HTTP数据中解析出HTTP Referer数据。本专利技术实施例中,所述装置还包括:第一判断单元,用于判断所述HTTP数据的Method是否为GET ;第二判断单元,用于当所述HTTP数据的Method为GET时,判断所述HTTP数据是否包含HTTP Referer数据;所述数据解析单元,还用于当所述HTTP数据包含HTTP Referer数据时,解析所述HTTP Referer 数据。本专利技术实施例中,所述装置还包括:第三判断单元,用于解析所述HTTP Referer数据时,判断是否使用HTTPS协议;所述数据解析单元,还用于当使用所述HTTPS协议时,解析所述HTTP Referer数据中的URL数据,得到待搜索网站的域名和关键字。本专利技术实施例中,所述控制单元包括:域名匹配子单元,用于将所述待搜索网站的域名与预设的搜索网站的域名进行匹配;判断子单元,用于当所述待搜索网站的域名与预设的搜索网站的域名匹配成功时,判断是否阻塞所述待搜索网站的域名的所有搜索操作;关键字匹配子单元,用于当不阻塞所述待搜索网站的域名的所有搜索操作时,将所述待搜索网站的关键字与预设的搜索网站的关键字进行匹配;阻塞子单元,用于当所述待搜索网站的关键字与预设的搜索网站的关键字匹配时,阻塞所述访问请求消息。本专利技术实施例中,所述输出单元,还用于当阻塞所述访问请求消息时,输出阻塞提示信息。本专利技术实施例的技术方案中,获得在搜索引擎上输入的关键字,并输出与所述关键字关联的一条以上搜索结果;获得针对所述一条以上搜索结果中其中一条搜索结果的访问请求消息;从所述访问请求消息中解析出HTTP Referer数据;解析所述HTTP Referer数据中的URL数据,得到待搜索网站的域名和关键字;将所述待搜索网站的域名和关键字与预设的规则进行匹配,并在匹配成功时阻塞所述访问请求消息。本专利技术实施例通过使用HTTP协议中的HTTP Referer数据来阻塞HTTPS类型搜索网站的关键字,易于实现且阻塞准确性得到了提高。【附图说明】图1为本专利技术实施例一的搜索网站关键字的阻塞方法的流程示意图;图2为本专利技术实施例的HTTP数据示意图;图3为本专利技术实施例的各个搜索引擎的关键字的示意图;图4为本专利技术实施例二的搜索网站关键字的阻塞方法的流本文档来自技高网...
【技术保护点】
一种搜索网站关键字的阻塞方法,其特征在于,所述方法包括:获得在搜索引擎上输入的关键字,并输出与所述关键字关联的一条以上搜索结果;获得针对所述一条以上搜索结果中其中一条搜索结果的访问请求消息;从所述访问请求消息中解析出超文本传输协议HTTP Referer数据;解析所述HTTP Referer数据中的统一资源定位符URL数据,得到待搜索网站的域名和关键字;将所述待搜索网站的域名和关键字与预设的规则进行匹配,并在匹配成功时阻塞所述访问请求消息。
【技术特征摘要】
【专利技术属性】
技术研发人员:张磊,曹政,
申请(专利权)人:北京网康科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。