广告过滤方法和装置制造方法及图纸

技术编号:12388979 阅读:56 留言:0更新日期:2015-11-25 22:18
本发明专利技术公开了一种广告过滤方法和装置。其中,广告过滤方法包括:获取在浏览器中输入的统一资源定位符;利用广告过滤规则的关键字对所述统一资源定位符进行匹配;如果所述统一资源定位符与所述关键字匹配,则将所述统一资源定位符与所述关键字对应的广告过滤规则进行匹配;以及如果所述统一资源定位符与所述关键字对应的广告过滤规则匹配,则利用所述广告过滤规则进行广告过滤。通过本发明专利技术,达到了减少广告过滤时间的效果。

【技术实现步骤摘要】

本专利技术涉及浏览器领域,具体而言,涉及一种广告过滤方法和装置
技术介绍
在浏览器上,广告过滤插件adblock是一个广泛应用的广告过滤插件。其基本原理是设置一系列的过滤规则,在浏览器发出资源请求之前,先检查其统一资源定位符(UniformResourceLocator,简称url)是否命中某条过滤规则,如果命中某条过滤规则,可以确定浏览器请求的资源为广告,浏览器无需请求该资源。为了达到较好的过滤效果,通常需要设置较多的过滤规则,比如adblock提供的过滤规则就超过2万条。目前的浏览器广告过滤方法是:当用户通过浏览器输入某个url时,利用该url逐个对过滤规则进行匹配,如果匹配上某个过滤规则,则返回true(表示需要进行广告过滤),否则返回false(表示不需要进行广告过滤)。由于在浏览器中设置有大量的广告的过滤规则,在浏览器每一次网络请求时,与大量的过滤规则逐个进行匹配,使得广告过滤时性能开销较大,同时由于过滤规则数量大,导致每次广告过滤时间长。针对现有技术中由于过滤规则数量大导致每次广告过滤时间长的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种广告过滤方法和装置,以解决由于过滤规则数量大导致每次广告过滤时间长问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种广告过滤方法。根据本专利技术的浏览器广告过滤方法包括:获取在浏览器中输入的统一资源定位符;利用广告过滤规则的关键字对所述统一资源定位符进行匹配;如果所述统一资源定位符与所述关键字匹配,则将所述统一资源定位符与所述关键字对应的广告过滤规则进行匹配;以及如果所述统一资源定位符与所述关键字对应的广告过滤规则匹配,则利用所述广告过滤规则进行广告过滤。进一步地,在所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配之前,所述浏览器广告过滤方法还包括:获取与所述广告过滤规则对应的关键字;建立与所述广告过滤规则对应的关键字的字典树;其中,所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配步骤包括:获取所述字典树中的关键字;判断所述统一资源定位符与所述字典树中的关键字是否匹配。进一步地,所述获取与所述广告过滤规则对应的关键字包括:读取所述广告过滤规则的文件;从所述广告过滤规则的文件中提取所述关键字;所述建立与广告过滤规则对应的关键字的字典树包括:建立所述关键字与所述广告过滤规则的对应关系;根据提取的关键字建立所述字典树。进一步地,所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配包括:判断所述统一资源定位符与所述广告过滤规则的关键字是否匹配,其中,如果判断出所述统一资源定位符与所述广告过滤规则的关键字匹配,则将所述关键字对应的广告过滤规则转换为正则表达式;将所述统一资源定位符与所述关键字对应的广告过滤规则进行匹配包括:将所述统一资源定位符与所述正则表达式进行匹配;其中,如果所述统一资源定位符与所述正则表达式匹配,则输出所述正则表达式对应的广告过滤规则,通过输出的所述正则表达式对应的广告过滤规则进行广告过滤。进一步地,在所述获取在浏览器中输入的统一资源定位符之后,所述浏览器广告过滤方法还包括:将所述统一资源定位符传入分段器;在所述分段器中对所述统一资源定位符进行分段,得到多个分段字符;其中,所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配包括:逐个将所述多个分段字符与关键字匹配器中的关键字进行匹配。为了实现上述目的,根据本专利技术的另一方面,提供了一种广告过滤装置。根据本专利技术的浏览器广告过滤装置包括:第一获取单元,用于获取在浏览器中输入的统一资源定位符;第一匹配单元,用于利用广告过滤规则的关键字对所述统一资源定位符进行匹配;第二匹配单元,用于当所述统一资源定位符与所述关键字匹配时,将所述统一资源定位符与所述关键字对应的广告过滤规则进行匹配;以及过滤单元,用于当所述统一资源定位符与所述关键字对应的广告过滤规则匹配时,利用所述广告过滤规则进行广告过滤。进一步地,所述浏览器广告过滤装置还包括:第二获取单元,用于在所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配之前,获取与所述广告过滤规则对应的关键字;建立单元,用于建立与所述广告过滤规则对应的关键字的字典树;其中,所述第一匹配单元包括:获取模块,用于获取所述字典树中的关键字;第一判断模块,用于判断所述统一资源定位符与所述字典树中的关键字是否匹配。进一步地,所述第二获取单元包括:读取模块,用于读取所述广告过滤规则的文件;提取模块,用于从所述广告过滤规则的文件中提取所述关键字;所述建立单元包括:第一建立模块,用于建立所述关键字与所述广告过滤规则的对应关系;第二建立模块,用于根据提取的关键字建立所述字典树。进一步地,所述第一匹配单元包括:第二判断模块,用于判断所述统一资源定位符与所述广告过滤规则的关键字是否匹配,其中,如果判断出所述统一资源定位符与所述广告过滤规则的关键字匹配,则将所述关键字对应的广告过滤规则转换为正则表达式;所述第二匹配单元包括:第一匹配模块,用于将所述统一资源定位符与所述正则表达式进行匹配;所述过滤单元还用于当所述统一资源定位符与所述正则表达式匹配时,输出所述正则表达式对应的广告过滤规则,通过输出的所述正则表达式对应的广告过滤规则进行广告过滤。进一步地,所述浏览器广告过滤装置包括:传入单元,用于在获取在浏览器中输入的统一资源定位符之后,将所述统一资源定位符传入分段器;分段单元,用于在所述分段器中对所述统一资源定位符进行分段,得到多个分段字符;其中,所述第一匹配单元包括:第二匹配模块,用于逐个将所述多个分段字符与关键字匹配器中的关键字进行匹配。通过本专利技术实施例,先利用广告过滤规则的关键字对url进行匹配,再将匹配到关键字的url与关键字对应的广告过滤规则进行匹配,避免将url与所有的广告过滤规则一一进行匹配,减少了匹配的广告过滤规则的数量,从而解决了由于过滤规则数量大导致每次广告过滤时间长问题,达到了减少广告过滤时间的效果。附图说明构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术第一实施例的广告过滤装置的示意图;图2是根据本专利技术第二实施例的广告过滤装置的示意图;图3是根据本专利技术第三实施例的广告过滤装置的示意图;图4是根据本专利技术第一实施例的广告过滤方法的流程图本文档来自技高网...

【技术保护点】
一种广告过滤方法,其特征在于,包括:获取在浏览器中输入的统一资源定位符;利用广告过滤规则的关键字对所述统一资源定位符进行匹配;如果所述统一资源定位符与所述关键字匹配,则将所述统一资源定位符与所述关键字对应的广告过滤规则进行匹配;以及如果所述统一资源定位符与所述关键字对应的广告过滤规则匹配,则利用所述广告过滤规则进行广告过滤。

【技术特征摘要】
1.一种广告过滤方法,其特征在于,包括:
获取在浏览器中输入的统一资源定位符;
利用广告过滤规则的关键字对所述统一资源定位符进行匹配;
如果所述统一资源定位符与所述关键字匹配,则将所述统一资源定位符与所
述关键字对应的广告过滤规则进行匹配;以及
如果所述统一资源定位符与所述关键字对应的广告过滤规则匹配,则利用所
述广告过滤规则进行广告过滤。
2.根据权利要求1所述的广告过滤方法,其特征在于,
在所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配之前,所
述浏览器广告过滤方法还包括:获取与所述广告过滤规则对应的关键字;建立与
所述广告过滤规则对应的关键字的字典树;
其中,所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配步骤
包括:获取所述字典树中的关键字;判断所述统一资源定位符与所述字典树中的
关键字是否匹配。
3.根据权利要求2所述的广告过滤方法,其特征在于,
所述获取与所述广告过滤规则对应的关键字包括:读取所述广告过滤规则的
文件;从所述广告过滤规则的文件中提取所述关键字;
所述建立与广告过滤规则对应的关键字的字典树包括:建立所述关键字与所
述广告过滤规则的对应关系;根据提取的关键字建立所述字典树。
4.根据权利要求1所述的广告过滤方法,其特征在于,
所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配包括:判断
所述统一资源定位符与所述广告过滤规则的关键字是否匹配,其中,如果判断出
所述统一资源定位符与所述广告过滤规则的关键字匹配,则将所述关键字对应的
广告过滤规则转换为正则表达式;
将所述统一资源定位符与所述关键字对应的广告过滤规则进行匹配包括:将
所述统一资源定位符与所述正则表达式进行匹配;
其中,如果所述统一资源定位符与所述正则表达式匹配,则输出所述正则表
达式对应的广告过滤规则,通过输出的所述正则表达式对应的广告过滤规则进行
广告过滤。
5.根据权利要求4所述的广告过滤方法,其特征在于,在所述获取在浏览器中输入
的统一资源定位符之后,所述浏览器广告过滤方法还包括:
将所述统一资源定位符传入分段器;
在所述分段器中对所述统一资源定位符进行分段,得到多个分段字符;
其中,所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配包括:
逐个将所述多个分段字符与关键字匹配器中的关键字进行匹配。
6.一种广告过滤装置,其特征在于,包括...

【专利技术属性】
技术研发人员:田文
申请(专利权)人:优视科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1