统一资源定位符匹配处理方法及装置制造方法及图纸

技术编号:8655982 阅读:185 留言:0更新日期:2013-05-01 23:40
本发明专利技术实施例提供一种统一资源定位符匹配处理方法及装置,该方法包括:将接收到的URL按级别划分,并获取所述URL中的二级域名,或者所述二级域名和所述二级域名下的信息;对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值;在所述键值对应的BST中匹配到与所述二级域名对应的节点时,在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与对应的字符串进行匹配,并获取第二匹配结果;本发明专利技术实施例中,通过获取URL下的二级域名、子域名、目录和页面等,并依次对进行匹配,从而实现了可以一次性线性的对该二级域名下的各级域名等进行匹配。

【技术实现步骤摘要】

本专利技术涉及通信技术,尤其涉及一种统一资源定位符匹配处理方法及装置
技术介绍
在网络技术中,统一资源定位符(Uniform Resource Locator,简称URL)的匹配可用于多种场景,例如域名系统(Domain Name System,简称DNS)中的域名解析、网络安全技术中的URL分类获取,网页搜索技术中的快速查找等。现有技术中有的运营商采用的URL的匹配采用的结构为“散列(hash) + 二叉排列树(Binary Search Tree,简称BST) +页面数组(page array)”的结构,且URL包括域名(host)部分和页面等,其中散列和BST用于处理域名部分的快速匹配,页面数组用于保存页面的列表,具体的,URL的匹配流程为对于给定的URL,先计算域名部分的散列值,再根据计算得到的散列值,对给定的URL进行散列处理,获取给定的URL中的字符串,然后查询BST中的节点,并将给定的URL中的字符串依次与BST中的节点中的域名字符串(hoststring)进行比较,以判断是否匹配到整个URL。但是由于直接将给定的URL中的字符串依次与BST中的节点中的域名字符串进行比较,因此,当给定的URL中的二级域名及其子域名、页面、目录等分类不相同时,会造成处理逻辑复杂,无法用线性方式依次匹配各级域名。
技术实现思路
本专利技术提供一种统一资源定位符匹配处理方法及装置,用于解决难以按域名级别匹配二级域名下各级域名,以及获取各级域名属性信息。本专利技术实施例第一方面提供一种统一资源定位符匹配处理方法,包括将接收到的URL按级别进行划分,并获取所述URL中的二级域名,或者所述二级域名和所述二级域名下的信息;对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值;若获取到所述URL中的二级域名,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,获取第一匹配结果;若获取到所述URL中的所述二级域名和所述二级域名下的信息,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,并获取第二匹配结果。结合第一方面,在第一方面的第一种可能的实施方式中,所述二级域名下的信息包括如下一种或者几种的组合子域名、目录和页面;其中,所述子域名的级别大于所述目录的级别;所述目录的级别大于所述页面的级别。结合第一方面的第一种可能的实施方式,在第一方面的第二种可能的实施方式中,所述对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值之后,所述方法还包括若在所述键值对应的BST中,未搜索到与所述二级域名对应的节点,则在所述键值对应的BST中建立与所述二级域名对应的节点,并分别建立所述二级域名下的信息对应的节点;或者,若在所述键值对应的BST中搜索到所述二级域名对应的节点,则在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次搜索与所述二级域名下的信息对应的节点,若未搜索到所述二级域名下的信息中的一个信息对应的节点,则建立所述一个信息和低于所述一个信息级别的其它信息对应的节点;其中,所述二级域名对应的节点包括所述二级域名对应的字符串;所述二级域名下的信息对应的节点包括对应的字符串。结合第一方面的第二种可能的实施方式,在第一方面的第三种可能的实施方式中,所述方法还包括分别在每个节点上添加所述节点对应的属性。结合第一方面的第一种可能的实施方式,在第一方面的第四种可能的实施方式中,若所述二级域名下的信息包括子域名时,所述方法还包括对所述子域名按照分段方式逆序排列;或者, 对所述子域名按照分段方式逆序排列,并对所述子域名的字符串进行逆序排列。结合第一方面的第一种可能的实施方式,在第一方面的第五种可能的实施方式中,所述在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,并获取第二匹配结果,包括在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,若完全匹配,则获取的匹配结果为匹配到的最后一个字符对应的属性信息;或者,在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,若部分匹配,则获取的匹配结果为部分匹配的数据;或者,在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,若完全没有匹配,则获取的匹配结果为所述二级域名对应的数据。结合第一方面,在第一方面的第六种可能的实施方式中,所述根据所述二级域名对应的字符串,获取键值,包括从所述二级域名对应的字符串中截取至少一个字节作为散列表的键值。本专利技术实施例第二方面提供一种统一资源定位符匹配处理装置,包括划分模块,用于将接收到的URL按级别进行划分,并获取所述URL中的二级域名,或者所述二级域名和所述二级域名下的信息;散列处理模块,用于对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值;匹配模块,用于若获取到所述URL中的二级域名,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,获取第一匹配结果;或者,所述匹配模块,还用于若获取到所述URL中的所述二级域名和所述二级域名下的信息,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,并获取第二匹配结果。结合第二方面,在第二方面的第一种可能的实施方式中,所述划分模块获取的二级域名下的信息包括如下一种或者几种的组合子域名、目录和页面;其中,所述子域名的级别大于所述目录的级别;所述目录的级别大于所述页面的级别。结合第二方面的第一种可能的实施方式,在第二方面第三种可能的实施方式中,所述装置还包括建立模块,用于若在所述键值对应的BST中,未搜索到与所述二级域名对应的节点,则在所述键值对应的BST中建立与所述二级域名对应的节点,并分别建立所述二级域名下的信息对应的节点;或者,所述建立模块,用于若在所述键值对应的BST中搜索到所述二级域名对应的节点,则在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次搜索与所述二级域名下的信息对应的节点,若未搜索到所述二级域名下的信息中的一个信息对应的节点,则建立所述一个信息和低于所述一个信息级别的其它信息对应的节点;其中,所述二级域名对应的节点包括所述二级域名对应的字符串;所述二级域名下的信息对应的节点包括对应的字符串。结合第二方面第二种可能的实施方式,在第二方面第四种可能的实施方式中,所述装置还包括添加模块,用于分别在每个节点上添加所述节点对应的属性。结合第二方面的第一种可能的实施方式,在第二方面第五种可能的实施方式中,若所述二级域名下的信息包括子域名时,所述装置还包括排列模块,用于对所述子域名按照分段方式逆序排列;或者,对所述子域名按照分段方式逆序排列本文档来自技高网...

【技术保护点】
一种统一资源定位符匹配处理方法,其特征在于,包括:将接收到的URL按级别划分,并获取所述URL中的二级域名,或者所述二级域名和所述二级域名下的信息;对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值;若获取到所述URL中的二级域名,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,获取第一匹配结果;若获取到所述URL中的所述二级域名和所述二级域名下的信息,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,并获取第二匹配结果。

【技术特征摘要】
1.一种统一资源定位符匹配处理方法,其特征在于,包括: 将接收到的URL按级别划分,并获取所述URL中的二级域名,或者所述二级域名和所述二级域名下的信息; 对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值; 若获取到所述URL中的二级域名,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,获取第一匹配结果; 若获取到所述URL中的所述二级域名和所述二级域名下的信息,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,并获取第二匹配结果。2.根据权利要求1所述的方法,其特征在于,所述二级域名下的信息包括如下一种或者几种的组合:子域名、目录和页面; 其中,所述子域名的级别大于所述目录的级别;所述目录的级别大于所述页面的级别。3.根据权利要求2所述的方法,其特征在于,所述对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值之后,所述方法还包括: 若在所述键值对应的BST中,未搜索到与所述二级域名对应的节点,则在所述键值对应的BST中建立与所述二级域名对应的节点,并分别建立所述二级域名下的信息对应的节点;或者, 若在所述键值对应的BST中搜索到所述二级域名对应的节点,则在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次搜索与所述二级域名下的信息对应的节点,若未搜索到所述二级域名下的信息中的一个信息对应的节点,则建立所述一个信息和低于所述一个信息级别的其它信息对应的节点; 其中,所述二级域名对应的节点包括所述二级域名对应的字符串;所述二级域名下的信息对应的节点包括对应的字符串。4.根据权利要求3所述的方法,其特征在于,还包括: 分别在每个节点上添加所述节点对应的属性。5.根据权利要求2所述的方法,其特征在于,若所述二级域名下的信息包括子域名时,所述方法还包括: 对所述子域名按照分段方式逆序排列;或者, 对所述子域名按照分段方式逆序排列,并对所述子域名的字符串进行逆序排列。6.根据权利要求2所述的方法,其特征在于,所述在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,并获取第二匹配结果,包括: 在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,若完全匹配,则获取的匹配结果为匹配到的最后一个字符对应的属性信息;或者, 在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,若部分匹配,则获取的匹配结果为部分匹配的数据;或者, 在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,若完全没有匹配,则获取的匹配结果为所述二级域名对应的数据。7.根据权利要求1所述的方法,其特征在于,所述根据所述二级域名对应的字符串,获取键值,包括: 从所述二级域名对应的字符串中截取至少一个字节作为所述键值...

【专利技术属性】
技术研发人员:张大为
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1