【技术实现步骤摘要】
本专利技术涉及通信技术,尤其涉及一种统一资源定位符匹配处理方法及装置。
技术介绍
在网络技术中,统一资源定位符(Uniform Resource Locator,简称URL)的匹配可用于多种场景,例如域名系统(Domain Name System,简称DNS)中的域名解析、网络安全技术中的URL分类获取,网页搜索技术中的快速查找等。现有技术中有的运营商采用的URL的匹配采用的结构为“散列(hash) + 二叉排列树(Binary Search Tree,简称BST) +页面数组(page array)”的结构,且URL包括域名(host)部分和页面等,其中散列和BST用于处理域名部分的快速匹配,页面数组用于保存页面的列表,具体的,URL的匹配流程为对于给定的URL,先计算域名部分的散列值,再根据计算得到的散列值,对给定的URL进行散列处理,获取给定的URL中的字符串,然后查询BST中的节点,并将给定的URL中的字符串依次与BST中的节点中的域名字符串(hoststring)进行比较,以判断是否匹配到整个URL。但是由于直接将给定的URL中的字符串依次与BST中的节点中的域名字符串进行比较,因此,当给定的URL中的二级域名及其子域名、页面、目录等分类不相同时,会造成处理逻辑复杂,无法用线性方式依次匹配各级域名。
技术实现思路
本专利技术提供一种统一资源定位符匹配处理方法及装置,用于解决难以按域名级别匹配二级域名下各级域名,以及获取各级域名属性信息。本专利技术实施例第一方面提供一种统一资源定位符匹配处理方法,包括将接收到的URL按级别进行划分,并获取所述URL中 ...
【技术保护点】
一种统一资源定位符匹配处理方法,其特征在于,包括:将接收到的URL按级别划分,并获取所述URL中的二级域名,或者所述二级域名和所述二级域名下的信息;对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值;若获取到所述URL中的二级域名,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,获取第一匹配结果;若获取到所述URL中的所述二级域名和所述二级域名下的信息,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,并获取第二匹配结果。
【技术特征摘要】
1.一种统一资源定位符匹配处理方法,其特征在于,包括: 将接收到的URL按级别划分,并获取所述URL中的二级域名,或者所述二级域名和所述二级域名下的信息; 对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值; 若获取到所述URL中的二级域名,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,获取第一匹配结果; 若获取到所述URL中的所述二级域名和所述二级域名下的信息,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,并获取第二匹配结果。2.根据权利要求1所述的方法,其特征在于,所述二级域名下的信息包括如下一种或者几种的组合:子域名、目录和页面; 其中,所述子域名的级别大于所述目录的级别;所述目录的级别大于所述页面的级别。3.根据权利要求2所述的方法,其特征在于,所述对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值之后,所述方法还包括: 若在所述键值对应的BST中,未搜索到与所述二级域名对应的节点,则在所述键值对应的BST中建立与所述二级域名对应的节点,并分别建立所述二级域名下的信息对应的节点;或者, 若在所述键值对应的BST中搜索到所述二级域名对应的节点,则在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次搜索与所述二级域名下的信息对应的节点,若未搜索到所述二级域名下的信息中的一个信息对应的节点,则建立所述一个信息和低于所述一个信息级别的其它信息对应的节点; 其中,所述二级域名对应的节点包括所述二级域名对应的字符串;所述二级域名下的信息对应的节点包括对应的字符串。4.根据权利要求3所述的方法,其特征在于,还包括: 分别在每个节点上添加所述节点对应的属性。5.根据权利要求2所述的方法,其特征在于,若所述二级域名下的信息包括子域名时,所述方法还包括: 对所述子域名按照分段方式逆序排列;或者, 对所述子域名按照分段方式逆序排列,并对所述子域名的字符串进行逆序排列。6.根据权利要求2所述的方法,其特征在于,所述在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,并获取第二匹配结果,包括: 在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,若完全匹配,则获取的匹配结果为匹配到的最后一个字符对应的属性信息;或者, 在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,若部分匹配,则获取的匹配结果为部分匹配的数据;或者, 在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,若完全没有匹配,则获取的匹配结果为所述二级域名对应的数据。7.根据权利要求1所述的方法,其特征在于,所述根据所述二级域名对应的字符串,获取键值,包括: 从所述二级域名对应的字符串中截取至少一个字节作为所述键值...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。