IP地址信息库的更新方法和装置制造方法及图纸

技术编号:30338300 阅读:20 留言:0更新日期:2021-10-12 23:00
本发明专利技术公开了一种IP地址信息库的更新方法和装置,涉及计算机技术领域。其中,该方法包括:根据抓取模板从多个网站上抓取目标IP地址的候选归属地信息;对所述候选归属地信息进行评分,并将评分值最大的候选归属地信息作为所述目标IP地址的可信归属地信息;根据所述目标IP地址的可信归属地信息更新本地的IP地址信息库。通过以上步骤,能够提高IP地址信息库的更新效率以及IP地址信息库的数据准确性。更新效率以及IP地址信息库的数据准确性。更新效率以及IP地址信息库的数据准确性。

【技术实现步骤摘要】
IP地址信息库的更新方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种IP地址信息库的更新方法和装置。

技术介绍

[0002]随着互联网技术的日益普及,每天都会产生大量的线上数据,包括浏览数据、点击数据等。针对线上数据进行地域分析是一项基础的分析工作。
[0003]当网站接收到用户的访问请求时,可以获取到用户网络出口IP地址(IP,为Internet Protocol的简称,是一种网络之间互联的协议)。在互联网中,IP地址代表着用户出处,企业往往会维护一份IP地址对应的归属地信息数据表(可称为IP地址信息库,或者“IP库”)。在进行地域分析时,可直接从IP库中获取IP地址对应的归属地信息。
[0004]在现有技术中,一般通过以下方法建立并更新IP库:直接将某个网站上公布的IP库下载到本地进行使用,同时,定期人为地从该网站上下载最新IP库、并更新至本地。
[0005]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:在现有技术中,本地IP库的更新完全依赖于某个网站公布的IP库的更新,这很可能导致IP地址信息更新不及时,影响分析结果,同时,依靠人为方式进行更新,增加了IP库更新成本,降低了IP库更新效率;而且,单纯依靠某个网站提供的IP地址查询服务,来对本地IP库进行更新,当网站提供的数据不准确时,会导致本地IP库地址信息数据不准确。

技术实现思路

[0006]有鉴于此,本专利技术提供一种IP地址信息库的更新方法和装置,能够提高IP地址信息库的更新效率以及IP地址信息库的数据准确性。
[0007]为实现上述目的,根据本专利技术的一个方面,提供了一种IP地址信息库的更新方法。
[0008]本专利技术的IP地址信息库的更新方法包括:根据抓取模板从多个网站上抓取目标IP地址的候选归属地信息;对所述候选归属地信息进行评分,并将评分值最大的候选归属地信息作为所述目标IP地址的可信归属地信息;根据所述目标IP地址的可信归属地信息更新本地的IP地址信息库。
[0009]可选地,所述抓取模板包括:多个网站的网址、与所述网站对应的正则表达式;所述根据抓取模板从多个网站上抓取目标IP地址的候选归属地信息包括:以目标IP地址作为请求参数,向所述网站的网址发起查询请求,然后接收所述网站返回的查询结果;根据与所述网站对应的正则表达式,从所述查询结果中提取目标IP地址的候选归属地信息。
[0010]可选地,所述对所述候选归属地信息进行评分包括:根据抓取到同一候选归属地信息的各个网站的权重系数,计算该候选归属地信息的评分值。
[0011]可选地,所述根据所述目标IP地址的可信归属地信息更新本地的IP地址信息库包括:以所述目标IP地址作为左边界IP地址和右边界IP地址,构建新的IP地址段;将所述新的IP地址段的归属地信息更新为所述目标IP地址的可信归属地信息;以所述目标IP地址为临界参考值,将其所处的原有IP地址段划分为第一IP地址段和第二IP地址段;其中,第一IP地
址段中的IP地址的取值小于所述目标IP地址,第二IP地址段中的IP地址的取值大于所述目标IP地址。
[0012]可选地,所述方法还包括:在所述根据所述目标IP地址的可信归属地信息更新本地的IP地址信息库之前,确认所述可信归属地信息与所述本地IP地址信息库中存储的所述目标IP地址的归属地信息不一致。
[0013]可选地,所述方法还包括:将位于所述第一IP地址段中间位置的IP地址、以及位于所述第二IP地址段中间位置的IP地址均作为新的目标IP地址;根据抓取模板从多个网站上抓取所述新的目标IP地址的候选归属地信息。
[0014]可选地,所述方法还包括:在所述对所述候选归属地信息进行评分之前,确认从所述多个网站上抓取到的目标IP地址的候选归属地信息不完全一致。
[0015]可选地,所述方法还包括:在所述根据所述目标IP地址的可信归属地信息更新本地的IP地址信息库之后,对所述IP地址信息库中对应同一归属地信息的相邻IP地址段进行合并。
[0016]可选地,所述对所述IP地址信息库中对应同一归属地信息的相邻IP地址段进行合并包括:按照IP地址的取值由小到大、或者由大到小的顺序,对所述IP地址信息库中的IP地址段进行轮询;在当前IP地址段与上一个IP地址段的归属地信息不同时,对位于所述当前IP地址段之前、且归属地信息相同的相邻IP地址段进行合并,然后继续轮询下一个IP地址段;在当前IP地址段与上一个IP地址段的地址信息相同时,继续轮询下一个IP地址段。
[0017]为实现上述目的,根据本专利技术的另一方面,提供了一种IP地址信息库的更新装置。
[0018]本专利技术的IP地址信息库的更新装置包括:抓取模块,用于根据抓取模板从多个网站上抓取目标IP地址的候选归属地信息;分析模块,用于对所述候选归属地信息进行评分,并将评分值最大的候选归属地信息作为所述目标IP地址的可信归属地信息;更新模块,用于根据所述目标IP地址的可信归属地信息更新本地的IP地址信息库。
[0019]为实现上述目的,根据本专利技术的再一个方面,提供了一种电子设备。
[0020]本专利技术的电子设备,包括:一个或多个处理器;以及,存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术的IP地址信息库的更新方法。
[0021]为实现上述目的,根据本专利技术的又一个方面,提供了一种计算机可读介质。
[0022]本专利技术的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术的IP地址信息库的更新方法。
[0023]上述专利技术中的一个实施例具有如下优点或有益效果:通过根据抓取模板从多个网站上抓取目标IP地址的候选归属地信息,对所述候选归属地信息进行评分,并将评分值最大的候选归属地信息作为所述目标IP地址的可信归属地信息,根据所述目标IP地址的可信归属地信息更新本地的IP地址信息库这些步骤,能够提高IP地址信息库的更新效率以及IP地址信息库的数据准确性。
[0024]上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
[0025]附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:
[0026]图1是根据本专利技术第一实施例的IP地址信息库的更新方法的主要流程示意图;
[0027]图2是根据本专利技术第二实施例的IP地址信息库的更新方法的主要流程示意图;
[0028]图3是根据本专利技术第三实施例的抓取目标IP地址的候选归属地信息的主要流程示意图;
[0029]图4是根据本专利技术第四实施例的更新IP地址信息库与选取新的目标IP地址的主要流程示意图;
[0030]图5是采用二分法选取新的目标IP地址的示意图;
[0031]图6是根据本专利技术第五实施例的合并IP地址段的主要流程示意图。
[0032]图7是根据本专利技术第六实施例的IP地址信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种IP地址信息库的更新方法,其特征在于,所述方法包括:根据抓取模板从多个网站上抓取目标IP地址的候选归属地信息;对所述候选归属地信息进行评分,并将评分值最大的候选归属地信息作为所述目标IP地址的可信归属地信息;根据所述目标IP地址的可信归属地信息更新本地的IP地址信息库。2.根据权利要求1所述的方法,其特征在于,所述抓取模板包括:多个网站的网址、与所述网站对应的正则表达式;所述根据抓取模板从多个网站上抓取目标IP地址的候选归属地信息包括:以目标IP地址作为请求参数,向所述网站的网址发起查询请求,然后接收所述网站返回的查询结果;根据与所述网站对应的正则表达式,从所述查询结果中提取目标IP地址的候选归属地信息。3.根据权利要求1所述的方法,其特征在于,所述对所述候选归属地信息进行评分包括:根据抓取到同一候选归属地信息的各个网站的权重系数,计算该候选归属地信息的评分值。4.根据权利要求1所述的方法,其特征在于,所述根据所述目标IP地址的可信归属地信息更新本地的IP地址信息库包括:以所述目标IP地址作为左边界IP地址和右边界IP地址,构建新的IP地址段;将所述新的IP地址段的归属地信息更新为所述目标IP地址的可信归属地信息;以所述目标IP地址为临界参考值,将其所处的原有IP地址段划分为第一IP地址段和第二IP地址段;其中,第一IP地址段中的IP地址的取值小于所述目标IP地址,第二IP地址段中的IP地址的取值大于所述目标IP地址。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:在所述根据所述目标IP地址的可信归属地信息更新本地的IP地址信息库之前,确认所述可信归属地信息与所述本地IP地址信息库中存储的所述目标IP地址的归属地信息不一致。6.根据权利要求4所述的方法,其特征在于,所述方法还包括:将位于所述第一IP地址段中间位置的IP地址、以及位于所述第二IP...

【专利技术属性】
技术研发人员:李强
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1