一种基于IP地址多维特征聚类的网络拓扑模型构建方法技术

技术编号:38383333 阅读:7 留言:0更新日期:2023-08-05 17:40
本发明专利技术公开了一种基于IP地址多维特征聚类的网络拓扑模型构建方法,包括以下步骤:从给定的探测源集合中对目标网络的IP地址集进行探测,获得IP路径数据并处理得到IP级拓扑图;对IP级拓扑图中的任意链路,计算前缀距离、链路跳数和链路时延;按照链路距离对IP级拓扑图中的IP节点进行聚类,形成互不相交的IP节点簇;将IP节点簇中属于相同簇的IP节点进行聚合形成网络前缀节点,并构建初始的前缀级拓扑;对前缀级拓扑中存在包含关系的前缀节点进行修正,获得所有节点满足互斥性的前缀级拓扑。本发明专利技术从IP级拓扑出发,通过从多个维度分析IP地址的属性特征和连接关系,生成更能够准确捕获网络拓扑结构特征的网络拓扑模型。获网络拓扑结构特征的网络拓扑模型。获网络拓扑结构特征的网络拓扑模型。

【技术实现步骤摘要】
一种基于IP地址多维特征聚类的网络拓扑模型构建方法


[0001]本专利技术涉及网络空间测绘
,尤其涉及一种基于IP地址多维特征聚类的网络拓扑模型构建方法。

技术介绍

[0002]全面深入地了解网络拓扑的结构特征及其动态演化趋势有助于优化网络协议、开发新型网络应用、保障网络性能、发现网络脆弱区域等工作的开展。但由于互联网自兴起之初便具有分布式自治的特性,目前已经发展成为规模极为庞大、结构层次特征明显、局部结构复杂多样、路由状态时刻变化、缺少中心化管控机制的复杂巨系统,因而时至今日,对网络拓扑进行探测、还原、分析仍然是人们关注的热点问题。
[0003]按照网络拓扑模型中节点粒度由粗到细的顺序进行排列,目前主流的拓扑刻画模型包括自治域(AutonomousSystem,AS)级、接入点(Point of Presence,PoP)级、路由器级和IP级等4个层级。它们在不同粒度对网络拓扑进行建模刻画,所获得的网络拓扑图的“分辨率”也各不相同,各有优缺点:
[0004](1)AS级拓扑中的每个节点对应一个自治域,每条链路对应自治域之间的商业服务关系。大型自治域可能包含数百万个IP地址,覆盖全球多个国家或地区,因此该模型是在宏观层面以一种极粗的粒度对网络拓扑进行刻画。但因其中节点的粒度过于粗糙,导致AS级网络拓扑的“分辨率”极低,大量有效信息被隐藏在AS节点的内部而未能表现在拓扑模型中。
[0005](2)PoP级拓扑中的每个节点对应一个运营商在某个城市的接入点,每条链路对应接入点之间的连接关系。一个接入点通常由多台路由交换设备以固定模式紧密连接而形成,因此该模型重点关注运营商的互联网接入点之间的连接关系,侧重于刻画互联网基础设施的拓扑结构,不关注整个网络空间的逻辑结构。
[0006](3)路由器级拓扑中的每个节点对应一个路由器或终端设备,IP级拓扑中的每个节点即为一个IP地址,链路则分别对应设备间、IP接口间的通信链路。因此,这两个模型从极细的粒度对网络拓扑进行了刻画,但由于互联网中设备数量和IP数量均十分庞大,使得高价值的网络拓扑结构特征信息分散各处,难以挖掘。
[0007]实际网络中,不同区域的结构特征存在很大差异,上述4种刻画模型按照各自固定的节点粒度生成网络拓扑,并不能很好地揭露不同网络区域的特征。为此,论文《Topology Modeling via Cluster Graphs》最先提出应该在AS和路由器之间寻找一种恰当粒度从逻辑结构的角度对网络拓扑进行刻画。该论文提出通过traceroute工具测量获得IP级拓扑,然后以BGP路由数据中出现的网络前缀作为IP地址的聚类标准,按最长匹配原则将IP级拓扑中的IP地址聚合为粒度更粗的网络前缀,从而获得所谓“前缀级拓扑”。前缀级拓扑中每个节点都是形如“192.168.1.0/24”的CIDR网络前缀,前缀的大小由BGP数据决定。因此,每个节点的“分辨率”更加灵活,一定程度上缓解了传统模型的缺陷。但是该方法中,IP地址聚类结果完全依赖于BGP路由数据,存在以下不足。
[0008]首先,聚类后的网络前缀的大小严重依赖BGP数据的采集位置:(1)采集位置不当可能导致网络前缀由于经过了多次路由聚合而过大,或者未经过路由聚合而过小;(2)采集点不足可能导致BGP数据不能完整覆盖可路由的IPv4地址,导致某些IP无法聚类到对应前缀。
[0009]其次,聚类后得到的前缀级拓扑中,前缀节点之间可能仍然存在多重包含关系,即各个前缀不满足互斥性,给后续的拓扑结构特征分析工作带来困难。例如,203.0.0.0/10和203.0.0.0/12可以同时作为节点出现在前缀级拓扑中,但后者是前者的子集,不满足互斥性。

技术实现思路

[0010]为了解决上述问题,本专利技术提出一种基于IP地址多维特征聚类的网络拓扑模型构建方法,从IP级拓扑出发,通过从多个维度分析IP地址的属性特征和连接关系,生成更能够准确捕获网络拓扑结构特征的网络拓扑模型。另外,本专利技术方法仅依靠IP路径测量数据的特征生成前缀级网络拓扑,消除了现有方法对BGP数据等先验知识的依赖,同时通过包含关系修正等技术手段确保了所生成前缀级拓扑的节点互斥性,具有更大的拓扑结构特征分析利用价值。
[0011]本专利技术采用的技术方案如下:
[0012]一种基于IP地址多维特征聚类的网络拓扑模型构建方法,包括以下步骤:
[0013]S1.从给定的探测源集合中对目标网络的IP地址集进行探测,获得IP路径数据并处理得到IP级拓扑图;
[0014]S2.对所述IP级拓扑图中的任意链路,基于IP地址的二进制表征形式计算链路两端IP地址之间的前缀距离,并基于链路两端的IP地址在所有探测路径中的跳数距离计算链路跳数,以及基于链路两端的IP地址相较于各个探测源的往返时延计算链路时延;
[0015]S3.将所述前缀距离、链路跳数和链路时延作为反映链路距离的特征向量,按照链路距离对所述IP级拓扑图中的IP节点进行聚类,形成互不相交的IP节点簇;
[0016]S4.将所述IP节点簇中属于相同簇的IP节点进行聚合,形成网络前缀节点,并构建初始的前缀级拓扑;
[0017]S5.对所述前缀级拓扑中存在包含关系的前缀节点进行修正,获得所有节点满足互斥性的前缀级拓扑,形成最终的网络拓扑模型。
[0018]进一步地,步骤S1中,针对探测源集合S={s1,s2,...,s
I
}和目标网络的IP地址集D={d1,d2,...,d
J
},将所有探测得到的IP路径用P={p1,p2,...,p
K
}表示,探测源s∈S到探测目标d∈D的IP路径记为p=(s,r1,r2,...,r
n
,d),其中r1,r2,

,r
n
均为路径p经过的IP地址或者匿名节点,匿名节点在探测结果中以“*”出现;对路径p中除探测源s外的每个非匿名节点r,探测结果中同时包含从探测源s到r的往返时延RTT;获得所有IP路径P后,处理得到IP级拓扑图,用图模型表示。
[0019]进一步地,步骤S1包括以下子步骤:
[0020]S101.所有路径中的非匿名节点构成节点集合V,用节点的IP地址作为标识;
[0021]S102.如果节点集合V中的节点u和节点v同时出现在某条路径,且节点u和节点v之间无其他非匿名节点,则在节点u和节点v之间建立一条边,用(u,v)∈E表示,E中的边也被
称为IP链路。
[0022]进一步地,步骤S2中,所述基于IP地址的二进制表征形式计算链路两端IP地址之间的前缀距离包括以下子步骤:
[0023]S211.对所述IP级拓扑图中的任意链路(u,v)∈E,将IP地址u和v转换为32位的二进制数;
[0024]S212.按照从高位到低位即从左至右的顺序比较二进制数的每个比特,若首个不同的比特位于右起第d位,则u和v之间的前缀距离d
f...

【技术保护点】

【技术特征摘要】
1.一种基于IP地址多维特征聚类的网络拓扑模型构建方法,其特征在于,包括以下步骤:S1.从给定的探测源集合中对目标网络的IP地址集进行探测,获得IP路径数据并处理得到IP级拓扑图;S2.对所述IP级拓扑图中的任意链路,基于IP地址的二进制表征形式计算链路两端IP地址之间的前缀距离,并基于链路两端的IP地址在所有探测路径中的跳数距离计算链路跳数,以及基于链路两端的IP地址相较于各个探测源的往返时延计算链路时延;S3.将所述前缀距离、链路跳数和链路时延作为反映链路距离的特征向量,按照链路距离对所述IP级拓扑图中的IP节点进行聚类,形成互不相交的IP节点簇;S4.将所述IP节点簇中属于相同簇的IP节点进行聚合,形成网络前缀节点,并构建初始的前缀级拓扑;S5.对所述前缀级拓扑中存在包含关系的前缀节点进行修正,获得所有节点满足互斥性的前缀级拓扑,形成最终的网络拓扑模型。2.根据权利要求1所述的基于IP地址多维特征聚类的网络拓扑模型构建方法,其特征在于,步骤S1中,针对探测源集合S={s1,s2,

,s
I
}和目标网络的IP地址集D={d1,d2,

,d
J
},将所有探测得到的IP路径用P={p1,p2,

,p
K
}表示,探测源s∈S到探测目标d∈D的IP路径记为p=(s,r1,r2,

,r
n
,d),其中r1,r2,

,r
n
均为路径p经过的IP地址或者匿名节点,匿名节点在探测结果中以“*”出现;对路径p中除探测源s外的每个非匿名节点r,探测结果中同时包含从探测源s到r的往返时延RTT;获得所有IP路径P后,处理得到IP级拓扑图,用图模型表示。3.根据权利要求2所述的基于IP地址多维特征聚类的网络拓扑模型构建方法,其特征在于,步骤S1包括以下子步骤:S101.所有路径中的非匿名节点构成节点集合V,用节点的IP地址作为标识;S102.如果节点集合V中的节点u和节点v同时出现在某条路径,且节点u和节点v之间无其他非匿名节点,则在节点u和节点v之间建立一条边,用(u,v)∈E表示,E中的边也被称为IP链路。4.根据权利要求1所述的基于IP地址多维特征聚类的网络拓扑模型构建方法,其特征在于,步骤S2中,所述基于IP地址的二进制表征形式计算链路两端IP地址之间的前缀距离包括以下子步骤:S211.对所述IP级拓扑图中的任意链路(u,v)∈E,将IP地址u和v转换为32位的二进制数;S212.按照从高位到低位即从左至右的顺序比较二进制数的每个比特,若首个不同的比特位于右起第d位,则u和v之间的前缀距离d
f
(u,v)=d。5.根据权利要求1所述的基于IP地址多维特征聚类的网络拓扑模型构建方法,其特征在于,步骤S2中,所述基于链路两端的IP地址在所有探测路径中的跳数距离计算链路跳数包括以下子步骤:S221.对所述IP级拓扑图中的任意链路(u,v)∈E,用P(u,v)∈P表示经过链路(u,v)的路径集合,对p∈P(u,v),分别用和表示u和v在p中出现的序号;
S222.计算和之差的绝对值即为u和v在p中的跳数距离;S223.对所有经过(u,v)的路径P(u,v),计算u和v在其中所有路径中的最小跳数:6.根据权利要求1所述的基于IP地址多维特征聚类的网络拓扑模型构建方法,其特征在于,步骤S2中,所述基于链路两端的IP地址相较于各个...

【专利技术属性】
技术研发人员:张志勇张宇光孙治程丽君许卡徐锐饶志宏
申请(专利权)人:中国电子科技集团公司第三十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1