一种基于IP地址多维特征聚类的网络拓扑模型构建方法技术

技术编号：38383333 阅读：7 留言：0更新日期：2023-08-05 17:40

本发明专利技术公开了一种基于IP地址多维特征聚类的网络拓扑模型构建方法，包括以下步骤：从给定的探测源集合中对目标网络的IP地址集进行探测，获得IP路径数据并处理得到IP级拓扑图；对IP级拓扑图中的任意链路，计算前缀距离、链路跳数和链路时延；按照链路距离对IP级拓扑图中的IP节点进行聚类，形成互不相交的IP节点簇；将IP节点簇中属于相同簇的IP节点进行聚合形成网络前缀节点，并构建初始的前缀级拓扑；对前缀级拓扑中存在包含关系的前缀节点进行修正，获得所有节点满足互斥性的前缀级拓扑。本发明专利技术从IP级拓扑出发，通过从多个维度分析IP地址的属性特征和连接关系，生成更能够准确捕获网络拓扑结构特征的网络拓扑模型。获网络拓扑结构特征的网络拓扑模型。获网络拓扑结构特征的网络拓扑模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于IP地址多维特征聚类的网络拓扑模型构建方法

[0001]本专利技术涉及网络空间测绘
，尤其涉及一种基于IP地址多维特征聚类的网络拓扑模型构建方法。

技术介绍

[0002]全面深入地了解网络拓扑的结构特征及其动态演化趋势有助于优化网络协议、开发新型网络应用、保障网络性能、发现网络脆弱区域等工作的开展。但由于互联网自兴起之初便具有分布式自治的特性，目前已经发展成为规模极为庞大、结构层次特征明显、局部结构复杂多样、路由状态时刻变化、缺少中心化管控机制的复杂巨系统，因而时至今日，对网络拓扑进行探测、还原、分析仍然是人们关注的热点问题。
[0003]按照网络拓扑模型中节点粒度由粗到细的顺序进行排列，目前主流的拓扑刻画模型包括自治域(AutonomousSystem，AS)级、接入点(Point of Presence，PoP)级、路由器级和IP级等4个层级。它们在不同粒度对网络拓扑进行建模刻画，所获得的网络拓扑图的“分辨率”也各不相同，各有优缺点：
[0004](1)AS级拓扑中的每个节点对应一个自治域，每条链路对应自治域之间的商业服务关系。大型自治域可能包含数百万个IP地址，覆盖全球多个国家或地区，因此该模型是在宏观层面以一种极粗的粒度对网络拓扑进行刻画。但因其中节点的粒度过于粗糙，导致AS级网络拓扑的“分辨率”极低，大量有效信息被隐藏在AS节点的内部而未能表现在拓扑模型中。
[0005](2)PoP级拓扑中的每个节点对应一个运营商在某个城市的接入点，每条链路对应接入点之间的连接关系。一

【技术保护点】

【技术特征摘要】
1.一种基于IP地址多维特征聚类的网络拓扑模型构建方法，其特征在于，包括以下步骤：S1.从给定的探测源集合中对目标网络的IP地址集进行探测，获得IP路径数据并处理得到IP级拓扑图；S2.对所述IP级拓扑图中的任意链路，基于IP地址的二进制表征形式计算链路两端IP地址之间的前缀距离，并基于链路两端的IP地址在所有探测路径中的跳数距离计算链路跳数，以及基于链路两端的IP地址相较于各个探测源的往返时延计算链路时延；S3.将所述前缀距离、链路跳数和链路时延作为反映链路距离的特征向量，按照链路距离对所述IP级拓扑图中的IP节点进行聚类，形成互不相交的IP节点簇；S4.将所述IP节点簇中属于相同簇的IP节点进行聚合，形成网络前缀节点，并构建初始的前缀级拓扑；S5.对所述前缀级拓扑中存在包含关系的前缀节点进行修正，获得所有节点满足互斥性的前缀级拓扑，形成最终的网络拓扑模型。2.根据权利要求1所述的基于IP地址多维特征聚类的网络拓扑模型构建方法，其特征在于，步骤S1中，针对探测源集合S＝{s1,s2,
…
,s
I
}和目标网络的IP地址集D＝{d1,d2,
…
,d
J
}，将所有探测得到的IP路径用P＝{p1,p2,
…
,p
K
}表示，探测源s∈S到探测目标d∈D的IP路径记为p＝(s,r1,r2,
…
,r
n
,d)，其中r1,r2,
…
,r
n
均为路径p经过的IP地址或者匿名节点，匿名节点在探测结果中以“*”出现；对路径p中除探测源s外的每个非匿名节点r，探测结果中同时包含从探测源s到r的往返时延RTT；获得所有IP路径P后，处理得到IP级拓扑图，用图模型表示。3.根据权利要求2所述的基于IP地址多维特征聚类的网络拓扑模型构建方法，其特征在于，步骤S1包括以下子步骤：S101.所有路径中的非匿名节点构成节点集合V，用节点的IP地址作为标识；S102.如果节点集合V中的节点u和节点v同时出现在某条路径，且节点u和节点v之间无其他非匿名节点，则在节点u和节点v之间建立一条边，用(u,v)∈E表示，E中的边也被称为IP链路。4.根据权利要求1所述的基于IP地址多维特征聚类的网络拓扑模型构建方法，其特征在于，步骤S2中，所述基于IP地址的二进制表征形式计算链路两端IP地址之间的前缀距离包括以下子步骤：S211.对所述IP级拓扑图中的任意链路(u,v)∈E，将IP地址u和v转换为32位的二进制数；S212.按照从高位到低位即从左至右的顺序比较二进制数的每个比特，若首个不同的比特位于右起第d位，则u和v之间的前缀距离d
f
(u,v)＝d。5.根据权利要求1所述的基于IP地址多维特征聚类的网络拓扑模型构建方法，其特征在于，步骤S2中，所述基于链路两端的IP地址在所有探测路径中的跳数距离计算链路跳数包括以下子步骤：S221.对所述IP级拓扑图中的任意链路(u,v)∈E，用P(u,v)∈P表示经过链路(u,v)的路径集合，对p∈P(u,v)，分别用和表示u和v在p中出现的序号；
S222.计算和之差的绝对值即为u和v在p中的跳数距离；S223.对所有经过(u,v)的路径P(u,v)，计算u和v在其中所有路径中的最小跳数：6.根据权利要求1所述的基于IP地址多维特征聚类的网络拓扑模型构建方法，其特征在于，步骤S2中，所述基于链路两端的IP地址相较于各个...

【专利技术属性】
技术研发人员：张志勇，张宇光，孙治，程丽君，许卡，徐锐，饶志宏，
申请(专利权)人：中国电子科技集团公司第三十研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人