停止判定分类模型的生成方法、网络拓扑探测方法及装置制造方法及图纸

技术编号:38747979 阅读:23 留言:0更新日期:2023-09-08 23:28
本发明专利技术公开了一种停止判定分类模型的生成方法、网络拓扑探测方法及装置,属于网络拓扑探测领域,包括步骤:获取原始探测结果数据集;将原始探测结果数据集中的探测路径按目标分组;统计分组后同目标路径中的重复节点,以及在其之后是否存在多径路由;提取各个重复节点的特征;以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集;利用带标签数据集进行机器学习分类模型训练得到停止判定分类模型;在之后的其他探测过程中,当遇到重复节点时,利用停止判定分类模型进行停止判定,由判定结果决定是否停止探测。本发明专利技术控制了网络拓扑探测成本,保障了拓扑探测发现率,适用于对网络拓扑发现性价比和完整性有较高要求的场景。高要求的场景。高要求的场景。

【技术实现步骤摘要】
停止判定分类模型的生成方法、网络拓扑探测方法及装置


[0001]本专利技术涉及网络空间拓扑探测领域,更为具体的,涉及一种停止判定分类模型的生成方法、网络拓扑探测方法及装置。

技术介绍

[0002]随着信息技术和数字技术的迅猛发展,网络空间已经广泛地渗透到各个领域,包括国防、经济和民生等方面。通过对互联网拓扑结构的深入了解,我们可以更好地掌握网络资源的分布情况、网络性能的瓶颈位置、网络攻击的来源等重要信息,这对于网络管理、网络优化和网络安全都具有非常重要的意义。
[0003]目前,研究者们提出了多种网络空间拓扑探测方法,其中包括基于IP地址探测的网络拓扑探测方法、基于路由表的网络拓扑探测方法、基于流量分析的网络拓扑探测方法等。其中,基于IP地址探测的拓扑探测是最为常见的方法之一,通过向目标网络中的大量节点发送探测包,并利用探测包的回复信息来推断网络的拓扑结构。
[0004]随着网络技术的不断发展,现代网络空间已经变得非常庞大,网络节点数量极多,节点间的连接关系也异常复杂。因此,如何高效快速地发现网络空间的拓扑结构成为了一个极具挑战性的问题。为此,研究者们提出了基于多线程技术和并行计算技术的探测方法,通过使用多探测源高并发网络拓扑测量和建设大规模网络拓扑测量平台等手段提高探测效率,加速探测进程。比如ZMap是一种高速的互联网扫描器,可以在几分钟内扫描整个IPv4地址空间。它使用多线程和异步I/O技术,能够快速地发送大量的数据包,并在短时间内获取网络拓扑信息。由Luckie等人设计的Scamper工具,它可以通过调用远程API的方式来对目标IP实现高速率的并行探测。微软开发的Pingmesh使用了大规模分布式系统来进行网络拓扑探测,具备高度可扩展和高效性能,能够快速地发现网络中的节点和链路信息。CAIDA(应用互联网数据分析中心)通过开发和部署第二代通用大规模拓扑测量平台ARK,在网络范围内设置了120个节点,这些探测源不断进行网络探测和数据收集,以高强度获取互联网拓扑信息。尽管上述探测方法能够广泛探测网络目标,但同时也会向网络投送大量探测数据包,这会增加网络带宽的压力,也会对探测目标的正常工作产生影响。
[0005]为了解决这一问题,Donnet等提出了基于停止集的DoubleTree网络拓扑测量方法,这种方法通过信息共享机制将不同探测源探测的拓扑路径分发给所有探测源,各个探测源将已经探到的拓扑节点存储在停止集中,当下一次再探到停止集中相同目标的重复节点时,就停止探测并复用已经探测的结果,从而避免冗余探测,减少探测发包,控制测量损耗。这种探测方法存在两个问题,一是探测源为了共享探测结果会带来巨大的通信数据量,二是由于一旦遇到重复节点就会停止探测,因此无法探测到重复节点之后多径路由路径上的节点。为了克服这两个问题,研究人员提出了多种优化方法。Ding Xianhua等人提出了一种提升网络拓扑探测完整性的方法,该方法利用二分搜索算法几乎可以查找到路径中所有的拓扑链路和节点,不过这种方法要求目的地和接口均匀分布,在实践中比较苛刻。为了降低探测设备之间的通信成本,乔宏等人提高了全局停止集的存储维度,同时通过仅交互变
化信息的方式来传递探测结果。另外,杨旭等人将探测源分成等量小组,以组组通信的方式替代了大量的点对点通信,降低了通信量。然而,现有技术均无法解决实际探测时基于停止集的网络拓扑探测方法中,由于多径路由的广泛使用带来的拓扑发现覆盖率不足的问题。

技术实现思路

[0006]本专利技术的目的在于克服现有技术的不足,提供一种停止判定分类模型的生成方法、网络拓扑探测方法及装置,解决了现有基于停止集的网络拓扑探测技术一旦遇到重复节点就停止探测,但因多径路由的广泛使用导致的网络节点、链路等拓扑元素发现不完整的问题,可以在缩减探测发包量的同时,探测到更多的多径路由上的拓扑元素,从而既控制了网络拓扑探测成本,又保障了拓扑探测发现率,更适用于对网络拓扑发现性价比和完整性有较高要求的应用场景。
[0007]本专利技术的目的是通过以下方案实现的:一种停止判定分类模型的生成方法,包括以下步骤:S1,获取原始探测结果数据集;S2,将原始探测结果数据集中的探测路径按目标分组;S3,统计分组后同目标路径中的重复节点,以及在其之后是否存在多径路由;S4,提取各个重复节点的特征;S5,以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集;S6,利用步骤S5中所得带标签数据集进行机器学习分类模型训练得到停止判定分类模型。
[0008]进一步地,在步骤S1中,所述原始探测结果数据集为节点和链路构成的去重后的拓扑探测路径集合。
[0009]进一步地,所述获取原始探测结果数据集,还包括子步骤:汇总所有探测源的所有探测结果路径形成原始探测结果数据集。
[0010]进一步地,在步骤S3中,所述分组后统计同目标路径中的重复节点,以及在其之后是否存在多径路由,具体包括子步骤:重复节点是在原始数据集的同一目标分组中,出现在至少两条路径上的节点;重复节点之后是否存在多径路由是从重复节点到探测目标之间是否存在多条路径,如果存在多条路径,则存在多径路由,若不存在多条路径,则不存在多径路由。
[0011]进一步地,在步骤S4中,所述提取各个重复节点的特征,具体包括子步骤:针对步骤S3中统计出的各个重复节点,面向其所在的每一条路径,抽取其特征。
[0012]进一步地,在步骤S5中,所述以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集,具体包括子步骤:将步骤S4中针对重复节点的每一条路径抽取的特征值和步骤S3中相应路径在该重复节点之后是否存在多径路由的结果结合,以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集。
[0013]进一步地,在步骤S6中,所述机器学习方法包括决策树、随机森林、回归算法、神经网络算法中的任一种。
[0014]一种网络拓扑探测方法,包括如下子步骤:步骤1,获取探测源结果路径;
步骤2,当前探测源启动新一轮探测;步骤3,判断当前节点是否与目标节点IP地址相同;如果是新一轮探测刚启动,则直接比较探测源和目标节点,若不是,则将刚探得的节点与目标节点进行比较;如果相同,则结束探测,如果不同,则进行步骤4;步骤4,查看当前节点是否是已经出现在已知的同目标路径当中的重复节点,若是则进行步骤5,若不是,则进行下一跳的探测,并返回步骤3;步骤5,抽取当前节点的所有特征,能够依据当前探测路径抽取的特征基于当前路径抽取,不能依据当前探测路径抽取的特征基于包含此重复节点的已知探测路径抽取;步骤6,基于步骤5中抽取出的特征集合,利用如上训练生成的所述停止判定分类模型进行机器学习分类;步骤7,如果步骤6中的分类结果是1,即之后路径中存在多径路由,则进行新一跳的探测,并回到步骤3;若分类结果是0,即之后路径中不存在多径路由,则结束探测。
[0015]进一步地,在步骤1中,所述获取探测源结果路径包括子步骤:当前探测源通过路径共享机制获取其他探测源的探测结果路径。...

【技术保护点】

【技术特征摘要】
1.一种停止判定分类模型的生成方法,其特征在于,包括以下步骤:S1,获取原始探测结果数据集;S2,将原始探测结果数据集中的探测路径按目标分组;S3,统计分组后同目标路径中的重复节点,以及在其之后是否存在多径路由;S4,提取各个重复节点的特征;S5,以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集;S6,利用步骤S5中所得带标签数据集进行机器学习分类模型训练得到停止判定分类模型。2.根据权利要求1所述的停止判定分类模型的生成方法,其特征在于,在步骤S1中,所述原始探测结果数据集为节点和链路构成的去重后的拓扑探测路径集合。3.根据权利要求1所述的停止判定分类模型的生成方法,其特征在于,所述获取原始探测结果数据集,还包括子步骤:汇总所有探测源的所有探测结果路径形成原始探测结果数据集。4.根据权利要求1所述的停止判定分类模型的生成方法,其特征在于,在步骤S3中,所述统计分组后同目标路径中的重复节点,以及在其之后是否存在多径路由,具体包括子步骤:重复节点是在原始数据集的同一目标分组中,出现在至少两条路径上的节点;重复节点之后是否存在多径路由是从重复节点到探测目标之间是否存在多条路径,如果存在多条路径,则存在多径路由,若不存在多条路径,则不存在多径路由。5.根据权利要求1所述的停止判定分类模型的生成方法,其特征在于,在步骤S4中,所述提取各个重复节点的特征,具体包括子步骤:针对步骤S3中统计出的各个重复节点,面向其所在的每一条路径,抽取其特征。6.根据权利要求5所述的停止判定分类模型的生成方法,其特征在于,在步骤S5中,所述以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集,具体包括子步骤:将步骤S4中针对重复节点的每一条路径抽取的特征值...

【专利技术属性】
技术研发人员:张宇光张志勇张位毛得明饶志宏兰昆刘正军程丽君张淑文朱治丞
申请(专利权)人:中国电子科技网络信息安全有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1