本发明专利技术公开一种基于分布式自动化测量的性能瓶颈分析方法及装置,该方法步骤包括:1)获取被测网络的网络拓扑信息;2)获取各交换机节点之间的链路作为关键链路,分别执行测量,进行网络瓶颈点、故障点定位,且每次定位时若未定位到,则根据测量结果收敛关键链路的待测网络规模;3)获取交换机节点与计算节点之间的链路作为端链路,分别执行测量,进行网络瓶颈点、故障点定位,且每次定位时若未定位到,则根据测量结果收敛端链路的待测网络规模;该装置包括网络信息获取模块、关键链路分析模块以及端链路分析模块。本发明专利技术具有能够针对大规模网络实现分布式的自动化测量,同时能够快速、准确的定位网络瓶颈点或故障点的优点。
【技术实现步骤摘要】
本专利技术涉及大规模数据中心网络、高性能巨型机网络中系统测量及性能分析
,尤其涉及一种基于分布式自动化测量的性能瓶颈分析方法及装置。
技术介绍
当前数据中心一般使用数量众多的核心交换机、汇聚交换机和接入交换机,负责为整个数据中心的计算服务器、应用服务器和存储系统提供高速信息交互的支撑平台,数据中心网络的可用性和连通性是影响整个数据中心网络提供服务的重要因素。由于数据中心互连计算和服务节点数能达到1K以上的量级,而交换节点数也接近K的量级,在这种规模下,快速排查和精确定位整个网络故障非常困难,因而针对这种大规模数据中心网络,如何通过智能测量自动发现数据中心网络的网络故障设备、链路和网络瓶颈显得尤为重要。针对网络测量的方法通常应该具有以下特性:a.健壮性,即在被测网络发成轻微变化时,测量方法不会因此失效;b.可重复行,即在相同网络条件下,多次测量结果应该保持一致,不会出现较大差别;c.准确性,即测量的结果能够准确的反映网络的实际情况。目前针对网络测量的方法从测量的方式、测量点的位置、测量参与者等方面分类,主要有以下几类: (O主动测量和被动测量:主动测量是根据测量需要向被测网络中发送一些特定的探测数据包,通过对探测数据包穿越网络而发生的变化进行分析,得到当前网络的状态和性能参数;例如,网络测试命令Ping通过发送ICMP探测数据包,获得被测网络的连通性、往返延时和丢包率;被动测量是在网络中的关键设备和节点上部署测量装置捕获数据包并进行统计分析,进而获得当前网络的状态和性能参数。(2)网络边缘测量和网络内部测量:网络边缘测量不需要网络核心设备的配合,只需要网络边缘主机的参与即可,通过边缘主机对网络进行端到端的业务性能测量,了解网络的性能参数,例如网络延时、分组丢包率;网络断层扫描或网络层析(NetworkTomography,NT)技术就是一种网络边缘测量技术,NT技术就是根据对网络外部(网络端点)的测量来分析和推断整个网络的拓扑结构和网络性能;网络内部设备测量是一种被动测量的方法,是在网络内相关设备上通过抽样统计等方法,来对网络的性能和流量进行测量。(3)协作式测量和非协作式测量:协作式测量指需要被测网络配合才能对所测网络进行测量的方法,例如,路由器协作的测量;非协作式的测量方法不需要被测网络的参与,例如,监测网络拓扑的变化。(4 )单点测量和分布式测量:单点测量方法主要针对网络规模较小、且网络结构相对简单的情况,通过设置单个测量点就能够测试网络的性能;对于规模较大的网络,则需要在所测网络中部署较多的测量代理进行分布式的测量,得到更详细的测量数据以实现对网络更精确的测量。综上所述,以上几种方法都需要网络管理人员较大的参与度,而当前数据中心具有网络规模大而复杂的特点,因而以上方法均无法实现对数据中心网络自动化和智能化的测量,更难以实现快速的发现和定位网络故障。
技术实现思路
本专利技术要解决的技术问题就在于:针对现有技术存在的技术问题,本专利技术提供一种能够针对大规模网络实现分布式的自动化测量,同时能够快速、准确的定位网络瓶颈点或故障点的基于分布式自动化测量的性能瓶颈分析方法及装置。为解决上述技术问题,本专利技术提出的技术方案为: 一种基于分布式自动化测量的性能瓶颈分析方法,步骤包括: O网络信息获取:获取被测网络的网络拓扑信息,所述网络拓扑信息包括被测网络中所有交换机节点信息、计算节点信息以及交换机节点与计算节点之间的连接信息; 2 )关键链路分析:根据所述网络拓扑信息获取被测网络的中各交换机节点之间的链路作为关键链路,分别执行各条所述关键链路的测量,并根据各条关键链路的测量结果分别进行关键链路故障定位,且每次定位时若未定位到,则根据测量结果收敛关键链路的待测网络规模,直至定位得到关键链路的瓶颈点、故障点; 3)端链路分析:根据所述网络拓扑信息获取被测网络中交换机节点与计算节点之间的链路作为端链路,分别执行各条所述端链路的测量,并根据各条端链路的测量结果分别进行端链路故障定位,且每次定位时若未定位到,则根据所述端链路的测量结果收敛端链路的待测网络规模,直至定位得到端链路的所有瓶颈点、故障点。作为本专利技术方法的进一步改进:所述步骤2)、步骤3)中收敛待测网络规模具体是通过递归的基于最小覆盖原则的测量方法,将测量结果为正常的链路从测量集合中删除,以逐渐收敛待测网络的规模。作为本专利技术方法的进一步改进,所述步骤2)的具体步骤为: 2.1)关键链路获取:获取被测网络的所有链路中直连的两个节点均为交换机节点的链路作为关键链路,构成待测关键链路集合; 2.2)关键链路任务生成:启动测量时,从被测网络的核心层设备开始,依次递归的取出与核心层相连的汇聚设备,以及再通过汇聚设备找到相连的接入交换设备,生成关键链路的测量任务; 2.3)关键链路任务执行:配置各所述关键链路测量任务中每个关键任务测量对的测量参数并执行测量,得到各关键任务测量对的测量结果; 2.4)关键链路任务分析:分别判断所述各关键任务测量对的测量结果,每次判断时,若存在异常,则判定对应关键任务测量对之间所覆盖的关键链路中存在瓶颈点或故障点;若正常,则判定对应关键任务测量对之间所覆盖的所有关键链路均正常,并将对应关键任务测量对从待测关键链路集合中删除以收敛待测关键链路集合的规模,各关键任务测量对判断完成后得到关键链路的所有瓶颈点、故障点。作为本专利技术方法的进一步改进,所述步骤2.2)的具体步骤为: 2.2.1)启动测量时,获取被测网络的所有核心层交换机节点构成核心交换节点集合;定义一个关键链路测量任务集合并初始化为空; 2.2.2)判断核心交换节点集合是否为空,若不为空,则取出其中任意一个核心层交换机节点作为当前核心层交换机节点,跳转到步骤2.2.3);若为空,得到所有核心层交换机节点对应的关键链路测量任务集合并退出; 2.2.3)获取当前核心层交换机节点下所有的子节点构成一级子节点集合,跳转到步骤2.2.4); 2.2.4)判断所述一级子节点集合是否为空,若不为空则取出其中任意两个子节点,跳转到步骤2.2.5);若为空,生成得到当前核心层交换机节点对应的关键链路测量任务集合,返回执行步骤2.2.2); 2.2.5)判断所述步骤2.2.4)取出的两个子节点是否均为接入层交换机节点,如果是,则由所述取出的两个子节点构成关键链路测量任务对并加入到关键链路测量任务集合中,删除取出的所述两个子节点,跳转到步骤2.2.4);否则跳转到步骤2.2.6); 2.2.6)由所述步骤2.2.4)取出的两个子节点下的所有子节点得到两个对应的二级子节点集合,转入执行步骤2.2.7); 2.2.7)判断所述步骤2.2.6)中得到的两个二级子节点集合是否为空,若均不为空,则分别从所述两个二级子节点集合中任意取一个子节点,转入执行步骤2.2.8);若其中有一个为空,则从不为空的二级子节点集合中任意取一个子节点,并从与所述一级子节点集合中子节点直连的所有子节点中任意取一个接入层交换机节点,转入执行步骤2.2.8);若均为空,返回执行步骤2.2.4); 2.2.8)若所述步骤2.2.7)取出的两个子节点均为接入层交换机节点,则由取出的两个子节点构成本文档来自技高网...
【技术保护点】
一种基于分布式自动化测量的性能瓶颈分析方法,其特征在于,步骤包括:1)网络信息获取:获取被测网络的网络拓扑信息,所述网络拓扑信息包括被测网络中所有交换机节点信息、计算节点信息以及交换机节点与计算节点之间的连接信息;2)关键链路分析:根据所述网络拓扑信息获取被测网络的中各交换机节点之间的链路作为关键链路,分别执行各条所述关键链路的测量,并根据各条关键链路的测量结果分别进行关键链路故障定位,且每次定位时若未定位到,则根据测量结果收敛关键链路的待测网络规模,最后得到关键链路的所有瓶颈点、故障点;3)端链路分析:根据所述网络拓扑信息获取被测网络中交换机节点与计算节点之间的链路作为端链路,分别执行各条所述端链路的测量,并根据各条端链路的测量结果分别进行端链路故障定位,且每次定位时若未定位到,则根据所述端链路的测量结果收敛端链路的待测网络规模,最后得到端链路的所有瓶颈点、故障点。
【技术特征摘要】
【专利技术属性】
技术研发人员:陈琳,王宝生,张晓哲,黄杰,孙志刚,张飞朋,南洋,廖纯,
申请(专利权)人:中国人民解放军国防科学技术大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。