云环境下虚拟机网络质量监控方法及监控系统技术方案

技术编号:27354854 阅读:24 留言:0更新日期:2021-02-19 13:34
本发明专利技术公开了云环境下虚拟机网络质量监控方法及监控系统,属于虚拟机网络质量监控技术领域,要解决的技术问题为如何实现云环境下虚拟机网络质量检测。方法,包括如下步骤:根据子网配置前置机;通过服务端界面配置监控方式和检测信息;构建前置机与服务端的网络连通;服务端向前置机发送待测虚拟机的虚拟机信息;服务端向前置机发起端口探测请求,前置机根据端口探测请求扫描虚拟机的端口并采集虚拟机的存活端口;前置机根据网络质量检测请求、依据配置的监控方式对虚拟机进行网络质量检测,并将上述网络质量信息和告警信息返回服务端;通过服务端推送的告警信息进行故障处理,并通过服务端展示历史网络质量信息。系统包括:前置机和服务端。置机和服务端。置机和服务端。

【技术实现步骤摘要】
云环境下虚拟机网络质量监控方法及监控系统


[0001]本专利技术涉及虚拟机网络质量监控
,具体地说是一种云环境下虚拟机网络质量监控方法及监控系统。

技术介绍

[0002]随着云计算技术在政务领域、企业领域逐步成熟,数据中心规模逐渐扩大,同时,由于这些领域的特殊性,往往需要划分互不相同的子网以承载不同的业务。业务子网内虚拟机的数量少则几十台,多则上千台;云环境下,网络设备不仅涉及传统的物理机、交换机、路由器、网闸,还涉及虚拟路由器和虚拟交换机;虚拟机的网络质量对于云产品的质量至关重要,对虚拟机网络质量的监控、分析、告警称为业界研究的方向。
[0003]面对日益复杂的网络环境,传统的监控系统仅是通过ICMP协议的ping命令简单分析网络质量情况。经过测试,虚拟机数量约千台的子网,如果仅通过ping命令进行网络质量探测,日均误告警约十万条,产生告警的主要原因在于网络抖动,同时,整个网络因为频繁的发送ICMP包,导致交换机承受了更大的负担,更加重了对网络质量的影响。同时,由于虚拟机存在于宿主机中,所以导致虚拟机的网络质量问题的并不一定是真实的物理设备,对于问题定位提出了挑战。
[0004]规模较小的业务子网带来的开销问题,对于规模较小的业务子网,显然在为其单独放置前置机会造成开销过大;在云环境下,可以在网络节点上访问各个子网,故可以在监控系统层面将较小的业务子网整合,将其视为一个较大的业务子网,只是其前置机必须放置在网络节点。
[0005]在TCP/IP协议簇中,TCP协议建立了稳定的网络通路,可以在网络质量不稳定的网络中实现可靠的数据链接。云环境下,可以将所有的宿主机纳入另一管理网,使用IPMI协议对宿主机的物理设备状态进行检测。综上,可以使用TCP检测端口活性,辅助修正ping检测;获取宿主机的网络质量情况,有助于进一步定位问题。
[0006]基于上述,如何实现云环境下虚拟机网络质量检测,是需要解决的技术问题。

技术实现思路

[0007]本专利技术的技术任务是针对以上不足,提供一种云环境下虚拟机网络质量监控方法及监控系统,来解决如何实现云环境下虚拟机网络质量检测的问题。
[0008]第一方面,本专利技术提供一种云环境下虚拟机网络质量监控方法,包括如下步骤:
[0009]根据子网配置前置机,前置机内部署有用于检测虚拟机网络质量的探测程序,并在云中心集群化部署服务端,所述服务端以服务端界面的形式与运维人员和租户进行控制交互;
[0010]通过服务端界面配置监控方式和检测信息,所述监控方式用于限定对虚拟机的检测方式,包括但不限于是否进行网络质量检测、是否进行端口探测以及ping的次数,所述检测信息包括但不限于告警信息、端口信息和采集周期,所述采集周期包括端口采集周期和
网络质量采集周期;
[0011]前置机向服务端发起注册请求,服务端根据注册请求向对应的前置机返回告警队列信息,构建前置机与服务端的网络连通;
[0012]根据采集周期,服务端向前置机发送待测虚拟机的虚拟机信息,所述虚拟机信息包括虚拟机与宿主机的网络拓扑关系;
[0013]根据端口采集周期,服务端向前置机发起端口探测请求,前置机根据端口探测请求扫描虚拟机的端口并采集虚拟机的存活端口,并将存活端口上传服务端;
[0014]根据网络质量采集周期,服务端向前置机发起网络质量检测请求,前置机根据网络质量检测请求、依据配置的监控方式对虚拟机进行网络质量检测,得到网络质量信息,并检测是否发送告警或清除告警得到告警信息,并将上述网络质量信息和告警信息返回服务端;
[0015]通过服务端推送的告警信息进行故障处理,并通过服务端展示历史网络质量信息。
[0016]作为优选,所述子网包括业务子网和由多个业务子网整合形成的整合业务子网;
[0017]根据子网配置前置机包括:
[0018]根据业务子网内虚拟机的个数,在每个业务子网中部署至少一个前置机;
[0019]对于云中心中较小的业务子网进行整合得到整合业务子网,在每个整合业务子网内部署至少一个前置机,对于整合业务子网,将前置机部署在云中心网络节点。
[0020]作为优选,通过如下方法在云中心集群化部署服务端:
[0021]选择一个业务子网,通过副本方式搭建数据库集群,所述数据库集群中至少两个数据库,至少一个数据库负责写入,至少一个数据库负责读取;
[0022]通过副本方式搭建服务器集群,所述服务器集群中至少两个服务器;
[0023]在上述服务器上部署服务端,在服务端所在的服务器上部署Nginx服务并配置负载均衡,使用Keeplived实现高可用,并向外暴露API提供访问、限制流量。
[0024]作为优选,所述网络质量信息包括但不限于丢包率、时延和端口活性。
[0025]作为优选,前置机检测执行虚拟机的网络质量得到网络质量信息,并检测是否发送告警和清除告警得到告警信息,包括如下步骤:
[0026]根据网络质量检测请求,获取需要检测虚拟机的信息;
[0027]根据需要检测虚拟机的信息,对相应子网内虚拟机进行分组;
[0028]对于每组虚拟机,通过ping检测端口是否连通,如果连通,发送告警解除信息,如果没有连通,对虚拟机进行端口活性检测,如果端口存活,发送告警解除信息,如果端口不存活,发送告警信息。
[0029]作为优选,所述监控方式还包括是否进行物理组件活性检测。
[0030]作为优选,通过服务端推送的告警信息进行故障处理,包括:
[0031]分析探测程序提供的异常产生内容,进一步分析虚拟机对应的宿主机是否存在问题,如果存在问题,进一步分析宿主机的物理设备问题;
[0032]当定位为虚拟机由于网络波动产生误告警,则下次检测周期增加,只有多个检测周期内检测出问题才发送告警信息;
[0033]如果虚拟机掉线或关机,则通过虚拟化平台进行重启;
[0034]如果分析出对应的宿主机存在网络质量问题,进一步分析宿主机的物理组件状态,如果宿主机由于掉电问题停机,则排除故障后重启宿主机;
[0035]如果宿主机物理组件信息正常,则进一步分析网络和操作系统问题。
[0036]作为优选,所述前置机为选定的一个虚拟机或增设的物理主机。
[0037]第二方面,本专利技术提供一种云环境下虚拟机网络质量监控系统,包括:
[0038]前置机,所述前置机内部署有用于检测虚拟机网络质量的探测程序,上述前置机共多个,每个前置机部署于对应的子网中;
[0039]服务端,所述服务端以服务端界面的形式与运维人员和租户进行控制交互,用于配置监控方式和检测信息,所述监控方式用于限定对虚拟机的检测方式,包括但不限于是否进行网络质量检测、是否进行端口探测以及ping的次数,所述检测信息包括但不限于告警信息、端口信息和采集周期,所述采集周期包括端口采集周期和网络质量采集周期;
[0040]上述服务端集群化部署于云本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.云环境下虚拟机网络质量监控方法,其特征在于包括如下步骤:根据子网配置前置机,前置机内部署有用于检测虚拟机网络质量的探测程序,并在云中心集群化部署服务端,所述服务端以服务端界面的形式与运维人员和租户进行控制交互;通过服务端界面配置监控方式和检测信息,所述监控方式用于限定对虚拟机的检测方式,包括但不限于是否进行网络质量检测、是否进行端口探测以及ping的次数,所述检测信息包括但不限于告警信息、端口信息和采集周期,所述采集周期包括端口采集周期和网络质量采集周期;前置机向服务端发起注册请求,服务端根据注册请求向对应的前置机返回告警队列信息,构建前置机与服务端的网络连通;根据采集周期,服务端向前置机发送待测虚拟机的虚拟机信息,所述虚拟机信息包括虚拟机与宿主机的网络拓扑关系;根据端口采集周期,服务端向前置机发起端口探测请求,前置机根据端口探测请求扫描虚拟机的端口并采集虚拟机的存活端口,并将存活端口上传服务端;根据网络质量采集周期,服务端向前置机发起网络质量检测请求,前置机根据网络质量检测请求、依据配置的监控方式对虚拟机进行网络质量检测,得到网络质量信息,并检测是否发送告警或清除告警得到告警信息,并将上述网络质量信息和告警信息返回服务端;通过服务端推送的告警信息进行故障处理,并通过服务端展示历史网络质量信息。2.根据权利要求1所述的云环境下虚拟机网络质量监控方法,其特征在于所述子网包括业务子网和由多个业务子网整合形成的整合业务子网;根据子网配置前置机包括:根据业务子网内虚拟机的个数,在每个业务子网中部署至少一个前置机;对于云中心中较小的业务子网进行整合得到整合业务子网,在每个整合业务子网内部署至少一个前置机,对于整合业务子网,将前置机部署在云中心网络节点。3.根据权利要求1所述的云环境下虚拟机网络质量监控方法,其特征在于通过如下方法在云中心集群化部署服务端:选择一个业务子网,通过副本方式搭建数据库集群,所述数据库集群中至少两个数据库,至少一个数据库负责写入,至少一个数据库负责读取;通过副本方式搭建服务器集群,所述服务器集群中至少两个服务器;在上述服务器上部署服务端,在服务端所在的服务器上部署Nginx服务并配置负载均衡,使用Keeplived实现高可用,并向外暴露API提供访问、限制流量。4.根据权利要求1或2所述的云环境下虚拟机网络质量监控方法,其特征在于所述网络质量信息包括但不限于丢包率、时延和端口活性;前置机检测执行虚拟机的网络质量得到网络质量信息,并检测是否发送告警和清除告警得到告警信息,包括如下步骤:根据网络质量检测请求,获取需要检测虚拟机的信息;根据需要检测虚拟机的信息,对相应子网内虚拟机进行分组;对于每组虚拟机,通过ping检测端口是否连通,如果连通,发送告警解除信息,如果没有连通,对虚拟机进行端口活性检测,如果端口存活,发送告警解除信息,如果端口不存活,
发送告警信息。5.根据权利要求4所述的云环境下虚拟机网络质量监控方法,其特征在所述监控方式还包括是否进行物理组件活性检测。6.根据权利要求5所述的云环境下虚拟机网络质量监控方法,其特征在于通过服务端推送的告警信息进行故障处理,包括:分析探测程序提供的异常产生内容,进一步分析虚拟机对应的宿主机...

【专利技术属性】
技术研发人员:王东杰方亚东
申请(专利权)人:浪潮云信息技术股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1