本发明专利技术提供了一种网管系统中进程的恢复方法及装置,该网管系统中进程的恢复方法包括:按照预设时间周期获取网管系统进程在预设时间周期内的系统资源申请量;判断网管系统进程的系统资源申请量是否符合预设条件;以及在判定网管系统进程的系统资源申请量符合预设条件时,重新启动网管系统进程。通过本发明专利技术,解决了相关技术中系统资源申请没有得到释放造成的网管系统故障的问题,进而达到了降低网管系统故障发生率,提高网管系统可用性的技术效果。
【技术实现步骤摘要】
本专利技术涉及通信领域,具体而言,涉及一种网管系统中进程的恢复方法及装置。
技术介绍
随着网管系统越来越庞大,功能越来越多,管理的设备种类和数量也越来越多,进而出现了需要多个进程协作管理的需求,比如一个网络管理器(Manager)进程协同多个子网管理器(SubnetManager)进程工作,每个子网管理器管理若干的网元,网络管理器负责把消息转发到子网管理器以及收集来自每个子网管理器的消息汇总上报。工程中经常出现一些故障,比如某个子网管理器出现故障进程退出了,或者进程资源耗尽不能正常工作了,需要有一个管理机制来重启发生故障的进程来确保整个网管系统的正常工作。目前的一般做法是加一个后台监控程序,轮询每一个网管进程的状态,如果发现某个进程不在了,那么就重新启动这个进程对应的可执行程序。但是这种方法只能解决进程异常退出的情景。实际工程中,某个进程可能会出现异常而不退出的情况,比如,进程存在内存泄露,一段时间后无法从系统成功申请新的内存;或者进程使用完毕后没有关闭一些系统资源,比如网络套接字,文件句柄,注册表访问句柄等,导致这些系统资源的再次申请失败。这些因系统资源申请而没有正确释放造成的后果是累积性的,在一段时间内不影响整个系统的正常工作,但是随着进程工作时间的增加,系统的负担也会逐渐加重,直到不能正常工作。而这些问题的定位往往比较困难,在定位前需要有一个应急的方法。针对相关技术中系统资源申请没有得到释放造成的网管系统故障的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术提供了一种网管系统中进程的恢复方法及装置,以至少解决相关技术中系统资源申请没有得到释放造成的网管系统故障的问题。根据本专利技术的一个方面,提供了一种网管系统中进程的恢复方法,包括:按照预设时间周期获取网管系统进程在预设时间周期内的系统资源申请量;判断网管系统进程的系统资源申请量是否符合预设条件;以及在判定网管系统进程的系统资源申请量符合预设条件时,重新启动网管系统进程。进一步地,按照预设时间周期获取网管系统进程在预设时间周期内的系统资源申请量包括:按照预设时间周期获取操作系统进程的系统资源申请量,将操作系统进程的系统资源申请量作为网管系统进程的系统资源申请量,其中,操作系统进程是与网管系统进程对应的。进一步地,判断网管系统进程的系统资源申请量是否符合预设条件包括:判断网管系统进程的系统资源申请量是否达到预设门限;或者判断预设时间周期内网管系统进程的系统资源申请量的增长量是否达到预设增长量。进一步地,重新启动网管系统进程包括:关闭网管系统进程,并加载网管系统进程对应的信息。进一步地,网管系统进程对应的信息包括:网管系统进程的标识,网管系统进程的可执行文件,网管系统进程的启动信息以及网管系统进程对应的系统资源门限。进一步地,重新启动网管系统进程包括:在与网管系统进程所对应的网管系统的空闲时段重新启动网管系统进程。根据本专利技术的另一方面,提供了一种网管系统中进程的恢复装置,包括:获取模块,用于按照预设时间周期获取网管系统进程在预设时间周期内的系统资源申请量;判断模块,用于判断网管系统进程的系统资源申请量是否符合预设条件;以及重启模块,用于在判定网管系统进程的系统资源申请量符合预设条件时,重新启动网管系统进程。进一步地,获取模块包括:第一获取子模块,用于按照预设时间周期获取操作系统进程的系统资源申请量,将操作系统进程的系统资源申请量作为网管系统进程的系统资源申请量,其中,操作系统进程是与网管系统进程对应的。进一步地,网管系统中进程的恢复装置还包括:更新模块,用于更新与网管系统进程对应的操作系统进程的标识,并建立网管系统进程与标识的对应关系。通过本专利技术,采用实时监测网管系统进程的系统资源申请量的方式,能够及时发现当前占用过多系统资源的网管系统进程,从而找到潜在的异常的网管系统进程。通过将占用系统资源过多的网管系统进程重新启动,解决了相关技术中系统资源申请没有得到释放造成的网管系统故障的问题,进而达到了最大程度的保证网管系统可用性的效果。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的网管系统中进程的恢复方法的流程图;图2是根据本专利技术实施例的网管系统结构示意图;图3是根据本专利技术实施例的网管系统结构布局示意图;以及图4是根据本专利技术实施例的网管系统中进程的恢复装置的结构框图。具体实施方式下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。在本实施例中提供了一种网管系统中进程的恢复方法,图1是根据本专利技术实施例的网管系统中进程的恢复方法的流程图,如图1所示,该流程包括如下步骤:步骤S102,按照预设时间周期获取网管系统进程在预设时间周期内的系统资源申请量;步骤S104,判断网管系统进程的系统资源申请量是否符合预设条件;步骤S106,在判定网管系统进程的系统资源申请量符合预设条件时,重新启动网管系统进程。通过上述步骤,能够及时地发现网管系统中占用系统资源过多的网管系统进程,从而找到潜在异常的网管系统进程。通过重新启动占用系统资源过多的网管系统进程,解决了相关技术中系统资源申请没有得到释放造成的网管系统故障,达到了降低网管系统故障发生率,提高网管系统可用性的技术效果。网管系统包括一个网络管理器和一个或者多个子网管理器,网络管理器进程协同一个或者多个子网管理器进程工作。图2是根据本专利技术实施例的网管系统结构示意图,如图2所示,网络管理器11的进程负责将消息转发至子网管理器21,22,23,并获取多个子网管理器的消息进行汇总上报。子网管理器21,22,23的进程分别负责管理各自子网内的网元。下面以图2中所示的网管系统具体说明该实施例的网管系统中进程的恢复方法,需要说明的是,本专利技术实施例中的网管系统中进程的恢复方法并不仅限于图2中所示的网管系统,对于其他结构的网管系统,本专利技术实施例的网管系统中进程的恢复方法同样适用。可选地,本专利技术预先创建网管系统的监测模块,该监测模块可以用于执行上述步骤S102至步骤S106。图3是根据本专利技术实施例的网管系统结构布局示意图,如图3所示,该监测模块31用于实时监测网管系统中的网络管理器和子网管理器,其中,该监测模块31中预先配置有网管系统正常工作所需的网管系统进程列表以及网管系统进程列表中每个网管系统进程对应的信息。其中,网管系统中的网管系统进程包括网络管理器进程110,子网管理器进程210,220,230。监测模块31为一个单独地用于监测网管系统进程的进程,对于不同的网管系统工程组网,需要对监测模块31配置相应的网管系统进程列表以及网管系统进程列表中每个网管系统进程对应的信息,以保证网管系统的正常工作。可选地,监测模块31中配置的内容包括:网管系统进程列表,包括网络管理器进程110,子网管理器进程210,220,230。网管系统进程列表中每个网管系统进程对应的信息包括:网管系统进程本文档来自技高网...
【技术保护点】
一种网管系统中进程的恢复方法,其特征在于,包括:按照预设时间周期获取网管系统进程在所述预设时间周期内的系统资源申请量;判断所述网管系统进程的系统资源申请量是否符合预设条件;以及在判定所述网管系统进程的系统资源申请量符合所述预设条件时,重新启动所述网管系统进程。
【技术特征摘要】
1.一种网管系统中进程的恢复方法,其特征在于,包括:按照预设时间周期获取网管系统进程在所述预设时间周期内的系统资源申请量;判断所述网管系统进程的系统资源申请量是否符合预设条件;以及在判定所述网管系统进程的系统资源申请量符合所述预设条件时,重新启动所述网管系统进程。2.根据权利要求1所述的方法,其特征在于,按照预设时间周期获取网管系统进程在所述预设时间周期内的系统资源申请量包括:按照所述预设时间周期获取操作系统进程的系统资源申请量,将所述操作系统进程的系统资源申请量作为所述网管系统进程的系统资源申请量,其中,所述操作系统进程是与所述网管系统进程对应的。3.根据权利要求2所述的方法,其特征在于,在重新启动所述网管系统进程之后,所述方法还包括:更新与所述网管系统进程对应的操作系统进程的标识,并建立所述网管系统进程与所述标识的对应关系。4.根据权利要求1所述的方法,其特征在于,判断所述网管系统进程的系统资源申请量是否符合预设条件包括:判断所述网管系统进程的系统资源申请量是否达到预设门限;或者判断所述预设时间周期内所述网管系统进程的系统资源申请量的增长量是否达到预设增长量。5.根据权利要求1所述的方法,其特征在于,重新启动所述网管系统进程包括:关闭所述网管系统进程,并加载所述网管...
【专利技术属性】
技术研发人员:袁虎,
申请(专利权)人:中兴通讯股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。