光模块监控方法技术

技术编号:39833861 阅读:20 留言:0更新日期:2023-12-29 16:17
本申请提供一种光模块监控方法

【技术实现步骤摘要】
光模块监控方法、系统、电子设置及存储介质


[0001]本申请涉及计算机
,尤其涉及一种光模块监控方法

系统

电子设置及存储介质


技术介绍

[0002]随着大数据

云计算

人工智能时代的到来,互联网业务量和数据量出现猛烈增长,计算量也随之增大

服务器的各光模块,如光模块对服务器的正常运行起着至关重要的作用,然而对于服务器各光模块的故障维修也越来越频繁

服务器的各光模块产品性能好坏会直接影响服务器设备的可靠性,当光模块出现故障时会降低服务器的可靠性,严重时会直接导致服务器系统集群瘫痪,因而对服务器的光模块故障的及时诊断是保证服务器可靠性的重要手段之一

[0003]同时由于不同厂商,服务器的光模块参数会有一定的差异,同一个品牌不同规格的光模块参数也会有较大差异,由于大规模数据中心配置不同的服务器,所以光模块的品牌

规格都有不同

鉴于上述多产品形态,多故障场景,如果针对每一光模块的每一故障类型一一制定对应的故障诊断代码,势必造成软件工程上大量重复劳动,繁杂并且难于管理


技术实现思路

[0004]本申请的目的是提供一种光模块监控方法及系统,用于解决现有技术中针对每一光模块的每一故障类型一一制定对应的故障诊断代码,造成软件工程上重复劳动且难于管理的缺陷,实现高效便捷地对服务器各光模块进行故障管理

[0005]本申请提供一种光模块监控方法,包括:
[0006]从目标服务器的各光模块的存储空间中读取各所述光模块的出厂参数集,并采集当前周期各所述光模块的当前参数集;
[0007]根据所述当前参数集

所述出厂参数集,以及所述当前周期对应的周期特征,确定所述目标服务器中异常光模块的故障类型;
[0008]根据所述异常光模块的位置信息和所述故障类型,确定所述异常光模块的故障维护策略,根据所述故障维护策略,对所述异常光模块进行故障维护

[0009]可选地,所述根据所述当前参数集

所述出厂参数集,以及所述当前周期对应的周期特征,确定所述目标服务器中异常光模块的故障类型,包括:
[0010]在根据所述周期特征确定所述当前周期为第一监测周期的情况下,获取各所述光模块在所述目标服务器中的累计运行时间;所述第一监测周期为除第一个监测周期之外的其他监测周期;
[0011]根据所述累计运行时间

所述当前参数集中各当前参数与所述出厂参数集中各所述当前参数对应的出厂参数之间的偏差值,确定各所述当前参数的衰减率;
[0012]将各所述当前参数的衰减率与各所述光模块对应的第一参考值进行比较,得到第一比较结果;
[0013]根据所述第一比较结果,在所述目标服务器的所有所述光模块中确定所述异常光模块,以及所述异常光模块的故障类型

[0014]可选地,所述根据所述第一比较结果,在所述目标服务器的所有所述光模块中确定所述异常光模块,以及所述异常光模块的故障类型,包括:
[0015]根据所述第一比较结果,在所述目标服务器的所有所述光模块中,确定所述当前参数集中存在至少一个当前参数的衰减率大于所述第一参考值的第一目标光模块;
[0016]确定所述第一目标光模块为所述异常光模块;
[0017]根据所述目标服务器的所有所述光模块形成的拓扑网络,在所述目标服务器中确定第一光模块集群;所述第一光模块集群包括与所述异常光模块之间的物理距离小于预设距离的第一参考光模块;
[0018]将各所述第一参考光模块的各当前参数的衰减率与所述异常光模块的各当前参数的衰减率进行比较,得到第二比较结果;
[0019]根据所述第二比较结果,确定所述异常光模块的故障类型

[0020]可选地,所述根据所述第二比较结果,确定所述异常光模块的故障类型,包括:
[0021]根据所述第二比较结果,在所述第一光模块集群中确定第二目标光模块;所述第二目标光模块的各当前参数的衰减率与所述异常光模块的各当前参数的衰减率在同一预设区间;
[0022]在确定所述第二目标光模块的光模块数量小于预设数量的情况下,确定所述异常光模块的故障类型为业务故障;
[0023]在确定所述光模块数量大于或等于所述预设数量的情况下,确定所述异常光模块的故障类型为操作环境故障

[0024]可选地,各所述光模块对应的第一参考值是基于如下步骤确定的:
[0025]获取各所述光模块对应的第二光模块集群;其中,所述第二光模块集群是样本服务器中与各所述光模块具备同一规格和同一生产厂商的正常光模块;
[0026]对所述第二光模块集群中各所述正常光模块在各历史周期的各参数的衰减率进行融合,得到所述各所述光模块对应的所述第一参考值

[0027]可选地,所述根据所述当前参数集

所述出厂参数集,以及所述当前周期对应的周期特征,确定所述目标服务器中异常光模块的故障类型,包括:
[0028]在根据所述周期特征确定所述当前周期为第二监测周期的情况下,计算所述当前参数集中各当前参数与所述出厂参数集中各所述当前参数对应的出厂参数之间的偏差值,得到各所述当前参数对应的偏差值;所述第二监测周期为第一个监测周期;
[0029]将各所述当前参数对应的偏差值与各所述光模块对应的第二参考值进行比较,得到第三比较结果;
[0030]根据所述第三比较结果,在所述目标服务器的所有所述光模块中确定所述异常光模块,以及所述异常光模块的故障类型

[0031]可选地,所述根据所述第三比较结果,在所述目标服务器的所有所述光模块中确定所述异常光模块,以及所述异常光模块的故障类型,包括:
[0032]根据所述第三比较结果,在所述目标服务器的所有所述光模块中,确定所述当前参数集中存在至少一个当前参数对应的偏差值大于所述第二参考值的第三目标光模块;
[0033]确定所述第三目标光模块为所述异常光模块;
[0034]在所述目标服务器中确定第二参考光模块;所述第二参考光模块为与所述异常光模块同规格同厂商的正常光模块;
[0035]将所述第二参考光模块的插接端口和所述异常光模块的插接端口进行互相切换,并对切换后的所述异常光模块进行故障监测;
[0036]在根据故障监测结果,确定切换后的所述异常光模块处于故障状态的情况下,确定所述异常光模块的故障类型为运输故障;
[0037]在根据故障监测结果,确定切换后的所述异常光模块处于正常状态的情况下,确定所述异常光模块的故障类型为安装故障

[0038]可选地,在所述从目标服务器的各光模块的存储空间中读取各所述光模块的出厂参数集之前,所述方法还包括:...

【技术保护点】

【技术特征摘要】
1.
一种光模块监控方法,其特征在于,包括:从目标服务器的各光模块的存储空间中读取各所述光模块的出厂参数集,并采集当前周期各所述光模块的当前参数集;根据所述当前参数集

所述出厂参数集,以及所述当前周期对应的周期特征,确定所述目标服务器中异常光模块的故障类型;根据所述异常光模块的位置信息和所述故障类型,确定所述异常光模块的故障维护策略,根据所述故障维护策略,对所述异常光模块进行故障维护
。2.
根据权利要求1所述的方法,其特征在于,所述根据所述当前参数集

所述出厂参数集,以及所述当前周期对应的周期特征,确定所述目标服务器中异常光模块的故障类型,包括:在根据所述周期特征确定所述当前周期为第一监测周期的情况下,获取各所述光模块在所述目标服务器中的累计运行时间;所述第一监测周期为除第一个监测周期之外的其他监测周期;根据所述累计运行时间

所述当前参数集中各当前参数与所述出厂参数集中各所述当前参数对应的出厂参数之间的偏差值,确定各所述当前参数的衰减率;将各所述当前参数的衰减率与各所述光模块对应的第一参考值进行比较,得到第一比较结果;根据所述第一比较结果,在所述目标服务器的所有所述光模块中确定所述异常光模块,以及所述异常光模块的故障类型
。3.
根据权利要求2所述的方法,其特征在于,所述根据所述第一比较结果,在所述目标服务器的所有所述光模块中确定所述异常光模块,以及所述异常光模块的故障类型,包括:根据所述第一比较结果,在所述目标服务器的所有所述光模块中,确定所述当前参数集中存在至少一个当前参数的衰减率大于所述第一参考值的第一目标光模块;确定所述第一目标光模块为所述异常光模块;根据所述目标服务器的所有所述光模块形成的拓扑网络,在所述目标服务器中确定第一光模块集群;所述第一光模块集群包括与所述异常光模块之间的物理距离小于预设距离的第一参考光模块;将各所述第一参考光模块的各当前参数的衰减率与所述异常光模块的各当前参数的衰减率进行比较,得到第二比较结果;根据所述第二比较结果,确定所述异常光模块的故障类型
。4.
根据权利要求3所述的方法,其特征在于,所述根据所述第二比较结果,确定所述异常光模块的故障类型,包括:根据所述第二比较结果,在所述第一光模块集群中确定第二目标光模块;所述第二目标光模块的各当前参数的衰减率与所述异常光模块的各当前参数的衰减率在同一预设区间;在确定所述第二目标光模块的光模块数量小于预设数量的情况下,确定所述异常光模块的故障类型为业务故障;在确定所述光模块数量大于或等于所述预设数量的情况下,确定所述异常光模块的故障类型为操作环境故障

5.
根据权利要求2所述的方法,其特征在于,各所述光模块对应的第一参考值是基于如下步骤确定的:获取各所述光模块对应的第二光模块集群;其中,所述第二光模块集群是样本服务器中与各所述光模块具备同一规格和同一生产厂商的正常光模块;对所述第二光模块集群中各所述正常光模块在各历史周期的各参数的衰减率进行融合,得到所述各所述光模块对应的所述第一参考值
。6.
根据权利要求1‑5任一项所述的方法,其特征在于,所述根据所述当前参数集

所述出厂参数集,以及所述当前周期对应的周期特征,确定所述目标服务器中异常光模块的故障类型,包括:在根据所述周期特征确定...

【专利技术属性】
技术研发人员:孔令涛
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1