一种系统事件告警方法及设备技术方案

技术编号:32825612 阅读:11 留言:0更新日期:2022-03-26 20:27
本申请提供一种系统事件告警方法及设备。该系统事件告警方法包括,基于预设的告警事件规则列表确定待查看系统事需要告警;基于待查看系统事件的事件类型确定需要告警的部件以及告警类型;基于告警类型对应的重复事件识别规则识别待查看系统事件是否与需要告警的部件的先前的系统事件重复;当待查看系统事件与先前的系统事件不重复,基于待查看系统事件生成指示事件类型的事件码;存储事件码并分配关联的事件码标识;其中,事件码标识在当前基板管理控制器运行周期内具有唯一性;向带外管理设备发送事件码标识和事件码用以基于事件码标识查看事件码以获取待查看系统事件的事件类型。类型。类型。

【技术实现步骤摘要】
一种系统事件告警方法及设备


[0001]本申请涉及通信技术,特别涉及一种系统事件告警方法及设备。

技术介绍

[0002]IPMI是(Intelligent Platform Management Interface,智能型平台管理接口)标准是一种工业标准,可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。
[0003]IPMI系统的核心是BMC(Baseboard Management Controller,基板管理控制器),通过向BMC发送IPMI标准的规定指令执行相应的IMPI功能。BMC接收指令并在IPMI系统的SEL(System Event Log,系统事件日志)组件中记录事件消息,IPMI系统的IPMB(Intelligent Platform Management Bus,智能平台管理总线)连接各个控制器以及作为传感器的接口的I2C器件,使得系统管理软件能够通过IPMB读取传感器的数据。这些传感器具体配置信息,如告警门限、事件触发是否允许等配置保存在IPMI系统的SDR(Sensor Data Record,传感器数据记录)组件,这些传感器产生的系统事件也保存在SEL(System Event Log)组件中。
[0004]当服务器故障时,通过网页显示SEL中存储的故障事件或者运维人员通过远程指令查看SEL存储的系统事件,分析出故障部件及故障原因,需要大量人供分析工作,如果基于SEL记录的数据输出故障部件及告警,可减低维护人员的人工投入,甚至实现维护自动化对故障进行快速响应处理、保障业务恢复是一项需要解决的技术问题。
[0005]现有解决方式是在SEL记录的每条事件信息的事件数据字段(evet data)记录自定义故障码,维护人员调取SEL数据字段的自定义故障码,通过私有解析工具解析自定义故障码对应的故障告警信息,但是该方法不能兼容IPMI标准需要,需要用户安装配套的私有分析工具,无法做到对各来源设备的兼容处理。

技术实现思路

[0006]本申请的目的在于提供一种故障报警方法,为需要告警的系统事件声场指示事件类型的事件码,用以通过带外管理设备查看事件码以获取需要告警的系统事件的事件类型。
[0007]为实现上述目的,本申请提供了一种系统事件告警方法,该系统事件告警方法包括,基于预设的告警事件规则列表确定待查看系统事件需要告警;基于待查看系统事件的事件类型确定告警类型;基于告警类型对应的重复事件识别规则识别待查看系统事件是否与先前的系统事件重复;当待查看系统事件与先前的系统事件不重复,基于待查看系统事件生成指示事件类型的事件码;存储事件码并分配关联的事件码标识;其中,事件码标识在当前基板管理控制器运行周期内具有唯一性;向带外管理设备发送事件码标识和事件码用以基于事件码标识查看事件码以获取待查看系统事件的事件类型。
[0008]为实现上述目的,本申请还提供了一种实现上述系统事件告警方法的设备,该设
备包括处理器理器、存储器、基板管理控制器、传感器、通信接口和总线。基板管理控制器通过运行存储器中的处理器可执行指令用以实现本申请的系统事件告警方法。
[0009]本申请的有益效果在于,基于系统事件生成故障码以指示系统事件的事件类型,使得运维人员可以根据事件码获取告警类型,降低了运维人员调用、查看、分析系统事件日志从而分析故障原因的运维工作量。本申请可以兼容IPMI标准无需私有设备解析工具解析自定义故障码。
附图说明
[0010]图1为本申请提供的系统事件告警方法的流程图;
[0011]图2为本申请提供的故障事件告警实施例的流程图;
[0012]图3为本申请提供的风扇系统事件告警实施例的流程图;
[0013]图4为本申请提供的触发类以及解除类系统事件告警实施例的流程图;
[0014]图5所示为本申请提供的系统事件告警设备实施例的示意图。
具体实施方式
[0015]将以多个附图所示的多个例子进行详细说明。在以下详细描述中,多个具体细节用于提供对本申请的全面理解。实例中没有详细地描述已知的方法、步骤、组件以及电路,以免使这些例子的难于理解。
[0016]使用的术语中,术语“包括”表示包括但不限于;术语“含有”表示包括但不限于;术语“以上”、“以内”以及“以下”包含本数;术语“大于”、“小于”表示不包含本数。术语“基于”表示至少基于其中一部分。
[0017]图1为本申请提供的一种系统事件告警方法,该系统事件告警方法包括如下步骤:
[0018]步骤101,基于预设的告警事件规则列表确定待查看系统事件需要告警;
[0019]步骤102,基于待查看系统事件的事件类型确定告警类型;
[0020]步骤103,基于告警类型对应的重复事件识别规则识别待查看系统事件是否与先前的系统事件重复;
[0021]步骤104,当待查看系统事件与先前的系统事件不重复,基于待查看系统事件生成指示事件类型的事件码;
[0022]步骤105,当待查看系统事件与先前的系统事件不重复,基于待查看系统事件生成指示事件类型的事件码;
[0023]其中,事件码标识在当前基板管理控制器运行周期内具有唯一性;
[0024]步骤106,向带外管理设备发送事件码标识和事件码;
[0025]用以基于事件码标识查看事件码以获取待查看系统事件的事件类型。
[0026]本申请中,对于不需要告警的待查看系统事件送往系统事件日志输出通道,比如Web页面来进行查看,以使得运维人员可根据事件码来获取对应的处理建议等信息以获取对应的维护处理建议。
[0027]图1所示实施例的有益效果在于,基于系统事件生成故障码以指示系统事件的事件类型,使得运维人员可以根据事件码获取告警类型,降低了运维人员调用、查看、分析系统事件日志从而分析故障原因的运维工作量。本申请可以兼容IPMI标准无需私有设备解析
工具解析自定义故障码。
[0028]图2为本申请提供的故障事件告警实施例的流程图;
[0029]IPMI标准规定,每个SEL包括2个字节的Record ID(记录标识),1个字节的记录类型(Record Type),4个字节的事件发生时间;2个字节的Gen ID;1个字节事件消息格式版本(EvMev,Event Message format version),1个字节的传感器类型,1个字节的传感器数值,1个字节事件特征描述类型(EvtDirType),1个字节的第一事件数据(EvtData1),1个字节的第二事件数据(EvtData2),1个字节的第三事件数据(EvtData3)。
[0030]本申请,服务器还通过BMC记录SEL的事件码,该事件码用于指示一类事件类型,带外管理设备(例如,Red Fish管理系统)外部可以利用事件码来查询事件类型,有利于运维人员从各维度信息(比如官网、手册)上获取到对应的帮助。
[0031]本申请中,事件本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种系统事件告警方法,其特征在于,所述方法包括:基于预设的告警事件规则列表确定待查看系统事件需要告警;基于所述待查看系统事件的事件类型确定需要告警的部件及告警类型;基于所述告警类型对应的重复事件识别规则识别所述待查看系统事件是否与所述需要告警的器件的先前的系统事件重复;当所述待查看系统事件与所述先前的系统事件不重复,基于所述待查看系统事件生成指示事件类型的事件码;存储所述事件码并分配关联的事件码标识;其中,所述事件码标识在当前基板管理控制器运行周期内具有唯一性;向带外管理设备发送所述事件码标识和所述事件码用以基于所述事件码标识查看所述事件码以获取所述待查看系统事件的事件类型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括,当所述待查看系统事件与所述先前的系统事件重复,将所述先前的系统事件关联的已分配事件码标识与所述待查看系统事件关联,以使得所述带外管理设备查看所述已分配事件码对应的事件码以获取所述先前的系统事件以及所述待查看系统事件的事件类型。3.根据权利要求2所述的方法,其特征在于,基于所述待查看系统事件的事件类型确定告警类型为故障告警;所述基于所述告警类型对应的重复事件识别规则识别所述待查看系统事件是否与先前的系统事件重复包括:当所述待查看系统事件的故障告警级别为正常告警,查找是否有相同且未消除的正常告警的先前系统事件;以及当所述待查看系统事件的故障告警级别是异常告警,查找是否有相同且未消除的异常告警的先前系统事件。4.根据权利要求2所述的方法,其特征在于,基于所述待查看系统事件的事件类型确定告警类型为风扇资源告警;所述基于所述告警类型对应的重复事件识别规则识别所述待查看系统事件是否与先前的系统事件重复包括:当所述待查看系统事件为风扇在位触发告警事件,查找是否有同一风扇的不在位触发告警事件;以及,当所述待查看系统事件为风扇不在位触发告警事件,查找是否有同一风扇的在位触发告警事件。5.根据权利要求1所述的方法,其特征在于,基于所述待查看系统事件的事件类型确定告警类型为触发类告警;所述基于所述告警类型对应的重复事件识别规则识别所述待查看系统事件是否与先前的系统事件重复包括:查找是否有未消除的相同器件的触发类告警事件。6.根据权利要求1所述的方法,其特征在于,基于所述待查看系统事件的...

【专利技术属性】
技术研发人员:林震华
申请(专利权)人:新华三信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1