本发明专利技术公开了一种异构的故障管理系统,系统故障管理模块是由两个异构的故障管理模块组成,两个故障管理模块分别采取被动接收和主动查询的方式运行,当任何一个故障管理模块启动时,系统就进入故障管理模式。本发明专利技术的故障管理模块一被动收集故障报警信息,而故障管理模块二主动确认任务的正常工作状态。这两种故障管理模块通过两个不同的渠道来监控任务执行,有效地保障了系统故障管理的执行。故障管理模块二对任务的监控可根据任务的特点采用多种方式,灵活性好。故障管理模块一反应迅速,而故障管理模块二判定故障更加严格。两种故障管理模块的组合使用可使系统能迅速对故障做出响应,并在任何一个故障管理模块出现问题时,也不会造成系统故障管理功能失效。
【技术实现步骤摘要】
异构的故障管理系统
本专利技术属于软件算法领域,用于执行轨道交通安全产品的故障管理功能。例如,轨道交通安全计算机平台,列车自动防护等。
技术介绍
在工业控制系统和安全信号系统中(应用于航空电子、铁路信号、核电等行业),在故障状态下采取措施尽量避免或者减少故障对人身和财产的损害,故障管理任务的正确执行对于保证系统的安全可靠有着极其重要的作用。当故障发生时,故障管理功能如果不能及时响应,系统发生安全事故的可能性就大为增加。因此,必须保证故障管理功能在各种情况下都能正常工作。现有的故障管理技术侧重点有所不同,下面列举3个现有的技术。1.IBM,USpatentNo.6,654,910,“Intelligentfaultmanagement”,阐述了用于汽车电子的智能故障管理方法,能保证系统的最短故障恢复时间和高可用性。控制系统是由多个逻辑控制单元组成,每个逻辑控制单元都有相应的故障监测方法。当检测到故障时,控制单元会降级系统性能,并通知其它控制单元。2.NEC,USpatent7,003,696,“Faultmanagementsystemforswitchingequipment”,描述了一个交换设备的故障管理系统。当一个交换设备的处理器或者电路出现可恢复的故障时,相关的故障终端能够被自动检测到。当一个时钟故障检测装置检测到时钟信号故障时,它会报告给中央故障管理系统。中央故障管理系统发出处理器和外围电路复位信号,并报告给外部显示终端。3.罗伯特.博世有限公司,CN200780036171.8,“用于故障处理的方法和装置”。描述了在具有多个组件的系统中进行故障管理的方法,其核心是能够借助于状态值来表明所述组件的故障状态,而且组件之间的状态值有一定的依赖关系。以上这3种方法也都是采取组合式的故障管理方法,但区别于本专利中的主动查询和被动响应(一正一反)相结合的运行方式,而且每个故障管理模块的具体处理方式也有较大差异。
技术实现思路
:本专利技术要解决的技术问题是提供一种异构的故障管理系统,其可以可靠的进行故障管理、预警。为了解决以上技术问题,本专利技术提供了一种异构的故障管理系统,系统故障管理模块是由两个异构的故障管理模块组成,两个故障管理模块分别采取被动接收和主动查询的方式运行,当任何一个故障管理模块启动时,系统就进入故障管理模式。本专利技术的有益效果在于:故障管理模块一被动收集故障报警信息,而故障管理模块二主动确认任务的正常工作状态。这两种故障管理模块通过两个不同的渠道来监控任务执行,有效地保障了系统故障管理的执行。故障管理模块二对任务的监控可根据任务的特点采用多种方式,灵活性好。故障管理模块一反应迅速,而故障管理模块二判定故障更加严格。两种故障管理模块的组合使用可使系统能迅速对故障做出响应,并在任何一个故障管理模块出现问题时,也不会造成系统故障管理功能失效。故障管理模块一采取被动接收的方式运行,实时监控任务发送来的故障报警信息。当未收到故障报警信息时,认为系统运行正常。如果收到故障报警信息,则立即启动故障反应机制。故障管理模块一采用实时监控并接收错误信息汇报的方式,运行起来后就一直处于监听的状态;所有软件任务中都有多个故障检查点,当有故障出现时,检测程序确定故障类型和等级,并触发故障报警信号量,把故障信息写入到指定的消息队列;故障管理模块一收到故障报警信号量后,立即启动并从故障消息队列中取出故障报警信息,根据故障类型和等级作出警告、离线运行或者停机等不同的处理。故障管理模块二采取主动查询的方式运行,周期运行任务监控,当所监控的任务每个周期都能主动地报告各自的工作状态,认为系统运行正常,如果有任何任务没有在特定的时间内汇报工作状态,故障管理模块二启动故障反应机制。故障管理模块二通过多个全局变量来检查被监控任务的正常工作状态;每个任务如果能够正常工作,它们可以正确操作相应的全局变量;故障管理模块二通过全局变量的检查来确定所监控任务的工作状态;如果所有任务都能正确处理全局变量,则故障管理模块二认为系统工作正常,不触发故障管理功能;如果此故障管理模块二发现任何监控的任务不能正确操作全局变量,就判断某个任务出现故障,并启动故障管理模块进行处理。附图说明:图1是系统故障管理功能的结构图。图2是故障管理模块一的工作流程图。图3是故障管理模块二的工作流程图。具体实施方式:本专利技术提供一种异构的故障管理系统,该算法能够应用于包括但并不局限于安全信号系统、工业控制系统等领域。具体过程如下:系统的故障管理功能依赖于两种异构的故障管理系统的协同工作。当任意一种故障管理方法检测到故障时,系统就进入故障管理模式。系统的故障管理功能架构参见图1。假定两种故障管理方法分别由故障管理模块一和故障管理模块二实现。如图2所示,故障管理模块一采用实时监控并接收错误信息汇报的方式,运行起来后就一直处于监听的状态。所有软件任务中都有多个故障检查点,当有故障出现时,检测程序确定故障类型和等级,并触发故障报警信号量,把故障信息写入到指定的消息队列。故障管理模块一收到故障报警信号量后,立即启动并从故障消息队列中取出故障报警信息,根据故障类型和等级作出警告、离线运行或者停机等不同的处理。如图3所示,故障管理模块二通过多个全局变量来检查被监控任务的正常工作状态。每个任务如果能够正常工作,它们可以正确操作相应的全局变量。故障管理模块二通过全局变量的检查来确定所监控任务的工作状态。如果所有任务都能正确处理全局变量,则故障管理模块二认为系统工作正常,不触发故障管理功能。如果此故障管理模块二发现任何监控的任务不能正确操作全局变量,就判断某个任务出现故障,并启动故障管理模块进行处理。当两种故障管理方法中的任何一个检测到故障并进入故障处理,整个系统就进入故障模式,并迫使系统进入安全状态。故障管理模块一的工作过程:1)首先要确定故障管理模块一所监控的任务,并尽可能详尽地考虑到每个任务会出现的各种故障,并对每个任务的故障进行编号并分类。当检测程序检测到故障发生时,将故障信号量设置为“True”,并将故障编号、故障等级和处理方式等信息打包写入故障消息队列中。为了保证能准确地将严重故障信息报送出来,故障消息在写入队列的时候可以添加校验信息,例如CRC值。并且故障消息的内容之间也会有特定的逻辑关系,例如相应的故障等级会有特定的故障处理方式。如果故障处理中发现故障信息的信息校验不正确或者逻辑不符,直接使设备进入离线状态或者由操作人员决定后续的处理。2)故障管理模块一必须对所监控任务的故障信息代码划分故障等级,每种故障等级的处理措施也不相同。当故障管理模块一收到故障信息后,可以根据故障信息的代码判断出故障的发生地,故障等级和故障状况。由于故障等级已经预先设定,故障管理模块一可以根据故障信息的代码决定后续的措施。我们目前设计的故障处理通常可以分为报警、离线运行和停机三种状态。3)故障管理模块一运行后就一直处于监听状态。当检测到故障信号量置位后,会立刻从故障消息队列中获取故障信息,并启动故障处理,使系统进入故障管理模式。故障管理模块二的工作过程:1)首先要确定故障管理模块二所监控的任务。这里所监控的任务可以与故障管理模块一有所不同,并制定每个任务正常工作时必须与本文档来自技高网...
【技术保护点】
一种异构的故障管理系统,其特征在于,系统故障管理模块是由两个异构的故障管理模块组成,两个故障管理模块分别采取被动接收和主动查询的方式运行,当任何一个故障管理模块启动时,系统就进入故障管理模式。
【技术特征摘要】
1.一种异构的故障管理系统,其特征在于,系统故障管理模块是由两个异构的故障管理模块组成,用于在工业控制系统或安全信号系统中实现故障管理,两个故障管理模块分别采取被动接收和主动查询的方式运行,两个异构的故障管理模块协同工作,当任何一个故障管理模块启动时,系统就进入故障管理模式。2.如权利要求1所述的异构的故障管理系统,其特征在于,故障管理模块一采取被动接收的方式运行,实时监控任务发送来的故障报警信息;当未收到故障报警信息时,认为系统运行正常;如果收到故障报警信息,则立即启动故障反应机制。3.如权利要求2所述的异构的故障管理系统,其特征在于,故障管理模块一采用实时监控并接收错误信息汇报的方式,运行起来后就一直处于监听的状态;所有软件任务中都有多个故障检查点,当有故障出现时,检测程序确定故障类型和等级,并触发故障报警信号量,把故障信息写入到指定的消息队列;故障管理模块一收到故障报警信号量后...
【专利技术属性】
技术研发人员:姚军,赵磊,袁跃峰,张小林,左德参,
申请(专利权)人:上海富欣智能交通控制有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。