基于细粒度任务拆解的列车故障自动识别集群系统及方法技术方案

技术编号:37234010 阅读:20 留言:0更新日期:2023-04-20 23:16
基于细粒度任务拆解的列车故障自动识别集群系统及方法,属于检测技术领域。为了解决现有的单机式列车故障自动识别存在检测时间长、硬件要求高的问题,本发明专利技术的系统采用多台识别服务器集群化部署,每台识别服务器上都部署识别服务单元,只有特定的几台识别服务器上部署任务分发服务单元和结果收集服务单元;任务分发服务单元对待检测任务进行拆解并进行任务投放,投放任务时指明要识别故障类型,识别服务器接收到识别任务后,根据需要识别的故障类型,识别服务单元选用相应识别模块识别列车图片,完成后,识别服务单元将识别结果发送到结果回收服务单元。到结果回收服务单元。到结果回收服务单元。

【技术实现步骤摘要】
基于细粒度任务拆解的列车故障自动识别集群系统及方法


[0001]本分明属于检测
,具体涉及列车故障自动识别方法与集群系统及方法。

技术介绍

[0002]列车故障检测系统是通过在列轨道边安装线阵相机,将列车通过时的多个部位的照片采集到服务器,使用先进的深度学习算法对原始图片进行检测识别,从而将可能的故障识别到并标识出来,避免列车事故发生。
[0003]进行列车检测时,由于列车会有多种型号,要求用于故障检测的深度学习模型需要支持多种不同车型,并能够检测多种不同故障,因此对软硬件资源要求较高,而且由于列车基本都是高速通过检查点,因此需要快速完成过车检测,这对检测时间也有较高要求。
[0004]针对使用深度学习进行故障识别的列车智能检测系统,检测对系统软硬件资源要求非常高,当列车通过检测站时,会产生1G以上的待识别图片,根据实际业务要求,必须在若干分钟内完成列车的故障识别,所以目前进行列车检测时需要配置非常高的软硬件设备,导致费用非常高;实际上也还是不能很好的满足检测要求。尤其是针对于细粒度检测时,对于软硬件的要求更高。
[0005]因此可以考虑通过将所有故障识别模块分布式部署在多台服务器上来完成检测任务,这种并行识别可以提升整体识别速度,而且还能实现多检测站同时进行多列车的故障检测。但是此种情况下需要所有分布式节点做多副本集群部署。集群内任何节点的软硬件故障都会对列车故障识别结论造成影响,导致识别耗时更长,或者无法完成全部车辆的故障识别,为了能够在规定的时长限制内完成列车检测,在出现任何错误后,需要立刻重试任务,而且需要控制重试任务的粒度大小,在出错场景下能够立刻重试,并能在要求的时限内完成失败重试,保障列车通过后的若干分钟内,完成列车的故障识别检测。但是目前的铁路列车检测系统的部署不能很好的监督。

技术实现思路

[0006]本专利技术为了解决现有的单机式列车故障自动识别存在检测时间长、硬件要求高的问题,以及现有的分布式列车故障自动识别存在识别任务处理模式不能有效调整资源占用而导致的处理效率低的问题。
[0007]基于细粒度任务拆解的列车故障自动识别集群系统,系统采用多台识别服务器集群化部署,每台识别服务器上都部署识别服务单元,只有特定的几台识别服务器上部署任务分发服务单元和结果收集服务单元;每个识别服务器的识别服务单元包含多个识别模块,每个识别模块对应识别一种故障类型;
[0008]任务分发服务单元对待检测任务进行拆解并进行任务投放,投放任务时指明要识别故障类型,识别服务器接收到识别任务后,根据需要识别的故障类型,识别服务单元选用相应识别模块识别列车图片,完成后,识别服务单元将识别结果发送到结果回收服务单元;
[0009]任务分发服务单元进行任务投放的过程包括对资源池划分的过程和路由到特定
识别服务器上的过程;其中,
[0010]资源池划分的过程如下:
[0011]将具有相同识别模块的识别服务器在逻辑上划分为一个资源池,一个资源池包含n个识别服务器,即同时执行n个任务;容纳全量识别模块需K个识别服务器,则整个集群将被划分为K个资源池;
[0012]路由到特定识别服务器上的过程的过程如下:
[0013]首先通过位图映射算法寻找特定的资源池,然后在资源池内寻找到特定的识别服务器执行识别任务;
[0014]结果回收服务单元回收到所有任务的识别结果后,合并识别结果,最终整列车的所有故障检测任务全部完成后,在本地合并最终检测结果;如果列车识别过程中,出现部分任务识别失败,或者当整列列车的待检测任务识别时长达到时间阈值时还未返回结果,回收服务单元自动通知任务分发服务单元需要重投没有返回识别结果的细粒度任务,所有重投任务会被集群系统重新处理一遍。
[0015]进一步地,任务分发服务单元对待检测任务进行拆解时是根据列车的车节数量和故障识别模块的数量将待检测任务进行拆解。
[0016]进一步地,图映射算法中的位图构建过程如下:
[0017]将识别模块进行位图编码,设有T种识别模块,将这T种识别模块进行顺序排列,排列成一个I*J的矩阵,即位图,I为单台识别服务器容纳的识别模块数量,J为容纳全量识别模块需要的识别服务器数量,每个识别模块都对应一个矩阵的坐标(x,y)点;
[0018]根据物理的部署,一个资源池内的识别服务器部署相同的识别模块,位图中的坐标点与资源池为多对一的关系,将坐标点的值设置为资源池的ID值。
[0019]进一步地,位图的结构通过Map数据结构实现。
[0020]进一步地,在资源池内寻找到特定的识别服务器的过程包括以下步骤:
[0021]步骤2.1、资源池内计算识别服务器值:
[0022]识别服务器值=识别服务器物理地址(网卡物理地址)%识别服务器查找基数;
[0023]资源池内有N台识别服务器,计算资源池内N识别服务器值,并且将这些值存储在识别服务器值列表中,并且按照升序排列;
[0024]步骤2.2、计算任务值:
[0025]任务值=识别服务器选择ID%识别服务器查找基数;
[0026]步骤2.3、按照选择规则进行选择:
[0027]假设执行某个任务,则根据步骤2.2计算出的任务值在识别服务器值列表升序遍历,查找到第一个大于等于任务值的识别服务器值,则将该识别服务器值对应的识别服务器用于执行任务。
[0028]进一步地,计算识别服务器值的识别服务器物理地址采用网卡物理地址。
[0029]进一步地,识别服务器查找基数=65535。
[0030]进一步地,任务分发服务单元进行任务投放时,监控识别服务器的状态;当某个识别服务器繁忙时,通过识别服务器值列表查询到对应识别服务器值,在任务分发服务单元中将能选择到对应识别服务器的任务的识别服务器选择ID进行加权,使计算出的任务值与该识别服务器值不相邻。
[0031]进一步地,监控识别服务器的状态的过程中,当服务器空闲时,采用与识别服务器繁忙时处理过程的反向处理过程。
[0032]基于细粒度任务拆解与失败重试的列车故障自动识别方法,包括以下步骤:
[0033]S1、基于所述的基于细粒度任务拆解的列车故障自动识别集群系统,首先根据列车节数进行分组,设置10辆车为一个识别组;
[0034]S2、创建识别任务,将每一个识别组和一个故障类型组成一个识别任务;
[0035]S3、遍历识别任务列表,根据基于细粒度任务拆解的列车故障自动识别集群系统的集群内识别模块的部署情况,投递每一个识别任务到识别服务节点;
[0036]S4、等待接收返回识别结论;
[0037]S5、如果识别结果全部返回,合并识别结论,结束本次检测任务;
[0038]S6、到达识别最大时长限制一半时,遍历识别任务列表,如果仍有识别结果没有正确返回,将未完成任务重新投递到任务队列;如果所有识别任务都完成,合并识别结论,结束本次任务;
[0039]S7、到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于细粒度任务拆解的列车故障自动识别集群系统,其特征在于,所述系统采用多台识别服务器集群化部署,每台识别服务器上都部署识别服务单元,只有特定的几台识别服务器上部署任务分发服务单元和结果收集服务单元;每个识别服务器的识别服务单元包含多个识别模块,每个识别模块对应识别一种故障类型;任务分发服务单元对待检测任务进行拆解并进行任务投放,投放任务时指明要识别故障类型,识别服务器接收到识别任务后,根据需要识别的故障类型,识别服务单元选用相应识别模块识别列车图片,完成后,识别服务单元将识别结果发送到结果回收服务单元;任务分发服务单元进行任务投放的过程包括对资源池划分的过程和路由到特定识别服务器上的过程;其中,资源池划分的过程如下:将具有相同识别模块的识别服务器在逻辑上划分为一个资源池,一个资源池包含n个识别服务器,即同时执行n个任务;容纳全量识别模块需K个识别服务器,则整个集群将被划分为K个资源池;路由到特定识别服务器上的过程的过程如下:首先通过位图映射算法寻找特定的资源池,然后在资源池内寻找到特定的识别服务器执行识别任务;结果回收服务单元回收到所有任务的识别结果后,合并识别结果,最终整列车的所有故障检测任务全部完成后,在本地合并最终检测结果;如果列车识别过程中,出现部分任务识别失败,或者当整列列车的待检测任务识别时长达到时间阈值时还未返回结果,回收服务单元自动通知任务分发服务单元需要重投没有返回识别结果的细粒度任务,所有重投任务会被集群系统重新处理一遍。2.根据权利要求1所述的基于细粒度任务拆解的列车故障自动识别集群系统,其特征在于,任务分发服务单元对待检测任务进行拆解时是根据列车的车节数量和故障识别模块的数量将待检测任务进行拆解。3.根据权利要求1或2所述的基于细粒度任务拆解的列车故障自动识别集群系统,其特征在于,图映射算法中的位图构建过程如下:将识别模块进行位图编码,设有T种识别模块,将这T种识别模块进行顺序排列,排列成一个I*J的矩阵,即位图,I为单台识别服务器容纳的识别模块数量,J为容纳全量识别模块需要的识别服务器数量,每个识别模块都对应一个矩阵的坐标(x,y)点;根据物理的部署,一个资源池内的识别服务器部署相同的识别模块,位图中的坐标点与资源池为多对一的关系,将坐标点的值设置为资源池的ID值。4.根据权利要求3所述的基于细粒度任务拆解的列车故障自动识别集群系统,其特征在于,位图的结构通过Map数据结构实现。5.根据权利要求4所述的基于细粒度任务拆解的列车故障自动识别集群系统,其...

【专利技术属性】
技术研发人员:朱润光苏培旺贾凡杨宝雨
申请(专利权)人:哈尔滨市科佳通用机电股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1