一种可扩展的分布式健康管理方法技术

技术编号:34951986 阅读:49 留言:0更新日期:2022-09-17 12:29
本发明专利技术涉及一种可扩展的分布式健康管理方法,属于设备健康管理领域。本发明专利技术计算服务器运行故障预测算法得到故障模型;为每个计算服务器分配N个唯一的随机数,并通过一致性哈希算法计算随机数的哈希值,将哈希值分布于虚拟圆环上;待测设备采集关键零部件的监测数据,为待测设备设置待测设备编码,通过一致性哈希算法将待测设备编码映射到虚拟圆环上,根据哈希值的位置沿虚拟圆环逆时针查找,遇到的第一个计算服务器的哈希值就是所对应的计算服务器;待测设备将监测数据发送到对应的计算服务器上,计算服务器使用相应的故障模型进行故障诊断和预测。本发明专利技术能解决服务器数量低而导致分配不均匀的问题,实现多台计算服务器的负载均衡。负载均衡。负载均衡。

【技术实现步骤摘要】
一种可扩展的分布式健康管理方法


[0001]本专利技术属于设备健康管理领域,涉及一种可扩展的分布式健康管理方法,尤其涉及设备种类、设备数量、预测算法以及健康预测服务器均可扩展的分布式健康管理方法。

技术介绍

[0002]随着现代化作战、网络化作战的发展,越来越多的待测设备布局在我国国防建设和基础建设中,待测设备由于各种内因(如,自身磨损等因素)或者外因(如,高温高压、超大载荷、外部冲击等因素)的共同作用下,其性能以及健康状态会逐渐发生退化,甚至最终完全失效。系统运行中某关键部件突然失效,会给正在运行的系统带来巨大的时间和经济损失。因此,提前对待测设备健康状态进行预测,提前采取更换备件或者选用备选方案的避免失效减少的损失不可忽视。基于大数据的可扩展的待测设备健康管理方法可以对全部接入网络的待测设备的健康状态进行管理,根据每个电子产品提供的能够进行故障预测的信息进行故障预测,在上亿级数量的待测设备的情况下,将产生巨大经济效益。
[0003]目前对待测设备的健康管理都停留在单个设备或者某个自动化工厂中针对特定的业务流程中的某些指定待测设备进行健康管理,不能将全部待测设备进行管理,没有办法做到全部待测设备宏观掌控、统一规划、统筹全局。对待测设备关键零部件进行状态监测、预警并及时制定维护、维修策略,对待测设备健康状态的宏观掌控,对全部需要监控的待测设备进行整体健康管理将是今后国防建设以及基础建设的发展趋势。

技术实现思路

[0004](一)要解决的技术问题
[0005]本专利技术要解决的技术问题是如何提供一种可扩展的分布式健康管理方法,以解决目前对待测设备的健康管理都停留在单个设备或者某个自动化工厂中针对特定的业务流程中的某些指定待测设备进行健康管理,不能将全部待测设备进行管理,以及负载分配不均衡的问题。
[0006](二)技术方案
[0007]为了解决上述技术问题,本专利技术提出一种可扩展的分布式健康管理方法,该方法包括:
[0008]计算服务器运行故障预测算法,针对不同的待测设备,计算服务器选择合适的故障预测算法,调整相应种类待测设备的模型参数,通过对大量故障数据样本库进行训练后,得到故障模型;
[0009]为每个计算服务器分配N个唯一的随机数,并通过一致性哈希算法计算N个随机数的哈希值,将N个哈希值分布于虚拟圆环上;
[0010]待测设备采集关键零部件的监测数据,为待测设备设置待测设备编码,通过一致性哈希算法将待测设备编码映射到虚拟圆环上,根据哈希值的位置沿虚拟圆环逆时针查找,遇到的第一个计算服务器的哈希值就是所对应进行故障诊断和故障预测的计算服务
器;
[0011]待测设备将监测数据发送到对应的计算服务器上,计算服务器使用相应的故障模型进行故障诊断和预测;
[0012]其中,在扩展待测设备已有种类的数量时,直接将新待测设备的监测数据增加至计算服务器;在扩展新待测设备种类时,将新待测设备的故障预测算法扩展至计算服务器故障预测算法库,并训练生成新的故障模型;在待测设备数量增多,计算服务器算力不足的情况下,增加计算服务器数量,并将新增计算服务器的哈希值分布于虚拟圆环上。
[0013]进一步地,待测设备与计算服务器之间采用有线和无线的通信方式。
[0014]进一步地,有线通信包括:网络传输和IPMI协议,无线通信包括:2G/4G/5G网络和卫星通信。
[0015]进一步地,待测设备利用传感器、系统日志方式采集关键零部件的监测数据。
[0016]进一步地,待测设备包括电力系统设备、武器系统设备、航空系统设备、交通系统设备、卫星系统设备、通信系统设备、煤炭系统设备和日常生活设备。
[0017]进一步地,监测数据包括:关键部件的温度、电压、电流数据,BIOS电池电压,CPU、内存、磁盘、网络、进程状态信息,风机状态信息,操控状态信息,显示器状态信,系统日志记录中的状态信息,机械设备的振动信号和关键部件的光谱分析。
[0018]进一步地,故障预测算法以障预测方法为基准,故障预测的方法包括基于模型的故障预测技术、基于数据驱动的故障预测技术和基于概率统计的故障预测技术;其中,
[0019]基于模型的故障预测包括灰度模型以及卡尔曼滤波器和粒子滤波器等技术进行预测,通过对模型的修正和调整保证预测准确性;
[0020]基于数据驱动的故障预测根据人工智能计算方法,结合支持向量机(SVM)进行机器学习,不断通过采集到的数据进行学习;
[0021]基于概率统计的故障预测包括时间序列预测法和回归预测法,将具有一定变化规律的数据进行统计分析进行故障预测。
[0022]进一步地,一致性哈希算法采用128位哈希值,将整个哈希值空间映射成一个虚拟的圆环,整个哈希空间的取值范围为0

(2
128

1),整个空间按逆时针方向进行排序,0点和(2
128

1)点在零点中方向重合;对待测设备进行映射,将待测设备使用哈希算法算出对应的哈希值,会均匀的分布在虚拟圆环上,然后根据哈希值的位置沿虚拟圆环逆时针查找,遇到的第一个计算服务器的哈希值就是所对应进行故障诊断和故障预测的计算服务器。
[0023]进一步地,待测设备编码的规则为:设备厂家名+设备种类+设备唯一出厂编号。
[0024]进一步地,虚拟圆环映射的步骤如下:
[0025]S1、将哈希值映射形成哈希空间虚拟圆环,虚拟圆环的取值范围为0
‑2128

1;
[0026]S2、把待测设备编码处理成唯一的128位key,映射到虚拟圆环上;
[0027]key=hash(设备编码);
[0028]S3、给计算服务器分配1000个唯一的随机数,随机数使用随机数生成器在0
‑232
范围内生成,如果遇到与之前相同的数据,则抛弃,重新生成随机数,直到所有所有计算服务器分配的随机数全部不同为止;计算计算服务器的1000个随机数的哈希值,并分布于虚拟圆环上;
[0029]Key(M1 Pot1)=hash(计算服务器1随机数1);
[0030]Key(M1 Pot2)=hash(计算服务器1随机数2);
[0031]......
[0032]Key(M1 Pot1000)=hash(计算服务器1随机数1000);
[0033]S4、计算服务器负载过高,需要增加计算服务器2时,默认将给计算服务器2分配1000个唯一的随机数,如果计算服务器2的计算能力略弱,则按比例减少随机数数量,如果计算服务器2的计算能力超强,则按比例增加随机数数量;计算计算服务器2的随机数的哈希值,并分布于虚拟圆环上;
[0034]S5、如果出现计算服务器2故障的时候,需要移除计算服务器2,则将计算服务器2的哈希值从虚拟圆环上移除。
[0035](三)有益效果
[0036]本专利技术提出一种可扩展的分布式健康管理方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可扩展的分布式健康管理方法,其特征在于,该方法包括:计算服务器运行故障预测算法,针对不同的待测设备,计算服务器选择合适的故障预测算法,调整相应种类待测设备的模型参数,通过对大量故障数据样本库进行训练后,得到故障模型;为每个计算服务器分配N个唯一的随机数,并通过一致性哈希算法计算N个随机数的哈希值,将N个哈希值分布于虚拟圆环上;待测设备采集关键零部件的监测数据,为待测设备设置待测设备编码,通过一致性哈希算法将待测设备编码映射到虚拟圆环上,根据哈希值的位置沿虚拟圆环逆时针查找,遇到的第一个计算服务器的哈希值就是所对应进行故障诊断和故障预测的计算服务器;待测设备将监测数据发送到对应的计算服务器上,计算服务器使用相应的故障模型进行故障诊断和预测;其中,在扩展待测设备已有种类的数量时,直接将新待测设备的监测数据增加至计算服务器;在扩展新待测设备种类时,将新待测设备的故障预测算法扩展至计算服务器故障预测算法库,并训练生成新的故障模型;在待测设备数量增多,计算服务器算力不足的情况下,增加计算服务器数量,并将新增计算服务器的哈希值分布于虚拟圆环上。2.如权利要求1所述的可扩展的分布式健康管理方法,其特征在于,待测设备与计算服务器之间采用有线和无线的通信方式。3.如权利要求2所述的可扩展的分布式健康管理方法,其特征在于,有线通信包括:网络传输和IPMI协议,无线通信包括:2G/4G/5G网络和卫星通信。4.如权利要求1所述的可扩展的分布式健康管理方法,其特征在于,待测设备利用传感器、系统日志方式采集关键零部件的监测数据。5.如权利要求1所述的可扩展的分布式健康管理方法,其特征在于,待测设备包括电力系统设备、武器系统设备、航空系统设备、交通系统设备、卫星系统设备、通信系统设备、煤炭系统设备和日常生活设备。6.如权利要求1所述的可扩展的分布式健康管理方法,其特征在于,监测数据包括:关键部件的温度、电压、电流数据,BIOS电池电压,CPU、内存、磁盘、网络、进程状态信息,风机状态信息,操控状态信息,显示器状态信,系统日志记录中的状态信息,机械设备的振动信号和关键部件的光谱分析。7.如权利要求1所述的可扩展的分布式健康管理方法,其特征在于,故障预测算法以障预测方法为基准,故障预测的方法包括基于模型的故障预测技术、基于数据驱动的故障预测技术和基于概率统计的故障预测技术;其中,基于模型的故障预测包括灰度模型以及卡尔曼滤波器和粒子滤波器等技术进行预测,通过对模型的修正和调整保证预测准确性;基于数据驱动...

【专利技术属性】
技术研发人员:杜默毕胜刘宗宝庄博阳刘更
申请(专利权)人:北京计算机技术及应用研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1