System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于无参数局部离群因子的单向阀异常数据检测方法技术_技高网

一种基于无参数局部离群因子的单向阀异常数据检测方法技术

技术编号:40393974 阅读:29 留言:0更新日期:2024-02-20 22:23
本发明专利技术公开一种基于无参数局部离群因子的单向阀异常数据检测方法,首先,使用滑动窗口将整个数据划分为多个段,并从每个段中提取能反映数据差异性属性的多个特征;针对传统的LOF方法在运用过程中存在邻域参数选择难的问题,引入自然邻域的概念给予解决;最后,将大于阈值的NLOF段检测为不正确数据。本发明专利技术通过滑动窗分段提取特征的形式大大提高了检测的精度,通过选定窗长分割的数据一方面减少了整体检测的计算量,另一方面更符合机械系统中异常信号不是孤立存在的特点;通过自然邻域搜索算法实现了在无先验知识的情况下,可自主的、非外界交互的方式确定领域参数的大小,提升了检测的可靠度和自适应性。

【技术实现步骤摘要】

本专利技术涉及单向阀异常数据检测,尤其涉及一种基于无参数局部离群因子的单向阀异常数据检测方法


技术介绍

1、作为高扬程矿浆管道的核心动力设备,隔膜泵的健康状态对保障整个系统的安全可靠运行有着至关重要的作用。其中,由于受到较高工作频率和恶劣运行环境的影响,使得单向阀成为隔膜泵系统中最易损坏的关键部件,且它的故障还与矿浆流变特性、产品材质和复杂工况等多种因素相关,导致基于过程机理的模型难以实时有效地监测其健康状态。近年来,基于数据驱动的机械设备故障诊断技术在智能运维这一重大工程需求背景下取得了长足的进步,然而在实际工况环境下对单向阀进行状态监测时,低劣的数据质量;强噪声、多扰动的信号特性以及稀少的标注信息等都严重限制了诊断的效果。

2、受限于单向阀恶劣的工作条件,信号采集过程不可避免地收集到了大量受到污染的低劣数据,这大大限制了故障诊断方法的性能。因此,有必要对监测到的数据进行异常检测并清洗以提升后续检测和识别缺陷的诊断效果。从技术上讲,通过分析机械设备运行过程的数据特性,将机械数据中不满足数据准确性和完整性特征的数据点视为离群值,然后结合一种有效的离群值检测方法即可达到检测异常数据的目的。

3、目前,利用离群值检测提升数据质量的方法有很多,大致可以分为:基于分布的、基于距离的、基于聚类的和基于密度的方法等。与其他方法相比,离群值密度检测方法从不同数据的局部分布差异角度出发完成对离群值的检测。作为一种经典的基于密度的检测方法,局部离群因子(local outlier factor,lof)自提出以来就引起了学者的广泛关注并开发了许多变体算法。如通过使用不稳定因子的基于密度的检测方法(ins),基于核回归的lof(klof)方法等,但这些方法均存在一个不可回避的问题,即如何设置一个合适的邻域参数k值,由于离群值密度检测方法主要利用所选取的k个近邻的局部均值来判别不同类别的所属,因此合适的邻域参数可以大幅提高离群值检测的准确率,然而在事先通常难以确定一个合适的k值。


技术实现思路

1、本专利技术的目的在于:针对现有技术的不足,现提出一种将自然邻居的概念应用到邻域参数的自适应选择当中,提出了一种无需人为设置邻域参数的局部离群因子(nlof)方法,并将其用于检测单向阀状态监测过程中的异常数据。

2、本专利技术的技术方案如下:

3、本专利技术公开了一种基于无参数局部离群因子的单向阀异常数据检测方法,包括如下具体步骤:

4、step1:利用加速传感器分三阶段不同时间间隔采集高压隔膜泵单向阀在正常状态、磨损状态和击穿状态下的振动信号,得到高压隔膜泵单向阀各状态下的振动数据;

5、step2:使用固定的窗口长度将振动数据划分为90%重叠的连续多个段;

6、step3:分别提取每段数据的特征构成特征集;

7、step4:通过自然邻居搜索法确定特征集中的邻域参数值,并使用邻域参数值计算对应的nlof值;

8、step5:从初始窗口开始按照设定步长依次递增至数据长度的一半,当窗口长度大于等于数据长度的一半时,进入下一步;否则返回step1;

9、step6:求出所有窗口长度对应的nlof值,选取最大nlof值对应的窗长为最佳窗口长度;

10、step7:输出最佳窗口长度对应各数据段的nlof值,并将大于设定阈值的段确定为异常数据段。

11、以上方法,根据lof面临的邻域k值选择困难的问题,引入了自然邻居,通过自然邻居来实现对参数k地自适应选择,从而实现过程无参地特性。

12、进一步地,所述step1中三阶段不同时间间隔为400小时划分为一个阶段,各阶段的时间间隔分别为一小时、十分钟和两分钟。

13、进一步地,所述step2中采用从初始长度ωs开始到ωe之间按照固定步长δs选取最佳长度的滑动矩形窗口将整个数据划分为多个段,且相邻窗口保持90%的重叠,其中ωs和δs设置为500,ωe设置为总数居长度的一半。

14、进一步地,所述step3中特征包括12个特征,分别为均值、最大值、最小值、峭度、峰峰值、均方根值、偏斜度、裕度、方差、形状因子、脉冲因子和平方包络谱负熵,前11个特征为统计特征,平方包络谱负熵描述循环频率中的周期性隐藏调制。

15、进一步地,所述平方包络谱负熵的具体计算步骤为:

16、step3.1:计算各段信号的se信号,即:

17、sex(n)=|x(n)+j·hilbert[x(n)]|2

18、式中:sex(n)是长度为n的信号,j是虚数单位。

19、step3.2:各段信号的ses由下式可得:

20、sesx(α)=|dft[sex(n)]|2

21、其中dft表示离散傅里叶变换,α是循环频率。

22、step3.3:各段数据的平方包络谱负熵为:

23、

24、其中<·>表示取均值。

25、进一步地,所述step4中具体操作方法为:

26、step4.1:在自然邻居搜索过程中构造一棵k-d树;

27、step4.2:应用k-d树依次搜索每个数据对象的邻居数目,通过循环搜索后数据对象中逆邻居的数目连续两次保持一致,则终止循环;

28、step4.3:计算出自然邻居值即为领域参数值;

29、step4.4:将领域参数值带入局部离群因子计算方法中算出nlof值。

30、进一步地,所述step4.2中需要依次计算每个数据点的1-近邻、2-近邻、...、r-近邻(r∈n+),直到满足整个数据集中的所有的数据点都至少找到了一个邻居点或数据点将其视为邻居的邻居点个数连续两次不变终止。

31、进一步地,所述step7中,阈值定义为:

32、t=μ+3δ

33、其中,μ表示各数据段nlof值对应的均值,δ表示各数据段nlof值对应的标准差。

34、根据ωo计算的各个段的nlof值,nlof值越大越能反映该异常数据段与正常段的离群程度,为了更精准的划分异常数据段,引入阈值t并将大于t的数据段定义为异常数据段。

35、与现有的技术相比本专利技术的有益效果是:

36、1、本专利技术通过滑动窗分段提取特征的形式大大提高了检测的精度。所提方法通过数值比较能够确定合适的窗口长度,通过选定窗长分割的数据一方面减少了整体检测的计算量,另一方面更符合机械系统中异常信号不是孤立存在的特点。

37、2、本专利技术通过多种特征融合的方式提高了检测的普适性,通过考虑机械设备运行中信号的物理特性,提取多个能反映不同运行状态的特征,根据融合的特征集可以分别检测出机械监测过程中常见的异常数据和缺失数据。

38、3、本专利技术通过引入自然邻域搜索方法克服了传统lof的一个关键缺点。具体来说,通过自然邻域搜索算法实现了在无先验知识本文档来自技高网...

【技术保护点】

1.一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,包括如下具体步骤:

2.根据权利要求1所述的一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,所述Step1中三阶段不同时间间隔为400小时划分为一个阶段,各阶段的时间间隔分别为一小时、十分钟和两分钟。

3.根据权利要求1所述的一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,所述Step2中采用从初始长度ωs开始到ωe之间按照固定步长δs选取最佳长度的滑动矩形窗口将整个数据划分为多个段,且相邻窗口保持90%的重叠,其中ωs和δs设置为500,ωe设置为总数居长度的一半。

4.根据权利要求1所述的一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,所述Step3中特征包括12个特征,分别为均值、最大值、最小值、峭度、峰峰值、均方根值、偏斜度、裕度、方差、形状因子、脉冲因子和平方包络谱负熵,前11个特征为统计特征,平方包络谱负熵描述循环频率中的周期性隐藏调制。

5.根据权利要求4所述的一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,所述平方包络谱负熵的具体计算步骤为:

6.根据权利要求1所述的一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,所述Step4中具体操作方法为:

7.根据权利要求6所述的一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,所述Step4.2中需要依次计算每个数据点的1-近邻、2-近邻、...、r-近邻(r∈N+),直到满足整个数据集中的所有的数据点都至少找到了一个邻居点或数据点将其视为邻居的邻居点个数连续两次不变终止。

8.根据权利要求6所述的一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,所述Step7中,阈值定义为:

...

【技术特征摘要】

1.一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,包括如下具体步骤:

2.根据权利要求1所述的一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,所述step1中三阶段不同时间间隔为400小时划分为一个阶段,各阶段的时间间隔分别为一小时、十分钟和两分钟。

3.根据权利要求1所述的一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,所述step2中采用从初始长度ωs开始到ωe之间按照固定步长δs选取最佳长度的滑动矩形窗口将整个数据划分为多个段,且相邻窗口保持90%的重叠,其中ωs和δs设置为500,ωe设置为总数居长度的一半。

4.根据权利要求1所述的一种基于无参数局部离群因子的单向阀异常数据检测方法,其特征在于,所述step3中特征包括12个特征,分别为均值、最大值、最小值、峭度、峰峰值、均方根值、偏斜度、裕度、方差、形状...

【专利技术属性】
技术研发人员:李妍李娜高红娟张贤照起先忠陈能庆张涛张建刘云春
申请(专利权)人:云南大红山管道有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1