基于改进BSMOTE-Sequence算法的风电设备故障检测方法技术

技术编号:28464433 阅读:32 留言:0更新日期:2021-05-15 21:30
本发明专利技术公开了一种风电设备故障检测方法,本发明专利技术基于改进的BSMOTE

【技术实现步骤摘要】
基于改进BSMOTE

Sequence算法的风电设备故障检测方法


[0001]本专利技术涉及风电设备故障数据挖掘和检测领域,具体涉及一种基于改进的BSMOTE

Sequence算法的风电设备故障检测方法。

技术介绍

[0002]风力发电机作为一种从动的流体机械,其内部结构比较复杂,工作环境异常恶劣,通常安装于荒野、海滩等复杂的风口区域,常年处于极寒极热和极端温差的环境下,并且经常受到强阵风冲击,对部件的可靠性、寿命造成一定程度的削弱,因此加强风电机组故障的数据处理和检测,对于提高风电机组发电的可靠性、减少运维成本具有重大意义。
[0003]随着风机设备可靠性的不断提高,设备出现故障的概率逐渐变小,大部分时间都在正常运行,导致了风机运行数据集中很大比例都是正常运行的样本数据,而出现故障的样本数据比例非常小,从而使数据集不均衡。不均衡的数据集会对风机部件故障检测的效果产生负面的影响,分类结果往往都会偏向于大类样本,因此在建立分类模型之前,如何对风机数据集进行处理,消除由不平衡性带来的负面影响尤为重要。
[0004]现有的处理不平衡数据集的算法在考虑对哪些样本进行合成时,核心思路要么是随机选择少数类样本,要么是基于聚类、欧氏距离选择少数类样本。这两种选择思路,并不能完全适用于具有时序特点的风机数据,一方面是会破坏风机数据集的时序特点,丢失风机从正常状态转变为故障状态的信息;另一方面是未对类间重叠样本、噪声类样本进行过滤容易导致模型过拟合,从而降低分类精度。

技术实现思路

[0005]本专利技术提供了一种风电设备故障检测方法,本方法基于改进的BSMOTE

Sequence风机故障采样策略,主要目的是要解决具有时序特点的风机数据集类别不平衡的问题,减少对风机部件故障检测效果产生的负面影响。
[0006]所述采样策略是通过对BorderlineSMOTE进行改进而设计的一种新的风机数据集采样策略模型,具体来说,BorderlineSMOTE在选择对哪些样本点进行合成时,第一步通过KNN算法选出K

个少数类近邻样本,第二步从这K

个样本中随机选择K

个样本。本专利技术是将第二步随机选择样本改进为根据时序特征来选择样本,该方式生成新样本综合考虑了空间距离、时序规律,能有效减少噪声点的生成,不仅解决了风机数据集的不平衡问题,而且并未破坏数据集的时序规律。此外,本专利技术还结合Tomek Links技术,可以有效地过滤数据集中的噪声样本、类间重叠样本,从而提高后续分类器训练的效率及准确率,避免模型过拟合。
[0007]本专利技术中风机故障采样策略模型的构建包括以下步骤:
[0008](1)对少数类样本集P中的每个样本p
(i)
,按照公式计算它到其他所有样本d
(j)
的欧氏距离,选出距离最近的Top K个样本{d
(1)
,d
(2)
,...,d
(K)
};其
中M表示样本的特征数,表示p
(i)
样本的第m个特征,表示d
(j)
样本的第m个特征,dist(p
(i)
,d
(j)
)表示样本p
(i)
与d
(j)
之间的欧氏距离。
[0009](2)设{d
(1)
,d
(2)
,...,d
(K)
}中有Np
(i)
个多数类样本,按照公式和判断p
(i)
的类型Cp
(i)
;Cp
(i)
取0、1、

1时分别表示p
(i)
样本是安全类样本、边界类样本、潜在噪声类样本。
[0010](3)对于每个Cp
(i)
=1的p
(i)
样本,按照公式计算它到其他所有少数类样本p
(j)
的欧氏距离,选出空间距离最近的Top K

个样本{p
(1)
,p
(2)
,...,p
(K
'
)
}。
[0011](4)从{p
(1)
,p
(2)
,...,p
(K
'
)
}中按照公式t=|Tp
(i)

Tp
(j)
|,选出时间跨度最小的TopK

个样本{p
(1)
,p
(2)
,...,p
(K

)
};其中Tp
(i)
表示p
(i)
样本的时间特征,Tp
(j)
表示p
(j)
样本的时间特征,t表示p
(i)
与p
(j)
之间的时间跨度。
[0012](5)按照公式p
(i,j)
=p
(i)
+α*(p
(i)

p
(j)
),在p
(i)
样本与{p
(1)
,p
(2)
,...,p
(K

)
}各样本之间合成新样本点其中p
(i,j)
表示p
(i)
样本与p
(j)
样本合成的新样本,α表示(0,1)之间的一个随机数。
[0013](6)将第(5)步骤中合成的所有新样本点加入到少数类样本集P中。
[0014](7)按照公式对少数类样本集P中的每个样本p
(i)
,计算它到每个多数类样本n
(j)
的距离Distance(p
(i)
,n
(j)
)。
[0015](8)若不存在任意其他样本点d
(k)
使得公式Distance(p
(i)
,d
(k)
)<Distance(p
(i)
,n
(j)
)或者Distance(n
(j)
,d
(k)
)<Distance(p
(i)
,n
(j)
)成立,则称(p
(i)
,n
(j)
)是一个Tomeklinks对,从每个Tomeklinks对中删除多数类样本点。
[0016](9)按照公式和计算每个样本周围的样本类别比例,找出噪声类样本并删除。
附图说明
[0017]图1

1、1

2为本专利技术的整体流程图;
[0018]图2...

【技术保护点】

【技术特征摘要】
1.基于改进BSMOTE

Sequence算法的风电设备故障检测方法,包括风机故障采样策略模型,其特征在于构建所述风机故障采样策略模型包括以下步骤:(1)对少数类样本集P中的每个样本p
(i)
,按照公式计算它到其他所有样本d
(j)
的欧氏距离,选出距离最近的Top K个样本{d
(1)
,d
(2)
,...,d
(K)
};其中M表示样本的特征数,表示p
(i)
样本的第m个特征,表示d
(j)
样本的第m个特征,dist(p
(i)
,d
(j)
)表示样本p
(i)
与d
(j)
之间的欧氏距离;(2)设{d
(1)
,d
(2)
,...,d
(K)
}中有Np
(i)
个多数类样本,按照公式和判断p
(i)
的类型Cp
(i)
;Cp
(i)
取0、1、

1时分别表示p
(i)
样本是安全类样本、边界类样本、潜在噪声类样本;(3)对于每个Cp
(i)
=1的p
(i)
样本,按照公式计算它到其他所有少数类样本p
(j)
的欧氏距离,选出空间距离最近的Top K

个样本{p
(1)
,p
(2)
,...,p
(K')
};(4)从{p
(1)
,p
(2)
,...,p
(K')
}中按照公式t=|Tp
(i)

Tp
(j)
|,选出时间跨度最小的TopK

个样本{p
(1)
,p
(2)
,...,p

【专利技术属性】
技术研发人员:强保华杨鲜陈锐东谢元李龙戈
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1