【技术实现步骤摘要】
基于改进BSMOTE
‑
Sequence算法的风电设备故障检测方法
[0001]本专利技术涉及风电设备故障数据挖掘和检测领域,具体涉及一种基于改进的BSMOTE
‑
Sequence算法的风电设备故障检测方法。
技术介绍
[0002]风力发电机作为一种从动的流体机械,其内部结构比较复杂,工作环境异常恶劣,通常安装于荒野、海滩等复杂的风口区域,常年处于极寒极热和极端温差的环境下,并且经常受到强阵风冲击,对部件的可靠性、寿命造成一定程度的削弱,因此加强风电机组故障的数据处理和检测,对于提高风电机组发电的可靠性、减少运维成本具有重大意义。
[0003]随着风机设备可靠性的不断提高,设备出现故障的概率逐渐变小,大部分时间都在正常运行,导致了风机运行数据集中很大比例都是正常运行的样本数据,而出现故障的样本数据比例非常小,从而使数据集不均衡。不均衡的数据集会对风机部件故障检测的效果产生负面的影响,分类结果往往都会偏向于大类样本,因此在建立分类模型之前,如何对风机数据集进行处理,消除由不平衡性带来的负面影响尤为重要。
[0004]现有的处理不平衡数据集的算法在考虑对哪些样本进行合成时,核心思路要么是随机选择少数类样本,要么是基于聚类、欧氏距离选择少数类样本。这两种选择思路,并不能完全适用于具有时序特点的风机数据,一方面是会破坏风机数据集的时序特点,丢失风机从正常状态转变为故障状态的信息;另一方面是未对类间重叠样本、噪声类样本进行过滤容易导致模型过拟合,从而降低分类精度。
专
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.基于改进BSMOTE
‑
Sequence算法的风电设备故障检测方法,包括风机故障采样策略模型,其特征在于构建所述风机故障采样策略模型包括以下步骤:(1)对少数类样本集P中的每个样本p
(i)
,按照公式计算它到其他所有样本d
(j)
的欧氏距离,选出距离最近的Top K个样本{d
(1)
,d
(2)
,...,d
(K)
};其中M表示样本的特征数,表示p
(i)
样本的第m个特征,表示d
(j)
样本的第m个特征,dist(p
(i)
,d
(j)
)表示样本p
(i)
与d
(j)
之间的欧氏距离;(2)设{d
(1)
,d
(2)
,...,d
(K)
}中有Np
(i)
个多数类样本,按照公式和判断p
(i)
的类型Cp
(i)
;Cp
(i)
取0、1、
‑
1时分别表示p
(i)
样本是安全类样本、边界类样本、潜在噪声类样本;(3)对于每个Cp
(i)
=1的p
(i)
样本,按照公式计算它到其他所有少数类样本p
(j)
的欧氏距离,选出空间距离最近的Top K
′
个样本{p
(1)
,p
(2)
,...,p
(K')
};(4)从{p
(1)
,p
(2)
,...,p
(K')
}中按照公式t=|Tp
(i)
‑
Tp
(j)
|,选出时间跨度最小的TopK
″
个样本{p
(1)
,p
(2)
,...,p
技术研发人员:强保华,杨鲜,陈锐东,谢元,李龙戈,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。