本发明专利技术公开了一种基于熵权法的风机特征优选方法,涉及风机故障诊断技术领域,该方法包括:提取风机样本的特征属性值,组成特征矩阵Y;获得特征属性对应的正负样本属性值;归一化,获得特征矩阵Y的归一化矩阵Y
【技术实现步骤摘要】
一种基于熵权法的风机特征优选方法
[0001]本专利技术涉及风机故障诊断
,具体而言,涉及一种基于熵权法的风机特征优选方法,核心思想是利用熵权法确定风机特征子集的搜索策略,通过评价每个特征子集经过机器学习的结果确定最优特征子集,从而实现风机特征的优选。
技术介绍
[0002]目前风机作为风力发电的重要设备,其正常工作与否直接与人们的日常生活紧密相关,风机上很多大型旋转设备的故障的及时识别,对保证风机的正常运转起着至关重要的作用,风机一旦发生故障,如果不能及时进行维修,就会造成停机的影响,从而会影响发电量,不仅造成经济效益的损失,还会影响人们的正常生活,因此,对风机上的各个旋转设备的故障诊断非常重要。随着人工智能算法在各个行业的渗透,风电行业也渐渐通过它来解决生产过程中风机出现的一些问题,针对其中的风机故障诊断问题,需要先采集风机待诊断部件的声音信号或振动信号,然后采用相关的信号处理算法提取信号中的样本特征,最后按照实际情况选择合适的学习器建立故障诊断的识别模型,其中样本特征的区分度以及变异度将直接影响模型分类的正确率,所以需要对提取的特征进行特征选择,确定最优的特征子集。离散度越大、变异度越高的特征维更有利于样本的分类,而离散度小的特征维属于冗余特征,不利于样本的区分,这对如何更加精准的提取特征值是个考验。
[0003]专利CN 109840563 A公开了“一种基于三维隶属函数模糊逻辑系统的风机故障诊断方法”,首先采集实际风机数据集并计算预测风机数据集与差值风机数据集,得到模糊逻辑系统的输入数据;然后采集实际风机训练数据集并计算预测风机训练数据集与差值风机训练数据集,选择训练数据集与基准变量后,建立模糊逻辑系统的三维隶属函数;再建立模糊逻辑系统的规则库与模糊器,将输入数据模糊化为输入集,根据规则前件集计算点火等级,根据规则后件集计算输出集;最后采用取重心法获取清晰输出,并根据清晰输出与阈值的关系判断故障是否发生。此方法存在以下不足之处在于缺乏系统的方法,只有遇到相对简单问题时才是可行的,适用于不需要高精度的问题。
技术实现思路
[0004]本专利技术旨在公开一种基于熵权法的风机特征优选方法,解决从风机待诊断部件各类信号中提取特征时,样本特征的区分度和变异度存在受损,影响模型分类的正确率的问题。利用熵权法辨识出各特征维的权重,制定特征子集的搜索策略,并采用特征工程中“包裹式”方法对所有的特征子集进行评价,并根据评价结果确定最优的特征子集,从而实现风机特征优选。
[0005]本专利技术提供的技术方案为:
[0006]步骤1.根据一特征属性集提取一组风机样本中各风机样本的特征属性值,从一风机样本中所提取的特征属性值组成该风机样本的特征维,全部风机样本的特征维组成该组风机样本的特征矩阵Y;
[0007]步骤2.遍历所述特征矩阵Y中各风机样本对应特征维,根据一计算方法,获得各特征维中各个特征属性值对应的正样本属性和负样本属性;
[0008]步骤3.根据所述特征矩阵Y中各个特征属性值的正负样本属性值对其进行归一化,以获得所述特征矩阵Y的归一化矩阵Y
′
;
[0009]步骤4.根据所述归一化矩阵Y
′
,使用熵权法计算所述特征属性集中各个特征属性在该组风机样本的权重B,根据所述特征属性的权重B计算所述特征矩阵Y中各个特征维的权重C;
[0010]步骤5.计算所述各个风机样本特征属性在该组风机样本中的占比值D
′
,并对所述占比值排序,组成占比值集合D,其中所述占比值集合D中最大的占比值D
′
对应的特征属性集即为最优的特征子集A。
[0011]所述采用特征工程中“包裹式”方法,即常见的特征选择方法之一,包装法特征选择方法直接把最终将要使用的学习器的性能作为特征子集的评价准则,因此从模型性能的角度出发,能够发现包装式特征选择的性能要优于过滤式特征选择,但是包装式特征选择的时间开销较大。而过滤式特征选择由于和特定的学习器无关,所以计算开销小,泛化能力强于包装式特征选择。
[0012]进一步的,所述步骤1中特征属性集的获得方法包括小波变换法、EMD分解法、梅尔倒谱系数法和时域波形属性特法。
[0013]所述信号处理,为了利用信号就要对它进行处理。例如,电信号弱小时,需要对它进行放大;混有噪声时,需要对它进行滤波I当频率不适应于传输时,需要进行调制以及解调;信号遇到失真畸变时,需要对它均衡;当信号类型很多时,需要进行识别等等。与信号有关的理化或数学过程有:信号的发生、信号处理信号的传送、信号的接收、信号的分析(即了解某种信号的特征)、信号的处理(即把某一个信号变为与其相关的另一个信号,例如滤除噪声或干扰,把信号变换成容易分析与识别的形式)、信号的存储、信号的检测与控制等,也可以把这些与信号有关的过程统称为信号处理。在事件变化过程中抽取特征信号,经去干扰、分析、综合、变换和运算等处理,从而得到反映事件变化本质或处理者感兴趣的的信息的过程,其中分模拟信号处理和数字信号处理。削弱信号中的多余内容、滤出混杂的噪声和干扰或者将信号变换成容易处理、传输、分析与识别的形式,以便后续的其它处理。所述数字信号处理涉及三个步骤:(一)模数转换(A/D转换):把模拟信号变成数字信号,是一个对自变量和幅值同时进行离散化的过程,基本的理论保证是采样定理。(二)数字信号处理(DSP):包括变换域分析(如频域变换)、数字滤波、识别、合成等。(三)数模转换(D/A转换):把经过处理的数字信号还原为模拟信号。
[0014]所述特征矩阵Y大小为n
×
k,n为风机各风机样本个数,K为风机样本的特征属性个数,该矩阵包含着设备运行状态的特征信息。
[0015]所述所述特征数据矩阵,假设给定了K个各风机样本特征属性,X1,X2,X3
……
XK,每个各风机样本特征属性由n个组成,,即X
i
={X
i1
,X
i2
,X
i3
,......X
in
}。假设对各样本属性数据标准化后的值为Y
i
={Y1,Y2,Y3,......Y
n
},那么特征数据矩此
公式为所述正样本属性专用,或此公式为所述负样本属性专用,其中i={1,2,3,......k},j={1,2,3,......n},min(X
i
)为第i个样本属性中最小值,max(X
i
)为第i个样本属性中最大值,X
ij
为第i个样本属性组中的第j个样本属性,即根据原始评分表,对数据进行标准化后可以得到数据标准化表。
[0016]进一步的,步骤2特征属性的正负样本属性值的计算方法包括用于处理直观数据的方法一和用于处理抽象数据的方法二。
[0017]所述方法一为直观数据判断法,由所述风机样本特征维的数值为输入条件,判断所述风机样本特征矩阵Y特征属性值的大小;如果所述风本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于熵权法的风机特征优选方法,其特征在于,包括:步骤1.根据一特征属性集提取一组风机样本中各风机样本的特征属性值,从一风机样本中所提取的特征属性值组成该风机样本的特征维,全部风机样本的特征维组成该组风机样本的特征矩阵Y;步骤2.遍历所述特征矩阵Y中各风机样本对应特征维,根据一计算方法,获得各特征维中各个特征属性值对应的正样本属性和负样本属性;步骤3.根据所述特征矩阵Y中各个特征属性值的正负样本属性值对其进行归一化,以获得所述特征矩阵Y的归一化矩阵Y
′
;步骤4.根据所述归一化矩阵Y
′
,使用熵权法计算所述特征属性集中各个特征属性在该组风机样本的权重B,根据所述特征属性的权重B计算所述特征矩阵Y中各个特征维的权重C;步骤5.计算所述各个风机样本特征属性在该组风机样本中的占比值D
′
,并对所述占比值排序,组成占比值集合D,其中所述占比值集合D中最大的占比值D
′
对应的特征属性集即为最优的特征子集A。2.根据权利要求1所述的一种基于熵权法的风机特征优选方法,其特征在于:所述步骤1中特征属性集的获得方法包括小波变换法、EMD分解法、梅尔倒谱系数法和时域波形属性法。3.根据权利要求1所述的一种基于熵权法的风机特征优选方法,其特征在于:步骤2特征属性的正负样本属性值的计算方法包括用于处理直观数据的方法一和用于处理抽象数据的方法二。4.根据权利要求3所述的一种基于熵权法的风机特征优选方法,其特征在于:所述方法一包括步骤:通过所述风机样本特征维的数值判断所述风机样本特征矩阵Y特征属性值的大小;如果所述风机样本特征矩阵Y特征属性值的大小正比于所述风机样本特征维的数值,则此特征属性值对应的特征属性为正样本属性,反之为负样本属性。5.根据权利要求3所述的一种基于熵权法的风机特征优选方法,其特征在于:所述方法二包括步骤:将所述风机特征样本进行聚类处理,从不同的团簇中任取Q个特征样本在同一坐标系上画出所述从不同的团簇任取Q个特征样本的折线图,其中从所述...
【专利技术属性】
技术研发人员:王宇星,谭建鑫,秦晓亮,井延伟,胡占飞,韩贵东,
申请(专利权)人:河北建投新能源有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。