一种基于多尺度空洞注意力机制的ConvNeXt迁移学习齿轮故障诊断方法技术

技术编号：42230679 阅读：30 留言：0更新日期：2024-08-02 13:46

一种基于多尺度空洞注意力机制的ConvNeXt迁移学习齿轮故障诊断方法，涉及旋转机械故障诊断领域。本发明专利技术包括：获得待诊断的跨域齿轮原始振动信号，将其输入到齿轮故障诊断网络中获得齿轮故障严重性诊断结果；齿轮故障诊断网络通过以下方式获得：获取不同工况下的原始振动信号，并将原始振动信号分为源域训练集、源域验证集、目标域测试集；构建基于多尺度空洞注意力机制的ConvNeXt迁移学习网络：由扩张卷积ConvNeXt模块、多尺度空洞注意力模块、Softmax分类器、CKMMD模块等组成；利用训练集、验证集、测试集分别训练、验证、测试所构建的网络，获得齿轮故障诊断网络。本发明专利技术用于齿轮跨域故障诊断。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及旋转机械关键部件故障诊断领域，尤其是涉及一种基于多尺度空洞注意力机制的convnext迁移学习齿轮故障诊断方法。

技术介绍

1、在现代工业生产中，航空发动机和矿山机械等旋转机械设备扮演了重要的角色，人们的目光也渐渐聚焦到了齿轮等旋转机械关键部件的可靠性和安全性上。由于齿轮等旋转机械关键部件常常在复杂的工作环境中高速运转，它们经常面临各种潜在的故障风险。因此，有必要对齿轮等旋转机械关键部件故障诊断方法展开研究。

2、随着计算能力的提升，基于深度学习的故障诊断方法逐步成为齿轮等旋转机械关键部件故障诊断领域的解决方案之一。卷积神经网络因其卓越的特征提取能力，在一维信号分析领域成为了不可或缺的研究工具。近年来，开发了convnext模型，同时保持了简单和高效。然而，convnext在其本身的设计中，可能会忽视不同空间尺度信息之间的关联性。

3、在深度学习中，注意力机制也扮演着关键角色，类似于人类的注意力，它有助于模型有选择性地聚焦于数据中最重要的部分，并同时忽略次要信息。传统的卷积神经网络一直使用固定的权重来处理数据，无法自动适应和强调数据中的不同特征，这可能导致网络过分强调某些特征，而对其他重要特征视而不见。

4、深度学习技术通过自动提取深层特征，实现了故障诊断的便捷和准确性，但通常需要大量标记样本，且要求这些样本与测试样本来自相同分布。因此，如何获取不同空间尺度全局特征信息、如何进一步丰富提取的特征信息、如何减少源域与目标域之间的域偏差是需要解决的问题。

技术实现思路

1、本专利技术目的是为了解决现有齿轮故障诊断方法还存在没有同时考虑如何获取不同空间尺度全局特征信息和如何进一步丰富提取的特征信息的问题，以及故障诊断方法的依赖大量不同工况数据的问题，而提出了一种基于多尺度空洞注意力机制的convnext迁移学习齿轮故障诊断方法。

2、一种基于多尺度空洞注意力机制的convnext迁移学习齿轮故障诊断方法具体过程如下：

3、获得待诊断的跨域齿轮原始振动信号，将待诊断的跨域齿轮原始振动信号输入到齿轮故障诊断网络中获得齿轮故障严重性诊断结果；

4、迁移学习齿轮故障诊断网络通过以下方式获得：

5、步骤一、获取源域工况和目标域工况的齿轮原始振动信号，并将齿轮原始振动信号分为源域训练集、源域验证集、目标域测试集；

6、步骤二、构建基于多尺度空洞注意力机制的convnext迁移学习网络；

7、所述的基于多尺度空洞注意力机制的convnext模型由扩张卷积convnext模块、多尺度空洞注意力模块、softmax分类器、ckmmd模块组成；

8、所述扩张卷积convnext模块通过在不同并行通道使用不同扩张率的扩张卷积，提取输入数据不同尺度下的特征信息，并增强模型对输入数据的特征表达能力；

9、所述多尺度空洞注意力模块通过采用多头部设计，在不同的头部使用不同的空洞率执行滑动窗口空洞注意力，聚合感受野内各种尺度的特征信息，集中关注重要的特征信息并抑制不相关的特征；

10、所述softmax分类器用于对基于多尺度空洞注意力机制的convnext输出的特征进行分类；

11、所述ckmmd模块用于减小源域和目标域之间的数据差异；

12、步骤三、利用源域训练集数据训练步骤二构建的基于多尺度空洞注意力机制的convnext神经网络；

13、步骤四、利用源域验证集数据验证步骤三训练好的神经网络；

14、步骤五、利用目标域数据测试经过步骤四验证过的神经网络，通过ckmmd算法用于缩小源域和目标域之间的偏差；

15、所述迁移学习齿轮故障诊断网络为准确率大于阈值的训练好的基于多尺度空洞注意力机制的convnext模型。

16、进一步地，所述步骤一包括以下步骤：

17、首先，设置样本提取参数采集齿轮原始振动信号，获得若干样本；

18、然后，按照预设比例将样本划分为源域训练集、源域验证集和目标域测试集，并分别设定类别标签。

19、进一步地，所述步骤二中的扩张卷积convnext模块依次由多并行通道扩张卷积层、bn层、relu层组成；其中，多并行通道扩张卷积层通过在不同的通道使用不同的扩张率来调整感受野，提取输入数据不同尺度的特征；bn层用来标准化输入数据；relu层通过引入非线性映射，帮助神经网络学习复杂的非线性关系；

20、所述bn层输出为：

21、

22、

23、

24、

25、其中，yi是bn层输出，β和γ是可学习的参数，∈＝1×10-8，是归一化后的输入值，为输入batch的均值，是输入数据的方差，xi表示输入数据。

26、进一步地，所述多并行通道扩张卷积层的实际卷积核和感受野为：

27、k1＝k0+(k0-1)(r′-1)

28、

29、其中，k1为扩张卷积实际卷积核大小，k0为原始卷积核大小，f为扩张卷积感受野，r′为扩张率，

30、进一步地，所述步骤二中的多尺度空洞注意力模块由线性层(线性投影)、滑动窗口空洞注意力、拼接操作、线性层(特征聚合)组成；其中，线性层(线性投影)用来获得输入特征的查询矩阵q、键矩阵k和值矩阵v；滑动窗口空洞注意力用来在以查询块为中心的滑动窗口中根据空洞率来稀疏选择键和值，在不同尺度上计算注意力权重，以捕捉不同尺度的特征信息；拼接操作用来将来自不同尺度的注意力机制的输出拼接在一起；线性层(特征聚合)用来将拼接后的特征映射到最终的输出空间。

31、进一步地，所述步骤二中的多尺度空洞注意力模块中的滑动窗口空洞注意力的输出为：

32、x＝swda(q，k，v，r)

33、其中，x为滑动窗口空洞注意力操作的输出，swda(q，k，v，r)表示滑动窗口空洞注意力操作，q，k，v分别表示查询矩阵、键矩阵和值矩阵，r为空洞率，对于位置i，滑动窗口空洞注意力操作的输出为：

34、

35、其中，xi为滑动窗口空洞注意力操作在位置i处的输出，attention(·)表示注意力计算，qi为第i个特征点的查询矩阵，kr和vr为考虑空洞率r情况下在键矩阵k和值矩阵v中选择的键和值，softmax(·)表示归一化操作，dk为查询矩阵和键矩阵的维度，l为一维信号的长度；对于kr和vr所对应的位置，位置计算公式为：

36、

37、其中，i′为kr和vr所对应的位置，w为滑动窗口大小。

38、进一步地，所述步骤二中多尺度空洞注意力模块的输出为：

39、x＝linear(concat[h1，...，hn])

40、hj＝swad(qj，kj，vj，rj)1≤j≤n

41、其中，x为多尺度空洞注意力模块的输出，concat[·]为拼接操作，本文档来自技高网...

【技术保护点】

1.一种基于多尺度空洞注意力机制的ConvNeXt迁移学习齿轮故障诊断方法，其特征在于，所述方法具体过程为：获得待诊断的跨域齿轮原始振动信号，将待诊断的跨域齿轮原始振动信号输入到迁移学习齿轮故障诊断网络中获得齿轮故障严重性诊断结果；

2.根据权利要求1所述的一种基于多尺度空洞注意力机制的ConvNeXt迁移学习齿轮故障诊断方法，其特征在于：所述步骤一包括以下步骤：

3.根据权利要求2中所述的一种基于多尺度空洞注意力机制的ConvNeXt迁移学习齿轮故障诊断方法，其特征在于：所述步骤二中的扩张卷积ConvNeXt模块依次由多并行通道扩张卷积层、BN层、ReLU层组成；其中，多并行通道扩张卷积层通过在不同的通道使用不同的扩张率来调整感受野，提取输入数据不同尺度的特征；BN层用来标准化输入数据；ReLU层通过引入非线性映射，帮助神经网络学习复杂的非线性关系。

4.根据权利要求3中所述的一种基于多尺度空洞注意力机制的ConvNeXt迁移学习齿轮故障诊断方法，其特征在于：所述多并行通道扩张卷积层的实际卷积核和感受野为：

5.根据权利要求4所述

6.根据权利要求5所述的一种基于多尺度空洞注意力机制的ConvNeXt迁移学习齿轮故障诊断方法，其特征在于：所述步骤二中的多尺度空洞注意力模块中的滑动窗口空洞注意力的输出为：

7.根据权利要求6所述的一种基于多尺度空洞注意力机制的ConvNeXt迁移学习齿轮故障诊断方法，其特征在于：所述步骤二中多尺度空洞注意力模块的输出为：

8.根据权利要求7所述的一种基于多尺度空洞注意力机制的ConvNeXt迁移学习齿轮故障诊断方法，其特征在于：所述的CKMMD算法输出为：

...

【技术特征摘要】

1.一种基于多尺度空洞注意力机制的convnext迁移学习齿轮故障诊断方法，其特征在于，所述方法具体过程为：获得待诊断的跨域齿轮原始振动信号，将待诊断的跨域齿轮原始振动信号输入到迁移学习齿轮故障诊断网络中获得齿轮故障严重性诊断结果；

2.根据权利要求1所述的一种基于多尺度空洞注意力机制的convnext迁移学习齿轮故障诊断方法，其特征在于：所述步骤一包括以下步骤：

3.根据权利要求2中所述的一种基于多尺度空洞注意力机制的convnext迁移学习齿轮故障诊断方法，其特征在于：所述步骤二中的扩张卷积convnext模块依次由多并行通道扩张卷积层、bn层、relu层组成；其中，多并行通道扩张卷积层通过在不同的通道使用不同的扩张率来调整感受野，提取输入数据不同尺度的特征；bn层用来标准化输入数据；relu层通过引入非线性映射，帮助神经网络学习复杂的非线性关系。

4.根据权利要求3中所述的一种基于多尺度空洞注意力机制的convnext迁移学习齿轮故障诊断方法，其特征在于：所述多并行通道扩张卷积层的实际卷积核和感受野为：

5.根据权利要求4所述的一种基于多...

【专利技术属性】
技术研发人员：李学艺，李岱优，原鹏，苏凯宇，解志杰，
申请(专利权)人：东北林业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人