一种基于Conformer网络的机器异常声检测方法技术

技术编号：43303281 阅读：6 留言：0更新日期：2024-11-12 16:18

本发明专利技术涉及一种基于Conformer网络的机器异常声检测方法，属于人工智能及异常检测技术领域。该方法包括以下步骤：S1、生成训练集，训练集使用多台设备正常运行声音；S2、利用log‑Mel谱图和对应的机器来源标签作为输入；S3、构建多个改进的Conformer编码器并将每个的输出值按通道维度堆叠成一个新的输出值；S4、使用自注意力池化和全连接层输出反映属于每个来源标签的概率的预测张量；S5、根据预测张量中先验的来源标签位的概率值计算异常分数。本发明专利技术能够在不使用异常样本数据条件下，有效地实现设备故障声纹检测，对于提高设备维护的效率和降低故障风险具有重要意义。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于人工智能及异常检测，具体涉及一种基于conformer网络的机器异常声检测方法。

技术介绍

1、当前，各种自动化设备已经广泛地应用于各行各业，机械系统的稳定运行对于机械生产的效率、质量乃至整体安全都扮演着至关重要的角色。传统的设备故障检测方法采用人工对设备进行全面的检测，不仅耗时费力，而且检测员的经验和能力参差不齐，故障检测结果容易受到检测员的主观因素影响，难以保证其准确性，造成一定经济损失。

2、在大部分时间里，机器都处于稳定运行阶段，此时发生的故障相对较少。然而，这些故障的种类却相当繁多，涉及机械系统的各个方面。由于故障种类的多样性，收集到机器所有可能的故障声音并进行有监督的训练，成为了一个极具挑战性的任务。

3、目前企业的主流方法是使用视频监控对工厂的生产环境进行监测，但视频信息流处理对设备的存储能力和计算能力要求较高，因此系统的硬件成本十分昂贵，导致难以普及到购买力不强的中小企业。基于声音的监控系统作为安全监控的重要组成部分，可以通过机器发出的声音来判断机器是否发生异常。该系统能够及时检测到机器的异常情况，为客户提供决策的数据依据，从而避免重大事故和危急情况的发生，在保障企业生产安全方面发挥积极作用。

技术实现思路

1、针对现有技术中存在的上述问题，本专利技术的目的在于提供一种基于conformer网络的机器异常声音检测方法，在仅使用正常声音样本训练模型的情况下，可实现异常声音样本的识别。

2、本专利技术提供如下技术方案：一

3、s1：采集正常运行状态(即设备的运行参数在设定的范围内)下机器的音频数据，将采集的音频数据进行划分，生成训练集，训练集数据的命名包括来源标签的字符和四位代号数字；

4、s2：对训练集中的每个音频文件分段并转换成log-mel谱图；

5、s3：基于conformer编码器，将conformer编码器的depthwise conv卷积层修改为res2net中含有尺度的卷积层，并汇聚多个conformer编码器的输出值进行池化，以构建改进的conformer网络；

6、s4：将训练集数据转换成的log-mel谱图和训练集数据的来源标签输入步骤s3中构建的网络，利用分类损失函数训练网络；

7、s5：将待测音频和待测音频的来源标签输入s4中训练好的网络，利用输出值计算异常分数。

8、进一步的，所述s1中，音频数据的格式为采样率在设定频率下的单声道wav文件，文件命名格式为idx_xxxx，其中，x为数字。

9、进一步的，所述s2中，对音频数据文件以设定的的窗长和移动间隔来分段，并在每段音频提取log-mel谱图时，对帧大小、跳长及n_mel滤波器数量进行参数设置。

10、进一步的，所述s3中，含有尺度的卷积层计算式如下：

11、

12、式中xi为输入张量分成s组后的张量，ki()表示一维卷积计算，yi为对应的输出张量；

13、所述汇聚多个conformer编码器的输出值是将多个编码器的三维张量按第二个维度进行堆叠；

14、所述池化的计算公式如下：

15、

16、m＝softmax((h-μ)t×(h-μ))

17、

18、式中ti表示张量第三维的第i列向量，t表示第三维的长度，softmax()表示softmax归一化计算，h为输入张量，为输出张量，μ表示时间维度下平均值张量、m表示归一化后的张量内积值矩阵。

19、进一步的，所述s4中，使用的损失函数为aam-softmax损失函数。

20、进一步的，所述步骤s5的具体过程如下：

21、s5.1:将待测音频文件以设定的窗长和移动间隔来分段，并在每段音频提取log-mel谱图时，对帧大小、跳长及n_mel滤波器数量进行参数设置；

22、s5.2:将所有log-mel谱图输入到训练好的网络中，得到反映音频属于每个来源标签的概率的张量；

23、s5.3:用待测音频文件的来源标签去索引所有张量对应位上的数值，对所有数值求平均数，然后把平均数与1的差值作为异常分数。

24、通过采用上述技术，与现有技术相比，本专利技术的有益效果如下：

25、本专利技术提出的机器异常声音检测方法，在异常样本较少时可以充分发挥作用；利用该网络均衡的全局特征和局部特征提取能力，使得网络能够对正常样本和异常样本的差异保持敏感，提高异常声音检测的识别成功率。

本文档来自技高网...

【技术保护点】

1.一种基于Conformer网络的机器异常声检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述一种基于Conformer的机器异常声音检测方法，其特征在于，所述S1中，音频数据的格式为采样率在设定频率下的单声道wav文件，文件命名格式为idx_xxxx，其中，x为数字。

3.根据权利要求1所述的一种基于Conformer的机器异常声音检测方法，其特征在于，所述S2中，对音频数据文件以设定的的窗长和移动间隔来分段，并在每段音频提取log-mel谱图时，对帧大小、跳长及n_Mel滤波器数量进行参数设置。

4.根据权利要求1所述一种基于Conformer的机器异常声音检测方法，其特征在于，所述S3中，含有尺度的卷积层计算式如下：

5.根据权利要求1所述的一种基于Conformer的机器异常声音检测方法，其特征在于，所述S4中，使用的损失函数为AAM-Softmax损失函数。

6.根据权利要求1所述的一种基于Conformer的机器异常声音检测方法，其特征在于，所述步骤S5的具体过程如下：

【技术特征摘要】

1.一种基于conformer网络的机器异常声检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述一种基于conformer的机器异常声音检测方法，其特征在于，所述s1中，音频数据的格式为采样率在设定频率下的单声道wav文件，文件命名格式为idx_xxxx，其中，x为数字。

3.根据权利要求1所述的一种基于conformer的机器异常声音检测方法，其特征在于，所述s2中，对音频数据文件以设定的的窗长和移动间隔来分段，并在每段音频提取log-mel谱...

【专利技术属性】
技术研发人员：陈德富，周浩，周云龙，刘小湖，桑伊健，胡姗，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人