System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于人工智能及异常检测,具体涉及一种基于conformer网络的机器异常声检测方法。
技术介绍
1、当前,各种自动化设备已经广泛地应用于各行各业,机械系统的稳定运行对于机械生产的效率、质量乃至整体安全都扮演着至关重要的角色。传统的设备故障检测方法采用人工对设备进行全面的检测,不仅耗时费力,而且检测员的经验和能力参差不齐,故障检测结果容易受到检测员的主观因素影响,难以保证其准确性,造成一定经济损失。
2、在大部分时间里,机器都处于稳定运行阶段,此时发生的故障相对较少。然而,这些故障的种类却相当繁多,涉及机械系统的各个方面。由于故障种类的多样性,收集到机器所有可能的故障声音并进行有监督的训练,成为了一个极具挑战性的任务。
3、目前企业的主流方法是使用视频监控对工厂的生产环境进行监测,但视频信息流处理对设备的存储能力和计算能力要求较高,因此系统的硬件成本十分昂贵,导致难以普及到购买力不强的中小企业。基于声音的监控系统作为安全监控的重要组成部分,可以通过机器发出的声音来判断机器是否发生异常。该系统能够及时检测到机器的异常情况,为客户提供决策的数据依据,从而避免重大事故和危急情况的发生,在保障企业生产安全方面发挥积极作用。
技术实现思路
1、针对现有技术中存在的上述问题,本专利技术的目的在于提供一种基于conformer网络的机器异常声音检测方法,在仅使用正常声音样本训练模型的情况下,可实现异常声音样本的识别。
2、本专利技术提供如下技术方案:一
3、s1:采集正常运行状态(即设备的运行参数在设定的范围内)下机器的音频数据,将采集的音频数据进行划分,生成训练集,训练集数据的命名包括来源标签的字符和四位代号数字;
4、s2:对训练集中的每个音频文件分段并转换成log-mel谱图;
5、s3:基于conformer编码器,将conformer编码器的depthwise conv卷积层修改为res2net中含有尺度的卷积层,并汇聚多个conformer编码器的输出值进行池化,以构建改进的conformer网络;
6、s4:将训练集数据转换成的log-mel谱图和训练集数据的来源标签输入步骤s3中构建的网络,利用分类损失函数训练网络;
7、s5:将待测音频和待测音频的来源标签输入s4中训练好的网络,利用输出值计算异常分数。
8、进一步的,所述s1中,音频数据的格式为采样率在设定频率下的单声道wav文件,文件命名格式为idx_xxxx,其中,x为数字。
9、进一步的,所述s2中,对音频数据文件以设定的的窗长和移动间隔来分段,并在每段音频提取log-mel谱图时,对帧大小、跳长及n_mel滤波器数量进行参数设置。
10、进一步的,所述s3中,含有尺度的卷积层计算式如下:
11、
12、式中xi为输入张量分成s组后的张量,ki()表示一维卷积计算,yi为对应的输出张量;
13、所述汇聚多个conformer编码器的输出值是将多个编码器的三维张量按第二个维度进行堆叠;
14、所述池化的计算公式如下:
15、
16、m=softmax((h-μ)t×(h-μ))
17、
18、式中ti表示张量第三维的第i列向量,t表示第三维的长度,softmax()表示softmax归一化计算,h为输入张量,为输出张量,μ表示时间维度下平均值张量、m表示归一化后的张量内积值矩阵。
19、进一步的,所述s4中,使用的损失函数为aam-softmax损失函数。
20、进一步的,所述步骤s5的具体过程如下:
21、s5.1:将待测音频文件以设定的窗长和移动间隔来分段,并在每段音频提取log-mel谱图时,对帧大小、跳长及n_mel滤波器数量进行参数设置;
22、s5.2:将所有log-mel谱图输入到训练好的网络中,得到反映音频属于每个来源标签的概率的张量;
23、s5.3:用待测音频文件的来源标签去索引所有张量对应位上的数值,对所有数值求平均数,然后把平均数与1的差值作为异常分数。
24、通过采用上述技术,与现有技术相比,本专利技术的有益效果如下:
25、本专利技术提出的机器异常声音检测方法,在异常样本较少时可以充分发挥作用;利用该网络均衡的全局特征和局部特征提取能力,使得网络能够对正常样本和异常样本的差异保持敏感,提高异常声音检测的识别成功率。
本文档来自技高网...【技术保护点】
1.一种基于Conformer网络的机器异常声检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述一种基于Conformer的机器异常声音检测方法,其特征在于,所述S1中,音频数据的格式为采样率在设定频率下的单声道wav文件,文件命名格式为idx_xxxx,其中,x为数字。
3.根据权利要求1所述的一种基于Conformer的机器异常声音检测方法,其特征在于,所述S2中,对音频数据文件以设定的的窗长和移动间隔来分段,并在每段音频提取log-mel谱图时,对帧大小、跳长及n_Mel滤波器数量进行参数设置。
4.根据权利要求1所述一种基于Conformer的机器异常声音检测方法,其特征在于,所述S3中,含有尺度的卷积层计算式如下:
5.根据权利要求1所述的一种基于Conformer的机器异常声音检测方法,其特征在于,所述S4中,使用的损失函数为AAM-Softmax损失函数。
6.根据权利要求1所述的一种基于Conformer的机器异常声音检测方法,其特征在于,所述步骤S5的具体过程如下:
【技术特征摘要】
1.一种基于conformer网络的机器异常声检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述一种基于conformer的机器异常声音检测方法,其特征在于,所述s1中,音频数据的格式为采样率在设定频率下的单声道wav文件,文件命名格式为idx_xxxx,其中,x为数字。
3.根据权利要求1所述的一种基于conformer的机器异常声音检测方法,其特征在于,所述s2中,对音频数据文件以设定的的窗长和移动间隔来分段,并在每段音频提取log-mel谱...
【专利技术属性】
技术研发人员:陈德富,周浩,周云龙,刘小湖,桑伊健,胡姗,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。