一种面向环境噪声的智能识别方法、装置、设备及存储介质制造方法及图纸

技术编号:34082141 阅读:38 留言:0更新日期:2022-07-11 19:07
本申请涉及音频识别技术领域,公开了一种面向环境噪声的智能识别方法、装置、设备及存储介质,其方法包括获取噪声音频文件,并转换为频谱图输出;将频谱图输入卷积神经网络中,卷积神经网络被划分为至少2个阶段,并分阶段按不同比例提取频谱图的特征;在卷积神经网络中为每一个阶段提取的特征施加监督信号进行训练;把每一个阶段参与训练的所有特征进行融合,得到融合特征;将融合特征输入分类器,并根据分类器的输出结果和监督信号,调整融合特征再输入分类器进行学习,直至分类器的输出结果的精度达到预设值;基于精度达到预设值的分类器对环境噪声进行识别。本申请可以达到使声音数据样本更具代表性,提高模型识别精度的效果。果。果。

【技术实现步骤摘要】
一种面向环境噪声的智能识别方法、装置、设备及存储介质


[0001]本申请涉及音频识别
,尤其是涉及一种面向环境噪声的智能识别方法、装置、设备及存储介质。

技术介绍

[0002]随着城市化进程的发展,噪声污染日益严重,成为影响城市居民身体健康和生活质量的重要环境因素。最新的研究结果表明,人们对声音的舒适度不仅取决于噪音的分贝数,还取决于噪声源。典型的城市噪声,如铁路、公路、飞机的交通噪声,邻里之间的噪声和工业噪声等,对人体健康和生活质量具有不同的影响。
[0003]噪声识别的研究和声音识别的研究相同,有语音信号识别和非语音信号识别两个方向。目前,对于噪声测量的主流方法是基于平均时间内加权声压的测量,其中忽略了噪声源信息。机器听觉算法的研究对象主要包括语音和音乐,一般分为特征提取与分类识别两个部分,特征提取部分的作用是获取声信号中能够表征其主要信息的参数,分类识别则利用提取出来的特征,建立机器学习的模型,进行训练和获得噪声分类模型,但机器听觉算法对于噪声分类的相关研究还比较有限。虽然人耳可以十分熟练地辨别各种噪声的种类,分析噪声是否对身体有害,辨别噪声的来源以采取有效措施来避免,但是要想让机器听觉算法来达到这些目的却很不容易。
[0004]现有的在声信号分类识别中,主要是基于卷积神经网络(CNN)模型和方法,将声学信号直接转化成对声谱图,利用图像识别的方法进行噪声识别,但是面向声谱图的识别方法没有考虑多尺度和多层特征融合问题,影响了识别精度。
[0005]针对上述中的相关技术,专利技术人发现现有的机器听觉算法在识别时没有考虑多尺度和多层级的特征,存在有声音数据样本代表性差,导致模型识别精度较差的问题。

技术实现思路

[0006]为了使声音数据样本更具代表性,提高模型的识别精度,本申请提供了一种面向环境噪声的智能识别方法、装置、设备及存储介质。
[0007]第一方面,本申请提供一种面向环境噪声的智能识别方法,具有使声音数据样本更具代表性,提高模型识别精度的特点。
[0008]本申请是通过以下技术方案得以实现的:一种面向环境噪声的智能识别方法,包括以下步骤,获取噪声音频文件,并转换为频谱图输出;将所述频谱图输入卷积神经网络中,所述卷积神经网络被划分为至少2个阶段,并分阶段按不同比例提取所述频谱图的特征;在所述卷积神经网络中为每一个阶段提取的特征施加监督信号进行训练;把每一个阶段参与训练的所有特征进行融合,得到融合特征;将所述融合特征输入分类器,并根据所述分类器的输出结果和监督信号,调整所
述融合特征再输入所述分类器进行学习,直至所述分类器的输出结果的精度达到预设值;基于精度达到预设值的所述分类器对环境噪声进行识别。
[0009]本申请在一较佳示例中可以进一步配置为:所述把每一个阶段参与训练的所有特征进行融合,得到融合特征的步骤包括,将每一个阶段参与训练的所有特征进行拉伸;对拉伸后的每一个阶段的所有特征进行拼接,得到融合特征。
[0010]本申请在一较佳示例中可以进一步配置为:所述把每一个阶段参与训练的所有特征进行融合,得到融合特征的步骤包括,采用克罗内克乘积,使每一个阶段参与训练的所有特征依次进行克罗内克相乘,得到融合特征。
[0011]本申请在一较佳示例中可以进一步配置为:在所述卷积神经网络中为每一个阶段提取的特征施加监督信号进行训练之前,还包括以下步骤,基于所述卷积神经网络使分阶段提取的特征均映射成同一通道数量的特征,所述卷积神经网络包括一个1x1的卷积层和一个3x3的卷积层;对映射成同一通道数量的所述特征进行池化处理。
[0012]本申请在一较佳示例中可以进一步配置为:所述池化处理采用最大池化处理方式。
[0013]本申请在一较佳示例中可以进一步配置为:所述获取噪声音频文件,并转换为频谱图输出的步骤包括,使用Python的音频处理库从所述噪声音频文件中提取音频特征;并将提取的所述音频特征转换为频谱图输出。
[0014]本申请在一较佳示例中可以进一步配置为:在所述卷积神经网络中为每一个阶段提取的特征施加监督信号进行训练还包括以下步骤,在所述卷积神经网络中对当前阶段提取的特征进行训练;当前阶段提取的特征训练完成后,基于训练结果调整所述卷积神经网络下一次训练的训练权重;基于所述训练权重,在所述卷积神经网络中对下一阶段提取的特征进行训练,并基于训练结果调整训练权重,直至完成所有阶段提取的特征的训练。
[0015]第二方面,本申请提供一种面向环境噪声的智能识别装置,具有使声音数据样本更具代表性,提高模型识别精度的特点。
[0016]本申请是通过以下技术方案得以实现的:一种面向环境噪声的智能识别装置,包括,数据模块,用于获取噪声音频文件,并转换为频谱图输出;特征提取模块,用于将所述频谱图输入卷积神经网络中,所述卷积神经网络被划分为至少2个阶段,并分阶段按不同比例提取所述频谱图的特征;特征训练模块,用于在所述卷积神经网络中为每一个阶段提取的特征施加监督信号进行训练;特征融合模块,用于把每一个阶段参与训练的所有特征进行融合,得到融合特征;建模模块,用于将所述融合特征输入分类器,并根据所述分类器的输出结果和监
督信号,调整所述融合特征再输入所述分类器进行学习,直至所述分类器的输出结果的精度达到预设值;噪声识别模块,用于基于精度达到预设值的所述分类器对环境噪声进行识别。
[0017]第三方面,本申请提供一种计算机设备,具有使声音数据样本更具代表性,提高模型识别精度的特点。
[0018]本申请是通过以下技术方案得以实现的:一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一种面向环境噪声的智能识别方法的步骤。
[0019]第四方面,本申请提供一种计算机可读存储介质,具有使声音数据样本更具代表性,提高模型识别精度的特点。
[0020]本申请是通过以下技术方案得以实现的:一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种面向环境噪声的智能识别方法的步骤。
[0021]综上所述,与现有技术相比,本申请提供的技术方案带来的有益效果至少包括:1、获取噪声音频文件,并转换为频谱图输出,以方便后续基于图像进行声信号特征提取;将频谱图输入卷积神经网络中,卷积神经网络被划分为至少2个阶段,并分阶段按不同比例提取频谱图的特征,分阶段后卷积神经网络具有不同的学习能力,以利用不同学习能力的卷积神经网络提取得到的不同比例的特征,可以由浅入深学习到频谱图不同层次的特征,获得多尺度的特征,以通过渐进式学习,提升卷积神经网络的整体学习能力;在卷积神经网络中为每一个阶段提取的特征施加监督信号进行训练,再把每一个阶段参与训练的所有特征进行融合,得到融合特征,融合特征既包含低阶段的公共特征,又包含高层次的全局特征,以获得多层级的特征,实现提取特征的利用率最大化;将融合特征输入分类器,并根据分类器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向环境噪声的智能识别方法,其特征在于,包括以下步骤,获取噪声音频文件,并转换为频谱图输出;将所述频谱图输入卷积神经网络中,所述卷积神经网络被划分为至少2个阶段,并分阶段按不同比例提取所述频谱图的特征;在所述卷积神经网络中为每一个阶段提取的特征施加监督信号进行训练;把每一个阶段参与训练的所有特征进行融合,得到融合特征;将所述融合特征输入分类器,并根据所述分类器的输出结果和监督信号,调整所述融合特征再输入所述分类器进行学习,直至所述分类器的输出结果的精度达到预设值;基于精度达到预设值的所述分类器对环境噪声进行识别。2.根据权利要求1所述的面向环境噪声的智能识别方法,其特征在于,所述把每一个阶段参与训练的所有特征进行融合,得到融合特征的步骤包括,将每一个阶段参与训练的所有特征进行拉伸;对拉伸后的每一个阶段的所有特征进行拼接,得到融合特征。3.根据权利要求1所述的面向环境噪声的智能识别方法,其特征在于,所述把每一个阶段参与训练的所有特征进行融合,得到融合特征的步骤包括,采用克罗内克乘积,使每一个阶段参与训练的所有特征依次进行克罗内克相乘,得到融合特征。4.根据权利要求1所述的面向环境噪声的智能识别方法,其特征在于,在所述卷积神经网络中为每一个阶段提取的特征施加监督信号进行训练之前,还包括以下步骤,基于所述卷积神经网络使分阶段提取的特征均映射成同一通道数量的特征,所述卷积神经网络包括一个1x1的卷积层和一个3x3的卷积层;对映射成同一通道数量的所述特征进行池化处理。5.根据权利要求4所述的面向环境噪声的智能识别方法,其特征在于,所述池化处理采用最大池化处理方式。6.根据权利要求1所述的面向环境噪声的智能识别方法,其特征在于,所述获取噪声音频文件,并转换为频谱图输出的步骤包括...

【专利技术属性】
技术研发人员:郑建辉殷艺敏
申请(专利权)人:广州声博士声学技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1