一种面向环境噪声的智能识别方法、装置、设备及存储介质制造方法及图纸

技术编号：34082141 阅读：53 留言：0更新日期：2022-07-11 19:07

本申请涉及音频识别技术领域，公开了一种面向环境噪声的智能识别方法、装置、设备及存储介质，其方法包括获取噪声音频文件，并转换为频谱图输出；将频谱图输入卷积神经网络中，卷积神经网络被划分为至少2个阶段，并分阶段按不同比例提取频谱图的特征；在卷积神经网络中为每一个阶段提取的特征施加监督信号进行训练；把每一个阶段参与训练的所有特征进行融合，得到融合特征；将融合特征输入分类器，并根据分类器的输出结果和监督信号，调整融合特征再输入分类器进行学习，直至分类器的输出结果的精度达到预设值；基于精度达到预设值的分类器对环境噪声进行识别。本申请可以达到使声音数据样本更具代表性，提高模型识别精度的效果。果。果。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向环境噪声的智能识别方法、装置、设备及存储介质

[0001]本申请涉及音频识别
，尤其是涉及一种面向环境噪声的智能识别方法、装置、设备及存储介质。

技术介绍

[0002]随着城市化进程的发展，噪声污染日益严重，成为影响城市居民身体健康和生活质量的重要环境因素。最新的研究结果表明，人们对声音的舒适度不仅取决于噪音的分贝数，还取决于噪声源。典型的城市噪声，如铁路、公路、飞机的交通噪声，邻里之间的噪声和工业噪声等，对人体健康和生活质量具有不同的影响。
[0003]噪声识别的研究和声音识别的研究相同，有语音信号识别和非语音信号识别两个方向。目前，对于噪声测量的主流方法是基于平均时间内加权声压的测量，其中忽略了噪声源信息。机器听觉算法的研究对象主要包括语音和音乐，一般分为特征提取与分类识别两个部分，特征提取部分的作用是获取声信号中能够表征其主要信息的参数，分类识别则利用提取出来的特征，建立机器学习的模型，进行训练和获得噪声分类模型，但机器听觉算法对于噪声分类的相关研究还比较有限。虽然人耳可以十分熟练地辨别各种噪声的种类，分析噪声是否对身体有害，辨别噪声的来源以采取有效措施来避免，但是要想让机器听觉算法来达到这些目的却很不容易。
[0004]现有的在声信号分类识别中，主要是基于卷积神经网络(CNN)模型和方法，将声学信号直接转化成对声谱图，利用图像识别的方法进行噪声识别，但是面向声谱图的识别方法没有考虑多尺度和多层特征融合问题，影响了识别精度。
[0005]针对上述中的相关技术，专利技术人发现...

【技术保护点】

【技术特征摘要】
1.一种面向环境噪声的智能识别方法，其特征在于，包括以下步骤，获取噪声音频文件，并转换为频谱图输出；将所述频谱图输入卷积神经网络中，所述卷积神经网络被划分为至少2个阶段，并分阶段按不同比例提取所述频谱图的特征；在所述卷积神经网络中为每一个阶段提取的特征施加监督信号进行训练；把每一个阶段参与训练的所有特征进行融合，得到融合特征；将所述融合特征输入分类器，并根据所述分类器的输出结果和监督信号，调整所述融合特征再输入所述分类器进行学习，直至所述分类器的输出结果的精度达到预设值；基于精度达到预设值的所述分类器对环境噪声进行识别。2.根据权利要求1所述的面向环境噪声的智能识别方法，其特征在于，所述把每一个阶段参与训练的所有特征进行融合，得到融合特征的步骤包括，将每一个阶段参与训练的所有特征进行拉伸；对拉伸后的每一个阶段的所有特征进行拼接，得到融合特征。3.根据权利要求1所述的面向环境噪声的智能识别方法，其特征在于，所述把每一个阶段参与训练的所有特征进行融合，得到融合特征的步骤包括，采用克罗内克乘积，使每一个阶段参与训练的所有特征依次进行克罗内克相乘，得到融合特征。4.根据权利要求1所述的面向环境噪声的智能识别方法，其特征在于，在所述卷积神经网络中为每一个阶段提取的特征施加监督信号进行训练之前，还包括以下步骤，基于所述卷积神经网络使分阶段提取的特征均映射成同一通道数量的特征，所述卷积神经网络包括一个1x1的卷积层和一个3x3的卷积层；对映射成同一通道数量的所述特征进行池化处理。5.根据权利要求4所述的面向环境噪声的智能识别方法，其特征在于，所述池化处理采用最大池化处理方式。6.根据权利要求1所述的面向环境噪声的智能识别方法，其特征在于，所述获取噪声音频文件，并转换为频谱图输出的步骤包括...

【专利技术属性】
技术研发人员：郑建辉，殷艺敏，
申请(专利权)人：广州声博士声学技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人