一种基于多特征融合和组合模型的鸟声识别方法技术

技术编号：31083606 阅读：6 留言：0更新日期：2021-12-01 12:32

本发明专利技术公开了一种基于多特征融合和组合模型的鸟声识别方法，包括：对读取的原始鸟声音频进行预处理，包括预加重和分帧加窗；提取鸟声的梅尔倒谱系数、梅尔滤波后的能量系数、短时过零率和短时频谱质心四种特征，分别归一化后进行纵向拼接形成融合特征；绘制STFT语谱图；将融合特征和绘制的STFT语谱图分别输入构建的两个基于Inception模块的CNN模型进行训练，训练完成后将两个模型输出的概率数组进行拼接形成一个特征数组，并将该特征数组作为ANN模型的输入进行训练，训练完成后加载上述三个模型的最优参数；将待测的任一鸟声音频输入加载最优参数后的三个模型，得到鸟声识别分类结果。本发明专利技术可提高不同鸟声之间特征的差异性，并且提高了鸟声识别准确率。并且提高了鸟声识别准确率。并且提高了鸟声识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多特征融合和组合模型的鸟声识别方法

[0001]本专利技术涉及一种基于多特征融合和组合模型的鸟声识别方法，属于鸟鸣声分类识别的

技术介绍

[0002]鸟类是自然生态系统的重要组成部分，由于其对所生活的生态环境的变化十分敏感且易被观察和研究，因此对鸟类的监测和识别有助于对生态环境的监测，对生态环境保护工作的开展具有重大意义。鸟类监测是国内外研究的一个重要领域，传统的鸟类监测主要依赖于鸟类的形态特征差异完成，而在听觉上鸟鸣声中也包含着独有的特征，并且具有大范围性、稳定性、低干扰等优点，因此对鸟声识别的研究显得尤为重要。
[0003]鸟声识别的一般过程主要是预处理、特征参数提取、分类方法选择三个方面。目前国内外在鸟声识别技术上的改进主要是在于特征参数提取上，然后使用深度学习的方法构建神经网络进行训练完成鸟声识别。然而现有方法所提取的鸟声特征多基于人声领域的特征且较为单一，识别效果易受外界环境噪声影响。为解决此问题提出一种基于多特征融合和组合模型的鸟声识别方法。

技术实现思路

[0004]为解决现有的鸟声识别方法中提取特征单一，所代表的鸟声特性不足的问题，本专利技术提供一种基于多特征融合和组合模型的鸟声识别方法，使用融合特征替代了单一的特征，使不同鸟声之间的特征差异更大，更易被区分，且使用三个神经网络模型组合识别，提高了鸟声识别准确率。
[0005]本专利技术具体采用以下技术方案解决上述技术问题：
[0006]一种基于多特征融合和组合模型的鸟声识别方法，包括以下步骤：

【技术保护点】

【技术特征摘要】
1.一种基于多特征融合和组合模型的鸟声识别方法，其特征在于，包括以下步骤：步骤1、对读取的原始鸟声音频进行预处理，包括预加重和分帧加窗；步骤2、对预处理后的原始鸟声音频提取鸟声的梅尔倒谱系数、梅尔滤波后的能量系数、短时过零率和短时频谱质心四种特征，并对四种特征分别归一化后进行纵向拼接形成一个融合特征；以及，对预处理后的原始鸟声音频经短时傅里叶变换STFT的结果绘制STFT语谱图；步骤3、将形成的一个融合特征和绘制的STFT语谱图分别输入构建的两个基于Inception模块的CNN模型进行训练，训练完成后将两个模型输出的概率数组进行拼接形成一个特征数组，并将该特征数组作为ANN模型的输入进行训练，训练完成后加载上述三个模型的最优参数；步骤4、将待测的任一鸟声音频输入加载最优参数后的三...

【专利技术属性】
技术研发人员：周晓彦，欧昀，李大鹏，刘文强，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人