一种基于神经网络和MFCC的嘈杂环境下非人声语音过滤方法技术

技术编号：31081111 阅读：16 留言：0更新日期：2021-12-01 11:57

本发明专利技术提供一种基于神经网络和MFCC的嘈杂环境下非人声语音过滤方法，包括获取不包含人声和包含人声的语音信号，并切分和补齐MFCC特征及其Delta信息、Delta

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络和MFCC的嘈杂环境下非人声语音过滤方法

[0001]本专利技术涉及语音信号处理及计算机软件
，具体而言，涉及一种基于神经网络和MFCC(Mel Frequency Cepstrum Coefficient)的嘈杂环境下非人声语音过滤方法。

技术介绍

[0002]近年来，人工智能技术飞速发展且日趋成熟，一方面计算机产业的迅速发展，软、硬件环境的改善为复杂算法的实现提供了良好的环境；另一方面，数字信号处理的理论和算法已有大量积累，如快速傅里叶变换、倒谱计算、线性预测算法、数字滤波器等诸多算法的出现，使得识别系统使用方式逐渐从特定人、孤立词、小词表方式发展到非特定人、连续语音、大词表方式。
[0003]语音识别和分类技术已广泛应用于各项领域中，但现有的语音识别系统都有一个共同的问题，即在噪音环境下，识别率会大幅下降。在语音分类中由于噪声导致的误吸收最为显著，因此语音分类系统就必须考虑在面对嘈杂环境时的准确率。在将特征输入至神经网络前需确保其维度一致，现有的通用补全策略是对末尾进行补0，但在面对仅在信号末尾处有人声且需进行补齐的极端情况时，这种补全策略不能满足对准确率有高需求的过滤系统。

技术实现思路

[0004]本专利技术旨在提供一种基于神经网络和MFCC的嘈杂环境下非人声语音过滤方法，以解决上述存在的问题。
[0005]本专利技术提供的一种基于神经网络和MFCC的嘈杂环境下非人声语音过滤方法，包括如下步骤：
[0006]步骤S1，训练神经网络：
[0...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络和MFCC的嘈杂环境下非人声语音过滤方法，其特征在于，所述嘈杂环境下非人声语音过滤方法包括如下步骤：步骤S1，训练神经网络：(11)获取不包含人声和包含人声的语音信号；(12)提取该语音信号的MFCC融合特征；所述MFCC融合特征均包括MFCC特征、Delta信息、Delta
‑
Delta信息以及RMSE；(13)对该语音信号的MFCC融合特征进行特征处理；所述特征处理包括切分和补齐；(14)利用特征处理后的该语音信号的MFCC融合特征对神经网络进行训练，得到训练好的预测模型；步骤S2，非人声语音过滤：(21)获取待预测语音信号；(22)提取该待预测语音信号的MFCC融合特征；(23)对该待预测语音信号的MFCC融合特征进行特征处理；(24)将特征处理后的该待预测语音信号的MFCC融合特征输入训练好的预测模型，实现对待预测语音信号的非人声语音过滤。2.根据权利要求1所述的基于神经网络和MFCC的嘈杂环境下非人声语音过滤方法，其特征在于，步骤(12)和步骤(22)中提取MFCC融合特征的方法为：对语音信号进行预校验和添加标记；将进行预校验和添加标记后的语音信号，通过N阶滤波器并剔除第零分量后，得到N
‑
1维的MFCC特征；对N
‑
1维的MFCC特征沿着时间轴做一次Savitsky
‑
Golay滤波，得到Delta信息；对N维的MFCC特征沿着时间轴做两次Savitsky
‑
Golay滤波，得到Delta
‑
Delta信息；根据原始的语音信号的梅尔频谱计算RMSE；将所述MFCC特征、Delta信息、Delta
‑
Delta信息以及RMS...

【专利技术属性】
技术研发人员：韩皓天，余安东，
申请(专利权)人：电信科学技术第五研究所有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人