低功耗单声道语音降噪方法技术

技术编号：39581968 阅读：32 留言：0更新日期：2023-12-03 19:32

本发明专利技术提供一种低功耗单声道语音降噪方法

全部详细技术资料下载

【技术实现步骤摘要】
低功耗单声道语音降噪方法、计算机装置及计算机可读存储介质

[0001]本专利技术涉及基于语音降噪的
，具体地，是一种将低功耗单声道语音降噪方法，还涉及实现该方法的计算机装置及计算机可读存储介质
。

技术介绍

[0002]诸如无线耳机
、
游戏耳机
、
音箱
、
会议系统等电子设备大多具有语音采集的功能，这些电子设备设置有麦克风，通过麦克风采集语音信号，并且需要对所采集的语音信号进行降噪后输出
。
现有的对语音信号进行降噪的算法分为两类：基于数字信号处理
(DSP)
的算法与基于神经网络的算法
。
[0003]基于数字信号处理算法利用数字信号处理技术，通过噪声估计以及自适应滤波器等方法达到降噪效果，对计算资源消耗较小，但是难以实现对人声和非人声的准确区分，存在噪声过滤得不干净
、
难以过滤非稳态噪声
、
人声输出较为模糊等缺点
。
在具有多个麦克风构成的麦克风阵列的电子设备上，可以使用波束成形技术区分声音方位并只接收特定方向上传来的声音
。
但是这种方式硬件成本较高，且当人声和噪声来自同一方向时无法消除噪声
。
[0004]基于神经网络的算法是近年来逐渐流行的趋势与未来技术发展的方向
。
根据输入数据类型不同，基于神经网络的算法又进一步分为以时频域信号为输入与以语音特征
(
如
MFCC,BF...

【技术保护点】

【技术特征摘要】
1.
低功耗单声道语音降噪方法，包括：获取初始音频数据，对所述初始音频数据进行转换，获取时域数字信号，对所述时域数字信号进行分帧和傅里叶变换获得复值时频图；其特征在于：将所述复值时频图输入至卷积神经网络编码器，所述卷积神经网络编码器将所述复值时频图的编码结果输出至挤压激活层，所述挤压激活层的输出结果传送至平行循环神经网络层，并将所述平行循环神经网络层输出的结果用全连接层映射成与所述复值时频图相同的维度，分别对所述复值时频图的实部和虚部进行掩模计算；将掩模计算获得的值进行傅里叶逆变换，获得降噪后的语音信号
。2.
根据权利要求1所述的低功耗单声道语音降噪方法，其特征在于：所述卷积神经网络编码器将所述编码结果输出至所述挤压激活层后，所述挤压激活层对所述编码结果进行如下处理：通过全局平均池化层将所述编码结果中的频域维度缩为1；用线性层将通道维度压缩为所述编码结果通道维度的四分之一或者八分之一，再用线性层将通道维度映射至所述编码结果通道维度，应用
sigmoid
函数或者
hard sigmoid
函数进行激活，获得激活向量；将所述激活向量与所述编码结果相乘
。3.
根据权利要求2所述的低功耗单声道语音降噪方法，其特征在于：用线性层将通道维度压缩为所述编码结果通道维度的四分之一或者八分之一后，使用
Relu
函数进行激活
...

【专利技术属性】
技术研发人员：王天策，徐超，李正平，
申请(专利权)人：珠海普林芯驰科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人