一种基于联合感知损失的注意力生成对抗语音增强方法技术

技术编号：35786394 阅读：17 留言：0更新日期：2022-12-01 14:33

本发明专利技术公开了一种基于联合感知损失的注意力生成对抗语音增强的方法。所述方法包括以下步骤：步骤1：训练数据预处理：对训练数据进行重采样、分帧加窗，短时傅里叶变换，获取训练数据的幅度谱特征；步骤2：构建模型并训练：构建基于联合感知损失函数的注意力生成对抗语音增强模型，设定合理的训练参数，并对其进行训练；步骤3：测试模型：预处理带噪语音测试集，利用上述训练完成的语音增强模型对其进行去噪与增强，并保存结果，完成语音增强任务。利用本发明专利技术，可以在不显著增加模型参数和计算开销的情况下显著提高带噪语音信号的语音质量和可懂度。可懂度。可懂度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于联合感知损失的注意力生成对抗语音增强方法

[0001]本专利技术涉及语音信号处理的语音增强
，尤其涉及了一种基于联合感知损失的注意力生成对抗语音增强方法。

技术介绍

[0002]语音是人类最重要的交流工具，是人们所使用的最古老、最普遍的通信方式，它有着自然方便、高效准确的优点，但是在现实生活中语音往往会被各种各样的噪声影响而造成失真，这些噪声会不同程度地影响语音质量，从而导致语音可懂度下降。
[0003]为了解决这个问题，许多基于信号处理的方法被提出，如谱减法、子空间法、维纳滤波法等。近几年，研究界见证了传统信号处理方法到数据驱动增强方法的转变，尤其是基于深度学习的方法。深度学习中典型的神经网络模型有递归神经网络（RNN）、长短期记忆网络（LSTM）、卷积神经网络（CNN）、全卷积网络（FCN）、卷积递归神经网络（CRNN）、生成对抗网络（GAN）。与传统的基于信号处理的语音增强方法相比，深度学习方法的语音增强性能有了显著的提高。
[0004]深度学习语音增强算法的性能主要和四个因素密切相关。即：输入特征，训练目标，网络结构，损失函数。要部署特定任务的语音增强模型，最直观的方法是采用与最终目标相关的损失函数，而当前很多基于生成对抗网络的语音增强模型，其指导生成器生成数据的对抗性损失所用参数（频谱）与语音质量评价所用参数（STOI）不匹配，从而限制了增强模型对语音质量与语音可懂度的提升性能。
[0005]在语音增强领域MetricGAN显示出强大的能力，其被证明可以有效地优化复杂甚...

【技术保护点】

【技术特征摘要】
1.一种基于联合感知损失的注意力生成对抗语音增强方法，其特征在于，包括以下步骤：步骤1：训练数据预处理，提取语音幅度谱特征：对训练数据进行重采样、分帧加窗，短时傅里叶变换，获取训练数据的幅度谱特征；步骤2：构建模型并训练：构建基于联合感知损失函数的注意力生成对抗语音增强模型，设定合理的训练参数，并对其进行训练；步骤3：测试模型：预处理带噪语音测试集，利用上述训练完成的基于联合感知损失函数的注意力生成对抗语音增强模型对其进行去噪与增强，并保存结果，完成语音增强任务。2.根据权利要求1所述的一种基于联合感知损失的注意力生成对抗语音增强方法，其特征在于所述的步骤1训练数据预处理：对训练数据以16000HZ频率重采样，分帧加窗，短时傅里叶变换，提取语音的幅度谱特征作为语音增强模型的输入。3.根据权利要求1所述的一种基于联合感知损失的注意力生成对抗语音增强方法，其特征在于，所述的步骤2中基于联合感知损失函数的注意力生成对抗语音增强模型由两个深度神经网络模型构建，分别是生成器模型G和判别器模型D：生成器模型G使用BLSTM网络对输入带噪语音的幅度谱特征进行特征掩蔽，获得去除噪声分量后的语音幅度谱特征；判别器模型D使用CNN网络对生成器模型G生成语音的增强效果进行量化估计；为进一步提升判别器模型D预测目标度量的能力，在模型中使用SK
‑
Net卷积注意力模块，使网络可以根据输入信息的多个尺度自适应地调节感受野大小，以此提升网络模型的表达能力，更加准确预测目标度量的分数。4.根据权利要求3所述的一种基于联合感知损失的注意力生成对抗语音增强方法，其特征在于，所述联合感知损失是作用在生成器模型G中；其由两部分构成，一部分是生成对抗网络的对抗性损失，通过使用判别器D模拟PESQ的行为，获得语音质量的损失；另一部分是使用STOI损失，用来代表语音可懂度的损失；基于联合感知损失的注意力生成对抗语音增强模型的两个深度神经网络模型通过联合训练方式进行训练，将带噪语音的幅度谱特征输入生成器模型G，通过判别器模型D获得预测PESQ的分数，通过使用STOI函数获得STOI的分数，并将上述两种分数用于指导生成器模型G的训练，判别器模型D和生成器模型G的损失函数分别为：函数分别为：函数分别为：其中代表带噪语...

【专利技术属性】
技术研发人员：郭创建，黄志华，李慧，
申请(专利权)人：新疆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人