一种基于只包含编码器的多头注意力机制的语音增强算法制造技术

技术编号：33953697 阅读：14 留言：0更新日期：2022-06-29 23:00

本发明专利技术涉及一种基于无解码的多头注意力机制的语音增强算法的设计方法，涉及语音信号处理技术领域。本发明专利技术针对当前现有的注意力机制语音增强算法，提出了一种只包含编码器结构，不包含解码器结构的特征提取方法，并且应用带掩模多头注意力机制使算法对实时因果性语音更加有效。该方法能够缩短模型训练时间并有效抑制带噪语音信号中的噪声部分并增强语音部分，体现出良好的增强性能。体现出良好的增强性能。体现出良好的增强性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于只包含编码器的多头注意力机制的语音增强算法

[0001]本专利技术涉及一种基于无解码的多头注意力机制的语音增强算法的设计方法，属于语音信号处理

技术介绍

[0002]音增强技术作为语音识别、语音通信等语音处理的前置技术，在语音通话、广播、线上会议等有着广泛的应用。语音增强任务的目的是将带噪语音信号中的噪声部分抑制的同时增强语音部分，获得干净的语音信号。当前随着智能终端、远程会议的普及，在线语音更加成为了人们交流的一种方式，而录制环境的噪音干扰会严重影响语音信号的质量，特别是街头车辆噪声、周围人语声、音乐声等能量不规律的复杂环境噪声，对语音增强技术提出了高要求。
[0003]随着计算机技术的发展，传统语音增强技术已逐步被机器学习算法所取代，且在增强效果方面有了很大的提高。自从注意力机制的神经网络模型提出之后，由于其对长序列适用性强于其他结构的神经网络，注意力机制已被自然语言处理、图像识别、音频处理等各种领域所广泛应用。
[0004]众所周知神经网络模型的部分取决于用于训练网络的样本数量，在一定程度下样本种类数量越多网络越具备适用性。如何借助注意力机制的网络模型实现语音较好的增强效果同时，缩短大样本下的训练时间，且更加适用于处理语音这类具备因果特征的任务，是本专利技术所解决的问题。

技术实现思路

[0005]本专利技术的目的在于针对现有技术存在的问题，提出一种基于只包含编码器的多头注意力机制的语音增强算法，能够降低注意力机制应用在语音增强领域的训练时长，并提高增强效果。<...

【技术保护点】

【技术特征摘要】
1.一种基于只包含编码器的多头注意力机制的语音增强方法，其特征在于：所述方法包括以下设计步骤：步骤1：构建训练数据，提取数据幅度谱和相位谱特征；步骤2：对数据进行预处理，计算模型的输入参数；步骤3：构建基于无解码的多头注意力机制的语音增强算法网络模型；步骤4：将步骤2处理好的数据输入网络模型进行训练；步骤5：将待增强语音信号输入由步骤4训练好的网络模型进行预测，输出先验信噪比估计值；步骤6：将步骤5得到的先验信噪比估计值应用对数最小均方误差估计算法，计算增益函数，结合输入数据的相位谱特征重构语音信号。2.根据权利要求1所述的基于只包含编码器的多头注意力机制的语音增强算法，其特征在于：步骤1的具体内容为：步骤1.1：使用的采样频率为16kHz的干净语音数据和噪声数据，随机配对后以随机信噪比混合，混合信噪比取
‑
10dB，
‑
5dB，0dB，5dB，10dB其中的随机一种，产生带噪语音数据；步骤1.2：借助短时傅里叶变换提取干净语音数据和带噪语音数据的幅度谱特征，以产生用于训练网络模型的数据对。3.根据权利要求2所述的基于只包含编码器的多头注意力机制的语音增强算法，其特征在于：步骤1.2中，短时傅里叶变换选择帧长等于512个采样点，帧移等于256个采样点，产生512个点的傅里叶变换值，经过变换后获得257个维度的特征。4.根据权利要求1所述的基于只包含编码器的多头注意力机制的语音增强算法，其特征在于：所述步骤2中，需要对数据进行预处理，产生网络模型的输入数据；所述网络模型的输入有三个，一是经过短时傅里叶变换提取的带噪语音数据的幅度谱特征X(n,k)，二是后验信噪比ξ(n,k)，三是帧掩模mask(n)。5.根据权利要求4所述的基于只包含编码器的多头注意力机制的语音增强算法，其特征在于：所述步骤2中，预处理的步骤为：首先通过短时傅里叶变换提取的带噪语音数据的幅度谱特征；其次用于混合的噪声数据经短时傅里叶变换得到的幅度谱和带噪语音数据的幅度谱计算后验信噪比；再用0和1补长不同帧长的输入数据得到帧掩模。6.根据权利要求4所述的基于只包含编码器的多头注意力机制的语音增强算法，其特征在于：所述经过短时傅里叶变换提取的带噪语音数据的幅度谱特征X(n,k)和后验信噪比ξ(n,k)为一组大小为R∈N
×
K的二维序列，帧掩模为一组长度为N的一维序列；其中，n代表帧，对应N为最大帧数，k代表频点，对应K代表最大频点数即257，mask(n)仅...

【专利技术属性】
技术研发人员：邵曦，顾天麒，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人