混响语音信号中后混响功率谱的自适应估计方法及装置制造方法及图纸

技术编号:20162416 阅读:18 留言:0更新日期:2019-01-19 00:15
本发明专利技术提供了一种混响语音信号中后混响功率谱的自适应估计方法及装置,涉及语音信号处理领域。该混响语音信号中后混响功率谱的自适应估计方法,包括:获取麦克风拾取的混响语音信号的子带自功率谱的估计;获取用于所述混响语音信号中后混响子带自功率谱估计的延时的线性预测DLP预测系数矢量;根据所述混响语音信号的子带自功率谱的估计和DLP预测系数矢量,获取后混响子带自功率谱估计。上述方案,通过利用延时的线性预测DLP预测系数矢量来进行后混响子带自功率谱估计的获取,可以保证语音信号去混响的有效性,降低了去混响的难度,提高了去混响的效率。

【技术实现步骤摘要】
混响语音信号中后混响功率谱的自适应估计方法及装置
本专利技术涉及语音信号处理领域,特别涉及一种混响语音信号中后混响功率谱的自适应估计方法及装置。
技术介绍
在远场情况下,室内麦克风拾取的语音信号,由于不可避免地受到来自于室内墙壁、顶部天花板和其它障碍物反射信号的干扰,因而会发生线性奇变。这种奇变通常称之为混响,它将退化语音的保真度和可懂度,使得语音通信系统和语音自动识别系统的性能下降;并且,这种退化程度随着声源和麦克风间距离的增加而增大。混响通常由早期混响(即前混响,包含直达声成分)和后期混响(即后混响)组成,业已证明,前者实际上有益于改善语音的可懂度和噪声环境中的信噪比(SignaltoNoiseRatio,SNR),而后者则加长了声源语音信号音素的长度,由此重叠屏蔽了其后续的音素,从而降低了语音的可懂度。现有的语音信号去混响技术存在实际产品的成本高和结构设计困难、去混响性能受限或耗费较多的计算资源的问题。
技术实现思路
本专利技术实施例提供一种混响语音信号中后混响功率谱的自适应估计方法及装置,以解决现有的语音信号去混响技术存在实际产品的成本高和结构设计困难、去混响性能受限或耗费较多的计算资源,不能有效保证语音信号去混响的问题。为了解决上述技术问题,本专利技术实施例提供一种混响语音信号中后混响功率谱的自适应估计方法,包括:获取麦克风拾取的混响语音信号的子带自功率谱的估计;获取用于所述混响语音信号中后混响子带自功率谱估计的延时的线性预测DLP预测系数矢量;根据所述混响语音信号的子带自功率谱的估计和DLP预测系数矢量,获取后混响子带自功率谱估计。可选地,当所述麦克风为单麦克风时,所述获取麦克风拾取的混响语音信号的子带自功率谱的估计,包括:根据公式:获取混响语音信号的子带自功率谱的估计;其中,为第t帧第k个子带的混响语音信号的子带自功率谱的估计;λ为预设的平滑常数,且0<λ<1;为第t-1帧第k个子带的混响语音信号的子带自功率谱的估计;X(t,k)为第t帧第k个子带的混响语音信号的子带谱;t为信号帧的时间索引,k为子带索引。进一步地,所述获取用于所述混响语音信号中后混响子带自功率谱估计的延时的线性预测DLP预测系数矢量,包括:根据公式:获取DLP预测系数矢量;其中,为第t+1帧子带k上的DLP预测系数矢量;为第t帧子带k上的DLP预测系数矢量,且为第t-Ds帧第k个子带的混响语音信号的子带自功率谱矢量,Q为DLP的系数个数,且Q=Rs-Ds,R为室内冲击响应的长度,N为子带变换的语音信号帧的长度,Dc为前混响和后混响区分的临界点;μ和β为正常数,且0<μ(1+β)<2;Ek(t)为预测误差,且为第t帧第k个子带的混响语音信号的子带自功率谱的估计;t为信号帧的时间索引,k为子带索引,T为矢量的转置运算符。进一步地,所述根据所述混响语音信号的子带自功率谱的估计和DLP预测系数矢量,获取后混响子带自功率谱估计,包括:根据公式:获取后混响子带自功率谱估计;其中,为后混响子带自功率谱估计;为第t帧子带k上的DLP预测系数矢量,且Wτ(t,k)为第t帧第k个子带的DLP第τ个预测系数,τ=0,1,2,...,Q-1,Q为DLP的系数个数,且Q=Rs-Ds,R为室内冲击响应的长度,N为子带变换的语音信号帧的长度,Dc为前混响和后混响区分的临界点;为第t-Ds帧第k个子带的混响语音信号的子带自功率谱矢量,为第t-τ-Ds帧第k个子带的混响语音信号的子带自功率谱的估计;t为信号帧的时间索引,k为子带索引,T为矢量的转置运算符。可选地,当所述麦克风为麦克风阵列时,所述获取麦克风拾取的混响语音信号的子带自功率谱的估计,包括:获取麦克风阵列拾取的混响语音信号经空间滤波处理后的单声道输出信号的子带谱;根据所述单声道输出信号的子带谱,获取混响语音信号经空间滤波处理后的单声道输出信号的子带自功率谱的估计。进一步地,所述获取麦克风阵列拾取的混响语音信号经空间滤波处理后的单声道输出信号的子带谱,包括:根据公式:获取混响语音信号经空间滤波处理后的单声道输出信号的子带谱;其中,Z(t,k)为第t帧第k个子带的经空间滤波处理后的单声道输出信号的子带谱;Xr(t,k)为第t帧第k个子带的第r个麦克风输出信号的子带谱;M为麦克风阵列的总个数;t为信号帧的时间索引,k为子带索引。进一步地,所述根据所述单声道输出信号的子带谱,获取混响语音信号经空间滤波处理后的单声道输出信号的子带自功率谱的估计,包括:根据公式:获取经空间滤波处理后的单声道输出信号的子带自功率谱的估计;其中,为第t帧第k个子带的经空间滤波处理后的单声道输出信号的子带自功率谱的估计;为第t-1帧第k个子带的经空间滤波处理后的单声道输出信号的子带自功率谱的估计;λ为预设的平滑常数,且0<λ<1;Z(t,k)为第t帧第k个子带的经空间滤波处理后的单声道输出信号的子带谱;t为信号帧的时间索引,k为子带索引。进一步地,所述获取用于所述混响语音信号中后混响子带自功率谱估计的延时的线性预测DLP预测系数矢量,包括:根据公式:获取用于所述混响语音信号经空间滤波处理后的单声道输出信号中后混响子带自功率谱估计的DLP预测系数矢量;其中,为第t+1帧子带k上的DLP预测系数矢量;为第t帧子带k上的DLP预测系数矢量,且为第t-Ds帧第k个子带的混响语音信号的子带自功率谱矢量,Q为DLP的系数个数,且Q=Rs-Ds,R为室内冲击响应的长度,N为子带变换的语音信号帧的长度,Dc为前混响和后混响区分的临界点;μ和β为正常数,且0<μ(1+β)<2;Ek(t)为预测误差,且为第t帧第k个子带的经空间滤波处理后单声道输出信号的子带自功率谱的估计;t为信号帧的时间索引,k为子带索引,T为矢量的转置运算符。进一步地,所述根据所述子带自功率谱的估计和DLP预测系数,获取后混响子带自功率谱估计,包括:根据公式:获取后混响子带自功率谱估计;其中,为后混响子带自功率谱估计;为第t帧子带k上的DLP预测系数矢量,且Wτ(t,k)为第t帧第k个子带的DLP第τ个预测系数,τ=0,1,2,...,Q-1,Q为DLP的系数个数,且Q=Rs-Ds,R为室内冲击响应的长度,N为子带变换的语音信号帧的长度,Dc为前混响和后混响区分的临界点;为第t-Ds帧第k个子带的混响语音信号的子带自功率谱矢量,为第t-τ-Ds帧第k个子带的空间滤波处理后单声道输出信号的子带自功率谱的估计;t为信号帧的时间索引,k为子带索引,T为矢量的转置运算符。本专利技术实施例还提供一种混响语音信号中后混响功率谱的自适应估计装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其中,所述处理器执行所述计算机程序时实现以下步骤:获取麦克风拾取的混响语音信号的子带自功率谱的估计;获取用于所述混响语音信号中后混响子带自功率谱估计的延时的线性预测DLP预测系数矢量;根据所述混响语音信号的子带自功率谱的估计和DLP预测系数矢量,获取后混响子带自功率谱估计。可选地,当所述麦克风为单麦克风时,所述处理器执行所述计算机程序时实现以下步骤:根据公式:获取混响语音信号的子带自功率谱的估计;其中,为第t帧第k个子带的混响语音信号的子带自功率谱的估计;λ为预设的平滑常数,且0<本文档来自技高网...

【技术保护点】
1.一种混响语音信号中后混响功率谱的自适应估计方法,其特征在于,包括:获取麦克风拾取的混响语音信号的子带自功率谱的估计;获取用于所述混响语音信号中后混响子带自功率谱估计的延时的线性预测DLP预测系数矢量;根据所述混响语音信号的子带自功率谱的估计和DLP预测系数矢量,获取后混响子带自功率谱估计。

【技术特征摘要】
1.一种混响语音信号中后混响功率谱的自适应估计方法,其特征在于,包括:获取麦克风拾取的混响语音信号的子带自功率谱的估计;获取用于所述混响语音信号中后混响子带自功率谱估计的延时的线性预测DLP预测系数矢量;根据所述混响语音信号的子带自功率谱的估计和DLP预测系数矢量,获取后混响子带自功率谱估计。2.根据权利要求1所述的混响语音信号中后混响功率谱的自适应估计方法,其特征在于,当所述麦克风为单麦克风时,所述获取麦克风拾取的混响语音信号的子带自功率谱的估计,包括:根据公式:获取混响语音信号的子带自功率谱的估计;其中,为第t帧第k个子带的混响语音信号的子带自功率谱的估计;λ为预设的平滑常数,且0<λ<1;为第t-1帧第k个子带的混响语音信号的子带自功率谱的估计;X(t,k)为第t帧第k个子带的混响语音信号的子带谱;t为信号帧的时间索引,k为子带索引。3.根据权利要求2所述的混响语音信号中后混响功率谱的自适应估计方法,其特征在于,所述获取用于所述混响语音信号中后混响子带自功率谱估计的延时的线性预测DLP预测系数矢量,包括:根据公式:获取DLP预测系数矢量;其中,为第t+1帧子带k上的DLP预测系数矢量;为第t帧子带k上的DLP预测系数矢量,且为第t-Ds帧第k个子带的混响语音信号的子带自功率谱矢量,Q为DLP的系数个数,且Q=Rs-Ds,R为室内冲击响应的长度,N为子带变换的语音信号帧的长度,Dc为前混响和后混响区分的临界点;μ和β为正常数,且0<μ(1+β)<2;Ek(t)为预测误差,且为第t帧第k个子带的混响语音信号的子带自功率谱的估计;t为信号帧的时间索引,k为子带索引,T为矢量的转置运算符。4.根据权利要求2所述的混响语音信号中后混响功率谱的自适应估计方法,其特征在于,所述根据所述混响语音信号的子带自功率谱的估计和DLP预测系数矢量,获取后混响子带自功率谱估计,包括:根据公式:获取后混响子带自功率谱估计;其中,为后混响子带自功率谱估计;为第t帧子带k上的DLP预测系数矢量,且Wτ(t,k)为第t帧第k个子带的DLP第τ个预测系数,τ=0,1,2,…,Q-1,Q为DLP的系数个数,且Q=Rs-Ds,R为室内冲击响应的长度,N为子带变换的语音信号帧的长度,Dc为前混响和后混响区分的临界点;为第t-Ds帧第k个子带的混响语音信号的子带自功率谱矢量,为第t-τ-Ds帧第k个子带的混响语音信号的子带自功率谱的估计;t为信号帧的时间索引,k为子带索引,T为矢量的转置运算符。5.根据权利要求1所述的混响语音信号中后混响功率谱的自适应估计方法,其特征在于,当所述麦克风为麦克风阵列时,所述获取麦克风拾取的混响语音信号的子带自功率谱的估计,包括:获取麦克风阵列拾取的混响语音信号经空间滤波处理后的单声道输出信号的子带谱;根据所述单声道输出信号的子带谱,获取混响语音信号经空间滤波处理后的单声道输出信号的子带自功率谱的估计。6.根据权利要求5所述的混响语音信号中后混响功率谱的自适应估计方法,其特征在于,所述获取麦克风阵列拾取的混响语音信号经空间滤波处理后的单声道输出信号的子带谱,包括:根据公式:获取混响语音信号经空间滤波处理后的单声道输出信号的子带谱;其中,Z(t,k)为第t帧第k个子带的经空间滤波处理后的单声道输出信号的子带谱;Xr(t,k)为第t帧第k个子带的第r个麦克风输出信号的子带谱;M为麦克风阵列的总个数;m=1,2,…,M;t为信号帧的时间索引,k为子带索引。7.根据权利要求5所述的混响语音信号中后混响功率谱的自适应估计方法,其特征在于,所述根据所述单声道输出信号的子带谱,获取混响语音信号经空间滤波处理后的单声道输出信号的子带自功率谱的估计,包括:根据公式:获取经空间滤波处理后的单声道输出信号的子带自功率谱的估计;其中,为第t帧第k个子带的经空间滤波处理后的单声道输出信号的子带自功率谱的估计;为第t-1帧第k个子带的经空间滤波处理后的单声道输出信号的子带自功率谱的估计;λ为预设的平滑常数,且0<λ<1;Z(t,k)为第t帧第k个子带的经空间滤波处理后的单声道输出信号的子带谱;t为信号帧的时间索引,k为子带索引。8.根据权利要求5所述的混响语音信号中后混响功率谱的自适应估计方法,其特征在于,所述获取用于所述混响语音信号中后混响子带自功率谱估计的延时的线性预测DLP预测系数矢量,包括:根据公式:获取用于所述混响语音信号经空间滤波处理后的单声道输出信号中后混响子带自功率谱估计的DLP预测系数矢量;其中,为第t+1帧子带k上的DLP预测系数矢量;为第t帧子带k上的DLP预测系数矢量,且为第t-Ds帧第k个子带的混响语音信号的子带自功率谱矢量,Q为DLP的系数个数,且Q=Rs-Ds,R为室内冲击响应的长度,N为子带变换的语音信号帧的长度,Dc为前混响和后混响区分的临界点;μ和β为正常数,且0<μ(1+β)<2;Ek(t)为预测误差,且为第t帧第k个子带的经空间滤波处理后单声道输出信号的子带自功率谱的估计;t为信号帧的时间索引,k为子带索引,T为矢量的转置运算符。9.根据权利要求5所述的混响语音信号中后混响功率谱的自适应估计方法,其特征在于,所述根据所述子带自功率谱的估计和DLP预测系数,获取后混响子带自功率谱估计,包括:根据公式:获取后混响子带自功率谱估计;其中,为后混响子带自功率谱估计;为第t帧子带k上的DLP预测系数矢量,且Wτ(t,k)为第t帧第k个子带的DLP第τ个预测系数,τ=0,1,2,…,Q-1,Q为DLP的系数个数,且Q=Rs-Ds,R为室内冲击响应的长度,N为子带变换的语音信号帧的长度,Dc为前混响和后混响区分的临界点;为第t-Ds帧第k个子带的混响语音信号的子带自功率谱矢量,为第t-τ-Ds帧第k个子带的空间滤波处理后单声道输出信号的子带自功率谱的估计;t为信号帧的时间索引,k为子带索引,T为矢量的转置运算符。10.一种混响语音信号中后混响功率谱的自适应估计装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其特征在于,所述处理器执行所述计算机程序时实现以下步骤:获取麦克风拾取的混响语音信号的子带自功率谱的估计;获取用于所述混响语音信号中后混响子带自功率谱估计的延时的线性预测DLP预测系数矢量;根据所述混响语音信号的子带自功率谱的估计和DLP预测系数矢量,获取后混响子带自功率谱估计。11.根据权利要求10所述的混响语音信号中后混响功率谱的自适应估计装置,其特征在于,当所述麦克风为单麦克风时,所述处理器执行所述计算机程序时实现以下步骤:根据公式:获取混响语音信号的子带自功率谱的估计;其中,为第t帧第k个子带的混响语音信号的子带自功率谱的估计;λ为预设的平滑常数,且0<λ<1;为第t-1帧第k个子带的混响语音信号的子带自功率谱的估计;X(t,k)为第t帧第k个子带的混响语音信号的子带谱;t为信号帧的时间索引,k为子带索引。12.根据权利要求11所述的混响语音信号中后混响功率谱的自适应估计装置,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:根据公式:获取DLP预测系数矢量;其中,为第t+1帧子带k上的DLP预测系数矢量;为第t帧子带k上的DLP预测系数矢量,且为第t-Ds帧第k个子带的混响语音信号的子带自功率谱矢量,Q为DLP的系数个数,且Q=Rs-Ds,R为室内冲击响应的长度,N为子带变换的语音信号帧的长度,Dc为前混响和后混响区分的临界点;μ和β为正常数,且0<μ(1+β)<2;Ek(t)为预测误差,且为第t帧第k个子带的混响语音信号的子带自功率谱的估计;t为信号帧的时间索引,k为子带索引,T为矢量的转置运算符。13.根据权利要求11所述的混响语音信号中后混响功率谱的自适应估计装置,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:根据公式:获取后混响子带自功率谱估计;其中,为后混响子带自功率谱估计;为第t帧子带k上的DLP预测系数矢量,且Wτ(t,k)为第t帧第k个子带的DLP第τ个预测系数,τ=0,1,2,…,Q-1,Q为DLP的系数个数,且Q=Rs-Ds,R为室内冲击响应的长度,N为子带变换的语音信号帧的长度,Dc为前混响和后混响区分的临界点;为第t-Ds帧第k个子带的混响语音信号的子带自功率谱矢量,为第t-τ-Ds帧第k个子带的混响语音信号的子带自功率谱的估计;t为信号帧的时间索引,k为子带索引,T为矢量的转置运算符。14.根据权利要求10所述的混响语音信号中后混响功率谱的自适应估计装置,其特征在于,当所述麦克风为麦克风阵列时,所述处理器执行所述计算机程序时实现以下步骤...

【专利技术属性】
技术研发人员:梁民
申请(专利权)人:电信科学技术研究院有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1