激活音检测及用于激活音检测的方法和装置制造方法及图纸

技术编号:10170229 阅读:113 留言:0更新日期:2014-07-02 11:54
本发明专利技术涉及一种激活音检测(VAD)及用于激活音检测的方法和装置,该方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的帧能量参数和谱重心特征参数的值;根据前一帧估计得到的背景噪声能量、当前帧的帧能量参数及信噪比子带能量计算得到当前帧的信噪比参数;根据调性标志、信噪比参数、谱重心特征参数、帧能量参数计算得到VAD判决结果。本发明专利技术方法和装置可提高不稳定噪声(如办公室噪声)和音乐检测的准确率。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种激活音检测(VAD)及用于激活音检测的方法和装置,该方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的帧能量参数和谱重心特征参数的值;根据前一帧估计得到的背景噪声能量、当前帧的帧能量参数及信噪比子带能量计算得到当前帧的信噪比参数;根据调性标志、信噪比参数、谱重心特征参数、帧能量参数计算得到VAD判决结果。本专利技术方法和装置可提高不稳定噪声(如办公室噪声)和音乐检测的准确率。【专利说明】激活音检测及用于激活音检测的方法和装置
本专利技术涉及一种激活音检测(VAD)及用于激活音检测的方法(包括背景噪声检测、调性信号检测、VAD判决中当前帧激活音保持帧数的修正、VAD判决中信噪比门限的调整等方法)和装置。
技术介绍
正常的语音通话中,用户有时在说话,有时在听,这个时候就会在通话过程出现非激活音阶段,正常情况下通话双方总的非语音激活阶段要超过通话双方总的语音编码时长的50%。在非激活音阶段,只有背景噪声,背景噪声通常没有任何有用信息。利用这一事实,在语音频信号处理过程中,通过激活音检测(VAD)算法检测出于激活音和非激活音,并采用不同的方法分别进行处理。现代的很多语音编码标准,如AMR,AMR-WB,都支持VAD功能。在效率方面,这些编码器的VAD并不能在所有的典型背景噪声下都达到很好的性能。特别是在非稳定噪声下,这些编码器的VAD效率都较低。而对于音乐信号,这些VAD有时候会出现错误检测,导致相应的处理算法出现明显的质量下降。
技术实现思路
本专利技术要解决的技术问题是提供一种激活音检测(VAD)及用于激活音检测的方法(包括背景噪声检测、调性信号检测、VAD判决中当前激活音保持帧数的修正、VAD判决中信噪比门限的调整等方法)和装置,以提高VAD检测的准确率。为解决上述技术问题,本专利技术提供了一种激活音检测(VAD)方法,该方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的帧能量参数、谱重心特征参数和时域稳定度特征参数的值;根据频谱幅值计算得到谱平坦度特征参数和调性特征参数的值;根据前一帧估计得到的背景噪声能量、当前帧的帧能量参数及信噪比子带能量计算得到当前帧的信噪比参数;根据当前帧帧能量参数、谱重心特征参数、时域稳定度特征参数、谱平坦度特征参数、调性特征参数计算得到当前巾贞的调性标志;根据调性标志、信噪比参数、谱重心特征参数、帧能量参数计算得到VAD判决结果O为解决上述技术问题,本专利技术提供了一种激活音检测(VAD)装置,该装置包括:滤波器组,用于获得当前帧的子带信号;频谱幅值计算单元,用于获得当前帧的频谱幅值;特征参数获取单元,用于根据子带信号计算得到当前帧的帧能量参数、谱重心特征参数和时域稳定度特征参数的值;根据频谱幅值计算得到谱平坦度特征参数和调性特征参数的值;标志计算单元,用于根据当前帧帧能量参数、谱重心特征参数、时域稳定度特征参数、谱平坦度特征参数、调性特征参数计算得到当前帧的调性标志;信噪比计算单元,用于根据前一帧估计得到的背景噪声能量、当前帧的帧能量参数及信噪比子带能量计算得到当前帧的信噪比参数;VAD判决单元,用于根据调性标志、信噪比参数、谱重心特征参数、帧能量参数计算得到VAD判决结果。为解决上述技术问题,本专利技术提供了一种背景噪声检测方法,该方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到的帧能量参数、谱重心特征参数、时域稳定度特征参数的值,根据频谱幅值计算得到谱平坦度特征参数和调性特征参数的值;根据谱重心特征参数、时域稳定度特征参数、谱平坦度特征参数、调性特征参数、当前帧能量参数进行背景噪声检测,判断当前帧是否为背景噪声。为解决上述技术问题,本专利技术提供了一种背景噪声检测装置,该装置包括:滤波器组,用于获得当前帧的子带信号;频谱幅值计算单元,用于获得当前帧的频谱幅值;特征参数计算单元,用于根据子带信号计算得到的帧能量参数、谱重心特征参数、时域稳定度特征参数的值,根据频谱幅值计算得到谱平坦度特征参数和调性特征参数的值;背景噪声判断单元,用于根据谱重心特征参数、时域稳定度特征参数、谱平坦度特征参数、调性特征参数、当前帧能量参数进行背景噪声检测,判断当前帧是否为背景噪声。为解决上述技术问题,本专利技术提供了一种调性信号检测方法,该方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到谱重心特征参数、时域稳定度特征参数的值,根据频谱幅值计算得到谱平坦度特征参数和调性特征参数的值;根据调性特征参数、时域稳定度特征参数、谱平坦度特征参数、谱重心特征参数、判断当前帧是否为调性信号。为解决上述技术问题,本专利技术提供了一种调性信号检测装置,该检测装置包括:滤波器组,用于获得当前帧的子带信号;频谱幅值计算单元,用于获得当前帧的频谱幅值;特征参数计算单元,根据在子带信号计算得到谱重心特征参数、时域稳定度特征参数的值,根据频谱幅值计算得到谱平坦度特征参数和调性特征参数的值;调性信号判断单元,用于根据调性特征参数、时域稳定度特征参数、谱平坦度特征参数、谱重心特征参数判断当前帧是否为调性信号。为解决上述技术问题,本专利技术提供了一种VAD判决中当前帧激活音保持帧数的修正方法,该方法包括:计算得到长时信噪比lt_snr和平均全带信噪比SNR2_lt_ave ;根据前面若干帧的判决结果、长时信噪比lt_snr、平均全带信噪比SNR2_lt_ave、当前帧的信噪比和当前帧的VAD判决结果,对当前激活音保持帧数进行修正。为解决上述技术问题,本专利技术提供了一种VAD判决中当前激活音保持帧数的修正装置,该修正装置包括:长时信噪比计算单元,用于计算长时信噪比lt_snr ;平均全带信噪比计算单元,用于计算平均全带信噪比SNR2_lt_ave ;激活音保持帧数修正单元,用于根据前面若干帧的判决结果、长时信噪比lt_snr、平均全带信噪比SNR2_lt_ave、当前帧的信噪比参数和当前帧的VAD判决结果,对当前激活音保持帧数进行修正。为解决上述技术问题,本专利技术提供了一种VAD判决中信噪比门限的调整方法,该调整方法包括:根据子带信号计算得到当前帧的谱重心特征参数;计算前一帧计算得到的平均长时激活音信号能量和平均长时背景噪声能量的比值,得到长时信噪比lt_snr;根据谱重心特征参数、长时信噪比、前面连续激活音帧个数和前面连续噪声帧个数continuous_noise_num调整VAD判决的信噪比门限。为解决上述技术问题,本专利技术提供了一种VAD判决中信噪比门限的调整装置,该调整装置包括:特征参数获取单元,用于根据子带信号计算得到当前帧的谱重心特征参数;长时信噪比计算单元,用于计算前一帧计算得到的平均长时激活音信号能量和平均长时背景噪声能量的比值,得到长时信噪比lt_snr ;信噪比门限调整单元,用于根据谱重心特征参数、长时信噪比、前面连续激活音帧个数和前面连续噪声巾贞个数continuous_noise_num调整VAD判决的信噪比门限。本专利技术方法和装置克服了既有VAD算法的缺点,在提高VAD对不稳定噪声检测效率的同时也提高音乐检测的准确率。使得采用本VAD的语音频信号处理算法可以得到更好的性能。【专利附图】【附图说明】图1为本专利技术激活音检测方法实施例1的示本文档来自技高网...

【技术保护点】
一种激活音检测(VAD)方法,其特征在于,该方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的帧能量参数、谱重心特征参数和时域稳定度特征参数的值;根据频谱幅值计算得到谱平坦度特征参数和调性特征参数的值;根据前一帧估计得到的背景噪声能量、当前帧的帧能量参数及信噪比子带能量计算得到当前帧的信噪比参数;根据当前帧帧能量参数、谱重心特征参数、时域稳定度特征参数、谱平坦度特征参数、调性特征参数计算得到当前帧的调性标志;根据调性标志、信噪比参数、谱重心特征参数、帧能量参数计算得到VAD判决结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:江东平袁浩朱长宝
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1