本发明专利技术公开了一种实现通信系统中背景噪声的跟踪的方法和装置,属于通信领域。所述方法包括:根据输入的音频信号,计算当前帧的信噪比;若当前帧的信噪比不大于门限1,则累加帧计数器,并计算当前帧的音调特征以及信号稳定性特征;当帧计数器累加至时间窗口长度时,则根据计算得到的时间窗口各帧的音调特征值和信号稳定性特征值,判断出时间窗口中含有噪声区间的可能性大小,并进而提取时间窗口的噪声特征。通过连续的在一定长度的时间窗口中分析背景噪声的存在性,可以快速的检测或跟踪变化频繁且剧烈的背景噪声。同时,通过对音调特征,频谱峰值位置稳定性和最大峰谷比位置稳定性的检测显著的降低了发生在音乐信号的背景噪声误跟踪现象。
【技术实现步骤摘要】
本专利技术涉及通信领域,特别涉及一种实现通信系统中背景噪声的跟踪的方法和装置。
技术介绍
在语音通信系统中,通过VAD (Voice Activity Detection,语音激活检测)技术, 可以获知语音何时是激活状态,从而可以实现只在激活状态传输信号,有效地节约带宽资 源。另外,由于语音通信系统中,说话人输入给终端的语音信号中通常都夹带有背景噪声, 通过NS(Noise Suppression,噪声抑制)技术,可以有效降低或者抑制语音中夹带的背景 噪声,显著改善听者的主观感受。在语音激活检测VAD中,区别当前信号是语音还是非语音,本质上是看当前信号 的特征是更接近背景噪声的特征还是更接近语音的特征,更接近的一方则为当前信号的类 别。在噪声抑制NS中,为了削弱背景噪声对语音的影响,也需要知道当前背景噪声的某些 特征,这样才能把这些特征从语音信号中去除掉,从而达到抑制噪声的目的。于是无论是语 音激活检测VAD还是噪声抑制NS,都要涉及到一个关键的技术,即背景噪声跟踪。目前,广泛使用的背景噪声跟踪技术是AMR(Audio/Modem Riser,声音/调制解调 器插卡)VAD2中所用的背景噪声跟踪技术。该技术首先计算当前帧的SNR(Signal to Noise Ratio,信噪比),如果SNR较小,小于背景噪声门限,则当前帧就被确认为是背景噪声帧;否 则检测当前帧的基音和音调(tone)特征,如果当前帧具有基音和音调的特征,则将滞后计 数器加1,否则进一步计算当前帧与其之前相邻若干帧的谱波动大小,如果当前帧的谱波动 较大,大于一个门限,则认为当前帧可能不是噪声帧且将滞后计数器加1,否则认为当前帧 可能是噪声帧且将连续噪声帧计数器加1。如果连续噪声帧计数器达到了 50帧,则可确认 当前帧应为背景噪声帧。并且,在连续噪声帧计数器累加的过程中,允许个别不确信的帧出 现(以滞后计数器来表示)。当连续噪声计数器达到50帧时,如果滞后计数器不大于6 (即 不确信的帧不大于6帧)时,则确认当前帧为噪声帧,即此时不影响对当前噪声帧的确认。 如果在连续噪声计数器累加的过程中,滞后计数器超过6帧,则重置连续噪声帧计数器,当 前信号不确认为背景噪声。专利技术人在实现本专利技术的过程中,发现上述现有技术至少存在以下缺点和不足一方面,上述背景噪声跟踪技术在跟踪速度上存在缺陷,当背景噪声发生突变时 (指向SNR增大的方向变化,比如噪声电平突然升高的情况),依靠SNR和背景噪声门限的 比较已无法识别出噪声信号,只能等待连续50个噪声帧出现,导致跟踪速度慢。如果说话 人的频率较快,无法满足出现连续50个噪声帧的条件,AMR VAD2将无法跟踪上背景噪声。 另一方面,上述背景噪声跟踪技术在跟踪的准确性上存在缺陷,由于很多音乐信号中没有 明显的基音和音调特征,则如果依据连续噪声计数器大于等于50且滞后计数器不大于6的 条件,会将某些音乐信号也错误的判断为是背景噪声。
技术实现思路
为了提高跟踪背景噪声的速度、提高跟踪背景噪声的准确性,本专利技术实施例提供 了一种实现通信系统中背景噪声的跟踪的方法和装置。所述技术方案如下一方面,提供了一种实现通信系统中背景噪声的跟踪的方法,所述方法包括根据输入的音频信号,计算当前帧的信噪比SNR ;若所述当前帧的信噪比SNR不大于门限1,则累加帧计数器cnt2,并计算所述当前 帧的音调特征以及信号稳定性特征;当所述帧计数器cnt2累加至时间窗口长度时,则根据所述计算得到的所述时间 窗口各帧的音调特征值和信号稳定性特征值,判断出所述时间窗口中含有噪声区间的可能 性大小;根据判断出的所述时间窗口含有噪声区间的可能性大小,提取所述时间窗口中的 噪声特征。再一方面,提供了一种实现通信系统中背景噪声的跟踪的装置,所述装置包括第一处理模块,用于根据输入的音频信号,计算当前帧的信噪比SNR ;第二处理模块,用于若所述当前帧的信噪比SNR不大于门限1,则累加帧计数器 cnt2,并计算所述当前帧的音调特征以及信号稳定性特征;第三处理模块,用于当所述帧计数器cnt2累加至时间窗口长度时,则根据所述计 算得到的所述时间窗口各帧的音调特征值和信号稳定性特征值,判断出所述时间窗口中含 有噪声区间的可能性大小1 ;第四处理模块,用于根据判断出的所述时间窗口含有噪声区间的可能性大小,提 取所述时间窗口中的噪声特征。本专利技术实施例提供的技术方案的有益效果是通过连续的在一定长度的时间窗口中分析背景噪声的存在性,可以快速的检测或 跟踪变化频繁且剧烈的背景噪声。同时,通过对音调特征,频谱峰值位置稳定性和最大峰谷 比位置稳定性的检测显著的降低了发生在音乐信号的背景噪声误跟踪现象。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可 以根据这些附图获得其他的附图。图1是本专利技术实施例1提供的实现通信系统中背景噪声的跟踪的方法的流程示意 图;图2是本专利技术实施例2提供的实现通信系统中背景噪声的跟踪的方法的流程示意 图;图3是本专利技术实施例3提供的实现通信系统中背景噪声的跟踪的装置的示意图。 具体实施例方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。实施例1本领域技术人员可以获知背景噪声跟踪技术的性能可以用两个指标来衡量,即 跟踪的速度和跟踪的准确性。其中,跟踪的速度指识别出某背景噪声信号的时间与该信号 实际发生时间之间的距离,距离越短跟踪速度就越快。跟踪的准确性指能够正确识别出背 景噪声信号和非背景噪声信号,进而只在背景噪声信号中提取特征参数。如前所述,现有的噪声跟踪技术普遍在跟踪准确性和跟踪速度上都存在不足。跟 踪速度的不足主要出现在有变化较剧烈的背景噪声存在时,现有噪声跟踪技术需要一段比 较长的时间,只有在背景噪声变的平稳且持续一段较长的时间之后才能有效的跟踪上。跟 踪准确性的不足主要出现在有音乐信号存在时,由于很多的音乐信号中没有明显的基音和 音调特征,现有背景噪声跟踪技术会把此类音乐信号误当成噪声信号进行跟踪,需要特别 注意的是,此处没有明显的基音和音调特征的音乐信号是一种泛指,传输的信号中除语音 信号、背景噪声信号以外的任何信号,只要没有明显的基音和音调特征的都可称为音乐信 号。有鉴于此,本专利技术实施例提供了一种实现通信系统中背景噪声的跟踪的方法,旨 在改善现有背景噪声跟踪技术在有突变背景噪声存在的场景下,跟踪速度较慢的问题,以 及改善现有背景噪声跟踪技术在有音乐信号存在时的误跟踪问题,参见图1,该方法内容如 下Sl 根据输入的音频信号,计算当前帧的信噪比SNR ;S2 若当前帧的信噪比SNR不大于门限1,则累加帧计数器cnt2,并计算当前帧的 音调特征以及信号稳定性特征;其中,音调特征,包括但不限于提取——频谱的最大峰谷比,频谱的局部峰谷比的 线性组合,频谱的局部峰值数量,部分频谱的局部峰值数量,频谱的最大峰均比,频谱的局 部峰均比的线性组合等。其中,信号稳定性特征,包括但不限于提取——总能量波动,子带 能量波动,频谱本文档来自技高网...
【技术保护点】
一种实现通信系统中背景噪声的跟踪的方法,其特征在于,所述方法包括:根据输入的音频信号,计算当前帧的信噪比SNR;若所述当前帧的信噪比SNR不大于门限1,则累加帧计数器cnt2,并计算所述当前帧的音调特征以及信号稳定性特征;当所述帧计数器cnt2累加至时间窗口长度时,则根据所述计算得到的所述时间窗口各帧的音调特征值和信号稳定性特征值,判断出所述时间窗口中含有噪声区间的可能性大小;根据判断出的所述时间窗口含有噪声区间的可能性大小,提取所述时间窗口中的噪声特征。
【技术特征摘要】
【专利技术属性】
技术研发人员:王喆,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:94[中国|深圳]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。