在一种语音编码系统中,该系统具有语音编码器以及与所述语音编码器配合使用的语音解码器,语音编码器包括预处理器以及ADPCM(自适应差分脉码调制)编码器,ADPCM编码器具有量化器和步长适配装置,而语音解码器包括具有与ADPCM编码器中类似的步长适配装置的ADPCM解码器、解码器和后处理器。预处理器配置了相位模糊滤波装置,用于对量化器的输入处高和/或快速的能量变化效应进行平滑,而后处理器配置了与所述相位模糊滤波装置相反的滤波装置。(*该技术在2022年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及一种语音编码系统,该系统具有语音编码器以及与所述语音编码器配合使用的语音解码器,该语音编码器包括预处理器和具有量化器和步长适配装置的ADPCM(自适应差分脉码调制)编码器,以及语音解码器包括带有与ADPCM编码器中类似的步长适配装置的ADPCM解码器、解码器和后处理器。已经发现,近麦克风录音通过尽量减小声源(口)到如电话听筒中的麦克风的距离减小或消除了声音信号上的室内声学效果。当这些声音信号在标准P2CM音频编码系统的编码器、即预处理ADPCM编码器中进行处理时,与从更长距离进行记录的情况相比,在再现近麦克风录音的脉冲状特性方面出现了问题。ADPCM编码器配置了量化器,用适合于量化器输入信号的步长对量化器的输入信号即采样音频输入信号和量化器的预测量化值之间的差异进行量化。在近麦克风录音中的脉冲状区域中,ADPCM编码器中的量化器的输入信号对量化器来说可能太高太快,无法适应其步长。室内混响模糊了一段时间上音频信号的能量,允许较慢地适应步长。因此,为了提高P2CM音频编码系统对脉冲状信号的性能,ADPCM编码器输入信号必须以这样一种方式进行处理使得量化器的输入不会在短时帧上发生快速能量增加。然而,语音解码器的输出应该听起来象原声,不带有任何人工信号。因此,模拟室内效果以产生原始记录的长距离形式并对此信号进行编码的选择不够好。本专利技术的目的是缓和上述问题并为语音编码系统提供一种尤其针对脉冲状音频信号的改进的记录和再现。根据本专利技术,如开篇段落中描述的语音编码系统的特征在于,预处理器配置了相位模糊(Phase-smearing)滤波装置,用于在量化器的输入端平滑高和/或快速的能量变化效应,以及后处理器配置了与所述相位模糊滤波装置相反的滤波装置。虽然相位模糊滤波可以在时域中进行,但如果预处理器和后处理器分别配置了频谱振幅变形(warping)装置和用于取消这种变形效应的装置,则最好在频域中进行这种滤波,这是因为所述变形装置和去变形装置可在频域中工作。因此,具体地说,在相同的处理模块中进行相位模糊和变形与反相位模糊和去变形。由于相位模糊是线性过程,而频谱振幅变形是非线性过程,因此两个过程相互间不会合并,而是在频域中一个接一个地进行;对滤波后的信号进行变形。频谱振幅变形本身是已知的,见R.Lefebre,C.Laflamme的“音频编码中用于噪音频谱整形的频谱振幅变形(SAW)”(ICASSP,Vol.1,p.335-338,1997)。参照附图和下述实施例的阐述可以清楚本专利技术的这些和其它方面。在附图中附图说明图1显示具有用于预处理和后处理的装置的P2CM编码系统的方框图,分别包括可在时域中工作的相位模糊滤波装置和逆相位模糊滤波装置;图2A、2B分别是ADPCM编码器和ADPCM解码器的方框图;图3A-3D显示相位模糊滤波器的第一实施例的各种特性;图4A-4D显示相位模糊滤波器的第二实施例的各种特性;图5是用于P2CM音频编码器和解码器的预/后处理器的方框图,其中相位模糊可在频域中工作;以及图6显示预处理器中的成帧和开窗。图1所示的P2CM音频编码系统由编码器1和解码器2构成。编码器1包括预处理器3和ADPCM编码器4,而解码器2配置了ADPCM解码器5和后处理器6。ADPCM编码器4如图2A所示,ADPCM解码器5如图2B所示。作为例示,在P2CM音频编码器1中,将PCM输入信号分段为例如10毫秒的若干帧。在例如8kHz的采样频率下,一帧由80个样值构成。各样值由例如16比特表示。将此输入信号提供给预处理器3,并将响应于此而得到的输出信号提供给ADPCM编码器4。由编解码器模式信号CMS形成ADPCM编码器4的另一输入信号,该信号确定ADPCM编码器4的比特流输出中码字的比特分配。ADPCM编码器4为预处理后的信号帧中的各样值产生一个码字。然后,将这些码字分组成帧,在本例示中为80个码字的帧。根据所选的编解码器模式,所得到的比特流具有如11.2、12.8、16、19.2、21.6、24或32kb/s的比特率。在P2CM音频解码器2中,由码帧的比特流和编解码器模式形成ADPCM解码器5的输入。在此示例中,码帧由80个码构成,由ADPCM解码器5对其进行解码以形成80个样值的PCM输出帧,它将在后处理器6中进行后处理。在预处理器3中改变信号特性,使得所得到的信号更适于编码。预处理在编码之前对信号频谱进行修改。因此,可对频谱振幅进行非线性变换,如平方根变换。通过这种称为“频谱振幅变形”的变换,对于相对强的频谱振幅来说增加了相对小的频谱振幅,以便将其重要部分保持在ADPCM编码器4中引入的量化器噪音之上。为了以这种方式修改信号频谱,预处理器3包括处理装置7,该处理装置7具有时域-频域变换单元,用于将音频信号的时域样值帧变换到频域;频谱振幅变形装置;以及频域-时域变换单元,用于将变形后的音频信号从频域变换到时域。该变换在P2CM音频解码器侧可逆,无须发送额外的比特。因此,后处理器6包括处理装置8,该装置具有时域-频域变换单元,用于将音频信号的时域样值帧变换到频域;用于在编码器侧取消预处理器中进行的频谱振幅变形效应的装置;以及频域-时域变换单元,用于将去变形后的音频信号从频域变换到时域。如图2A所示的ADPCM编码器4包括量化器模块9、步长适配模块10、解码器模块11和预测器模块12。ADPCM编码器4的输入是由预处理器3提供的采样音频信号。当样值n具有值s(n)时,对于每个输入值s(n)来说,该值和估计(预测)值s(n-1)之间的差异被视为误差信号e(n),然后,由量化模块9对误差信号进行量化和编码,给出输出码c(n)。输出码c(n)形成了一个比特流,传递或发送比特流,并由P2CM音频编码器的ADPCM解码器5接收。在图1中,该过程由虚线13表示。输出码c(n)还被用于由模块10和解码器模块11修改量化器步长Δn,以得到量化的误差信号e’(n)。量化的误差信号e’(n)被加到预测值s(n-1)中,得到量化的输入值s’(n)。由预测器模块12利用s’(n)来修改其预测系数。ADPCM解码器5只是编码器4的附属设备;它读取从比特流收到的量化码c(n)并采用与编码器4相同的方式更新其内部变量。因此,ADPCM解码器5包括步长适配模块14、解码器模块15和预测器模块16。解码器模块15的输出为量化的误差信号e’(n),该误差信号在加到预测值s(n-1)后,给出量化的音频信号s’(n)。虽然在图2A和2B中没有进一步地显示,但编解码器模式信号CMS还形成ADPCM编码器4中的解码器模块11和ADPCM解码器5中的解码器模块15的输入信号。除上述ADPCM编码器和解码器外,也可使用其它编码器和解码器。如说明书的导言部分中已提及的那样,与从更长距离进行记录的情况相比,在再现近麦克风记录的脉冲状特性方面出现了问题。在近麦克风记录中的脉冲状区域中,量化模块9的输入信号对量化器来说变得太高和太快,无法修改其步长Δn。根据本专利技术,此问题的解决方案是在P2CM音频编码器1中采用相位模糊滤波器。此滤波器具有全通特性,这意味着所有频率的信号能量保持不变。还可以方便地通过利用在P2CM音频解码器2中采用相同滤波器的逆时间形本文档来自技高网...
【技术保护点】
语音编码系统,所述系统具有语音编码器以及与所述语音编码器配合使用的语音解码器,所述语音编码器包括预处理器以及ADPCM(自适应差分脉码调制)编码器,所述ADPCM编码器具有量化器和步长适配装置,以及所述语音解码器包括具有与所述ADPCM编码器中类似的步长适配装置的ADPCM解码器、解码器和后处理器,其特征在于,所述预处理器配置了相位模糊滤波装置,用于对所述量化器的输入处高和/或快速的能量变化效应进行平滑,同时所述后处理器配置了与所述相位模糊滤波装置相反的滤波装置。
【技术特征摘要】
EP 2001-4-9 01201301.71.语音编码系统,所述系统具有语音编码器以及与所述语音编码器配合使用的语音解码器,所述语音编码器包括预处理器以及ADPCM(自适应差分脉码调制)编码器,所述ADPCM编码器具有量化器和步长适配装置,以及所述语音解码器包括具有与所述ADPCM编码器中类似的步长适配装置的ADPCM解码器、解码器和后处理器,其特征在于,所述预处理器配置了相位模糊滤波装置,用于对所述量化器的输入处高和/或快速的能量变化效应进行平滑,同时所述后处理器配置了与所述相位模糊滤波装置相反的滤波装置。2.如权利要求1所述的语音编码系统,其特征在于所述预处理器和后处理器包括时域-频域变换单元,用于将音频信号的时域样值帧变换到频域;处理装置,用于处理频域中的样值;以及频域-时域变换单元,用于将后面处理过的样值变换到时域,所述预处理器中的所述处理装置配置了...
【专利技术属性】
技术研发人员:EF吉吉,
申请(专利权)人:皇家菲利浦电子有限公司,
类型:发明
国别省市:NL[荷兰]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。