使用错误隐藏提供经解码的音频信息的音频解码器及方法技术

技术编号:13394246 阅读:88 留言:0更新日期:2016-07-23 11:28
一种用于基于经编码的音频信息(210;410)提供经解码的音频信息(220;412)的音频解码器(200;400)。音频解码器包含错误隐藏(240;480;600),错误隐藏用于提供用于对音频帧的丢失进行隐藏的错误隐藏音频信息(242;482;612),其中错误隐藏用于对针对丢失的音频帧之前的一个或多个音频帧而获得的时域激励信号(452;456;610)进行修改,以便获得错误隐藏音频信息。

【技术实现步骤摘要】
【国外来华专利技术】
根据本专利技术的实施例创造用于基于经编码的音频信息提供经解码的音频信息的音频解码器。根据本专利技术的一些实施例创造用于基于经编码的音频信息提供经解码的音频信息的方法。根据本专利技术的一些实施例创造用于执行所述方法中的一个的计算机程序。根据本专利技术的一些实施例涉及用于变换域编解码器的时域隐藏。
技术介绍
近年来,对音频内容的数字传输及储存的需求日益增加。然而,音频内容通常在不可靠声道上传输,这带来包含一个或多个音频帧(例如,以经编码的表示的形式,如(例如)经编码的频域表示或经编码的时域表示)的数据单元(例如,封包)丢失的风险。在一些情形下,将可能请求丢失的音频帧(或包含一个或多个丢失的音频帧的数据单元,如封包)的重复(重新发送)。然而,此通常将带来大量延迟,且将因此需要音频帧的扩展(extensive)缓冲。在其他情况下,几乎不可能请求丢失的音频帧的重复。为了获得良好的或至少可接受的音频品质,考虑到音频帧丢失而未提供扩展缓冲(这将消耗大量存储器且还将大体上使音频编码的实时能力降级)的情况,期望具有用以处理一个或多个音频帧的丢失的概念。特别地,期望具有甚至在音频帧丢失的情况下带来良好的音频品质或至少可接受的音频品质的概念。过去,已发展一些错误隐藏概念,这些错误隐藏概念可应用于不同的音频编码概念中。在下文中,将描述传统的音频编码概念。在3gpp标准TS26.290中,解释利用错误隐藏的变换编码激励解码(TCX解码)。在下文中,将提供一些解释,这些解释基于参考文献[1]中的章节“TCXmodedecodingandsignalsynthesis”。图7及图8中示出根据国际标准3gppTS26.290的TCX解码器,其中图7和图8示出TCX解码器的方块图。然而,图7示出在正常操作中或部分封包丢失的情况下与TCX解码有关的那些功能方块。相反,图8示出在TCX-256封包擦除隐藏的情况下的TCX解码的有关处理。不同而言,图7及图8示出包括遵循以下情况的TCX解码器的方块图:情况1(图8):当TCX帧长度为256个样本且有关封包丢失(即,BFI_TCX=(1))时的TCX-256中的封包擦除隐藏;以及情况2(图7):正常TCX解码,可能具有部分封包丢失。在下文中,将关于图7及图8提供一些解释。如所提及,图7示出在正常操作中或在部分封包丢失的情况下执行TCX解码的TCX解码器的方块图。根据图7的TCX解码器700接收TCX特定参数710,且基于该TCX特定参数提供经解码的音频信息712、714。音频解码器700包含多路解复用器“DEMUXTCX720”,该多路解复用器用于接收TCX特定参数710及信息“BFI_TCX”。多路解复用器720分离TCX特定参数710,并提供经编码的激励信息722、经编码的噪声填入(fill-in)信息724及经编码的全局增益信息726。音频解码器700包含激励解码器730,该激励解码器用于接收经编码的激励信息722、经编码的噪声填入信息724及经编码的全局增益信息726,以及一些额外信息(如,例如,比特率旗标“bit_rate_flag”、信息“BFI_TCX”及TCX帧长度信息。激励解码器730基于上述信息提供时域激励信号728(也以“x”指定)。激励解码器730包含激励信息处理器732,该激励信息处理器对经编码的激励信息722进行解复用并对代数向量量化参数进行解码。激励信息处理器732提供中间激励信号734,该中间激励信号通常是以频域表示,且以Y指定。激励编码器730还包含噪声注入器736,该噪声注入器用于在非量化子带中注入噪声,以从中间激励信号734导出噪声填充的激励信号738。噪声填充的激励信号738通常处于频域中,且以Z指定。噪声注入器736从噪声填入水平解码器740接收噪声强度信息742。激励解码器还包含适应性低频去加重744,该适应性低频去加重用于基于噪声填充的激励信号738执行低频去加重操作,以获得处理后的激励信号746,该处理后的激励信号仍处于频域中,且以X’指定。激励解码器730还包含频域至时域的变换器748,该频域至时域的变换器用于接收处理后的激励信号746,并基于该处理后的激励信号提供时域激励信号750,该时域激励信号与由频域激励参数的集合(例如,处理后的激励信号746的频域激励参数的集合)表示的某个时间部分相关联。激励解码器730还包含缩放器752,该缩放器用于对时域激励信号750进行缩放以获得经缩放的时域激励信号754。缩放器752从全局增益解码器758接收全局增益信息756,其中作为回复,全局增益解码器758接收经编码的全局增益信息726。激励解码器730还包含重叠-相加合成760,该重叠-相加合成接收与多个时间部分相关联的经缩放的时域激励信号754。重叠-相加合成760基于经缩放的时域激励信号754执行重叠及相加操作(该重叠及相加操作可包括开窗操作),以获得较长时间周期(比提供单独时域激励信号750、754的时间周期长)内的时间上组合的时域激励信号728。音频解码器700还包含LPC合成770,该LPC合成接收由重叠-相加合成760提供的时域激励信号728及定义LPC合成滤波函数772的一个或多个LPC系数。LPC合成770可例如包含第一滤波器774,该第一滤波器可例如对时域激励信号728进行合成滤波,以获得经解码的音频信号712。选择性地,LPC合成770还可包含第二合成滤波器772,该第二合成滤波器用于使用另一合成滤波函数对第一滤波器774的输出信号进行合成滤波,以获得经解码的音频信号714。在下文中,将在TCX-256封包擦除隐藏的情况下描述TCX解码。图8示出在此情况下的TCX解码器的方块图。封包擦除隐藏800接收音高(pitch)信息810,该音高信息也以“pitch_tcx”指定,且该音高信息是从在先经解码的TCX帧获得。例如,在激励解码器730中(在“正常”解码期间),可使用主(dominant)音高估计器747从处理后的激励信号746获得音高信息810。此外,封包擦除隐藏800接收LPC参数812,该LPC参数可表示LPC合成滤波函数。LPC参数812可例如与LPC参数772相同。因此,封包擦除隐藏800可用于基于音高信息810及LPC参数812提供错误隐藏信号814,该错误隐藏信号可被视为错误隐藏音频信息。封包擦除隐藏800包含激励缓冲器820,该激励缓冲器可例如缓冲在先激励。激励缓冲器820可例如利用ACELP的适应性码本,并可提供激励信号822。封包本文档来自技高网...

【技术保护点】
一种用于基于经编码的音频信息(210;410)提供经解码的音频信息(220;412)的音频解码器(200;400),所述音频解码器包含:错误隐藏(240;480;600),用于提供用于对音频帧的丢失进行隐藏的错误隐藏音频信息(242;482;612),其中所述错误隐藏用于对针对丢失的音频帧之前的一个或多个音频帧而获得的时域激励信号(452;456;610)进行修改,以便获得所述错误隐藏音频信息。

【技术特征摘要】
【国外来华专利技术】2013.10.31 EP 13191133;2014.07.28 EP 141788251.一种用于基于经编码的音频信息(210;410)提供经解码的音频信息(220;412)
的音频解码器(200;400),所述音频解码器包含:
错误隐藏(240;480;600),用于提供用于对音频帧的丢失进行隐藏的错误隐藏音频
信息(242;482;612),
其中所述错误隐藏用于对针对丢失的音频帧之前的一个或多个音频帧而获得的时域激
励信号(452;456;610)进行修改,以便获得所述错误隐藏音频信息。
2.根据权利要求1所述的音频解码器,其中所述错误隐藏用于对从丢失的音频帧之前
的以频域表示编码的一个或多个音频帧导出的时域激励信号(452;456;610)进行修改,
以便获得所述错误隐藏音频信息。
3.根据权利要求1或2所述的音频解码器(200;400),其中所述错误隐藏(240;480;
600)用于使用针对丢失的音频帧之前的一个或多个音频帧而获得的所述时域激励信号
(452;456;610)的一个或多个修改后的副本,以便获得所述错误隐藏信息(242;482;
612)。
4.根据权利要求1-3中任一项所述的音频解码器(200;400),其中所述错误隐藏(240;
482;612)用于对针对丢失的音频帧之前的一个或多个音频帧而获得的所述时域激励信号
(452;456;610)或所述时域激励信号的一个或多个副本进行修改,以随时间减少所述错
误隐藏音频信息(242;482;612)的周期性分量。
5.根据权利要求1-4中任一项所述的音频解码器(200;400),其中所述错误隐藏(240;
480;600)用于对针对所述丢失的音频帧之前的一个或多个音频帧而获得的所述时域激励
信号(452;456;610)或所述时域激励信号的一个或多个副本进行缩放,以修改所述时域
激励信号。
6.根据权利要求4或5所述的音频解码器(200;400),其中所述错误隐藏(240;480;
600)用于逐渐地减少增益,所述增益被施加用以对针对丢失的音频帧之前的一个或多个音
频帧而获得的所述时域激励信号(452;456;610)或所述时域激励信号的一个或多个副本
进行缩放。
7.根据权利要求4-6中任一项所述的音频解码器(200;400),其中所述错误隐藏(240;
480;600)用于依据所述丢失的音频帧之前的一个或多个音频帧的一个或多个参数,和/或
依据连续丢失的音频帧的数量,调整用以逐渐地减少增益的速度,所述增益被施加用以对
针对所述丢失的音频帧之前的一个或多个音频帧而获得的所述时域激励信号(452;456;
610)或所述时域激励信号的一个或多个副本进行缩放。
8.根据权利要求6或7所述的音频解码器(200;400),其中所述错误隐藏(240;480;
600)用于依据所述时域激励信号的音高周期的长度,调整用以逐渐地减少增益的所述速度,
所述增益被施加用以对针对丢失的音频帧之前的一个或多个音频帧而获得的所述时域激励
信号(452;456;610)或所述时域激励信号的一个或多个副本进行缩放,以便与具有较大
长度的音高周期的信号相比,对于具有较短长度的音高周期的信号,输入至LPC合成(680)
的时域激励信号(672)的确定性分量衰退得更快。
9.根据权利要求6-8中任一项所述的音频解码器(200;400),其中所述错误隐藏(240;
480;600)用于依据音高分析或音高预测的结果,调整用以逐渐地减少增益的所述速度,
所述增益被施加用以对针对丢失的音频帧之前的一个或多个音频帧而获得的所述时域激励
信号(452;456;610)或所述时域激励信号的一个或多个副本进行缩放,
以便与具有较小的每时间单位音高变化的信号相比,对于具有较大的每时间单位音高
变化的信号,输入至LPC合成(580)的所述时域激励信号(572)的确定性分量衰退得更
快,和/或
以便与音高预测成功的信号相比,对于音高预测失败的信号,输入至LPC合成(580)
的时域激励信号(572)的确定性分量衰退得更快。
10.根据权利要求1-9中任一项所述的音频解码器(200;400),其中所述错误隐藏(240;
480;600)用于依据所述一个或多个丢失的音频帧的时间内的音高的预测,对基于丢失的
音频帧之前的一个或多个音频帧而获得的所述时域激励信号(452;456;610)或所述时域
激励信号的一个或多个副本进行时间缩放。
11.根据权利要求1-10中任一项所述的音频解码器(200;400),其中所述错误隐藏
(240;480;600)用于获得已被用以对所述丢失的音频帧之前的一个或多个音频帧进行解
码的时域激励信号(452;456;610),且对已被用以对所述丢失的音频帧之前的一个或多
个音频帧进行解码的所述时域激励信号进行修改,以获得修改后的时域激励信号(652;
672),且
其中所述错误隐藏用于基于所述修改后的时域激励信号(652;672)提供所述错误隐
藏音频信息(242;482;612)。
12.根据权利要求1-11中任一项所述的音频解码器(200;400),其中所述错误隐藏
(240;480;600)用于获得已被用以对所述丢失的音频帧之前的一个或多个音频帧进行解
码的音高信息,且
其中,所述错误隐藏用于依据所述音高信息提供所述错误隐藏音频信息(242;482;
612)。
13.根据权利要求12所述的音频解码器(200;400),其中所述错误隐藏(240;480;

\t600)用于基于从所述丢失的音频帧之前的以所述频域表示编码的所述音频帧导出的所述时
域激励信号而获得所述音高信息。
14.根据权利要求13所述的音频解码器(200;400),其中所述错误隐藏用于估计所
述时域激励信号的交叉相关,以确定粗略的...

【专利技术属性】
技术研发人员:杰雷米·勒孔特
申请(专利权)人:弗朗霍夫应用科学研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1