使用相位值平滑对下混频音频信号进行上混频的装置、方法和计算机程序制造方法及图纸

技术编号:9198948 阅读:153 留言:0更新日期:2013-09-26 03:00
一种用于将描述一个或多个下混频音频声道的下混频音频信号上混频成描述多个上混频音频声道的上混频音频信号的装置包括:上混频器和参数确定器。上混频器被配置为应用时变上混频参数来对下混频音频信号进行上混频,以便获得上混频音频信号,其中时变上混频参数包括时变平滑的相位值。参数确定器被配置为基于量化上混频参数输入信息,来获得一个或多个时间平滑的上混频参数以供上混频器使用。参数确定器被配置为使用相位改变限制算法将前一平滑的相位值的缩放版本与输入相位信息的缩放版本相组合,以基于前一平滑的相位值和输入相位信息来确定当前平滑的相位值。

【技术实现步骤摘要】
使用相位值平滑对下混频音频信号进行上混频的装置、方法和计算机程序本申请是申请日为2010年4月1日的中国专利申请201080003595.6(使用相位值平滑对下混频音频信号进行上混频的装置、方法和计算机程序)的分案申请。
根据本专利技术的实施例涉及一种用于对下混频音频信号进行上混频的装置、方法和计算机程序。根据本专利技术的一些实施例涉及参数多声道音频编码的自适应相位参数平滑。
技术介绍
下面将描述本专利技术的背景。参数音频编码领域中的新近发展发表了将多声道音频(例如,5.1)信号联合编码成一个(或一个以上)下混频声道加辅助信息流的技术。这些技术被称为双耳提示编码(BinauralCueCoding)、参数立体声、及MPEG环绕等等。许多出版物描述了所谓的“双耳提示编码”参数多声道编码方法,例如见参考文献[1][2][3][4][5]。“参数立体声」”是一种基于传输的单声道信号加参数辅助信息的双声道立体声信号的参数编码的相关技术,例如见参考文献[6][7]。“MPEG环绕”是参数多声道编码的ISO标准,例如见参考文献[8]。上面提及的技术是基于将压缩形式的人类空间听觉的相关感知提示以及相关联的单声道或立体声下混频信号传输至接收器。典型的提示可以是声道间级差(ILD)、声道间相关或相干(ICC)、以及声道间时间差(ITD)、声道间相位差(IPD)、及总相位差(OPD)。这些参数在一些情况中以适合于人类听觉分辨率的频率与时间分辨率来传输。对该传输而言,典型地对这些参数进行量化(或在一些情况中甚至必须被量化),其中经常(尤其是对低比特率情境)使用相当粗略的量化。时间上的更新间隔由编码器根据信号特性确定。这意味着,并非对下混频信号的每个采样都传输参数。换言之,在一些情况中,描述上面提及的提示的参数的传输速率(或传输频率,或更新速率)可以小于音频采样(或诸组音频采样)的传输速率(或传输频率,或更新速率)。代替传输声道间相位差(IPD)及总相位差(OPD),仅传输声道间相位差(IPD)并估计解码器中总相位差(OPD)也是可能的。由于解码器在一些情况中可能必须以无隙方式随时间将参数连续应用于例如每个采样(或音频采样),因此可能需要在解码器侧处得到中间参数,典型地是通过过去与当前参数集的间的内插。然而,一些传统内插方法导致不良的音频质量。下面参考图7将描述通用双耳提示编码方案。图7示出了双耳提示编码传输系统800的示意框图,该双耳提示编码传输系统800包含双耳提示编码编码器810及双耳提示编码解码器820。双耳提示编码编码器810可以例如接收多个音频信号812a、812b及812c。进一步地,双耳提示编码编码器810被配置为利用下混频器814来对音频输入信号812a-812c进行下混频以获得下混频信号816,该下混频信号816例如可以是和信号且可被用“AS”或“X”表示。进一步地,双耳提示编码编码器810被配置为利用分析器818来分析音频输入信号812a-812c以获得辅助信息信号819(“SI”)。和信号816及辅助信息信号819自双耳提示编码编码器810传输至双耳提示编码解码器820。双耳提示编码解码器820可被配置为基于和信号816及声道间提示824合成多声道音频输出信号,该多声道音频输入信号例如包含音频声道y1、y2,...yN。为此目的,双耳提示编码解码器820可以包含双耳提示编码合成器822,该双耳提示编码合成器822接收和信号816及声道间提示824并提供音频信号y1、y2,...yN。双耳提示编码解码器820进一步包含辅助信息处理器826,该辅助信息处理器826被配置为接收辅助信息819,以及可选地接收使用者输入827。该辅助信息处理器826被配置为基于辅助信息819和可选使用者输入827来提供声道间提示824。总之,对音频输入信号进行分析且下混频。和信号与辅助信息被传输至解码器。声道间提示是由辅助信息及本地使用者输入来产生的。双耳提示编码合成产生多声道音频输出信号。至于详情请参考C.Faller与F.Baumgarte所著文章“BinauralCueCodingPartII:Schemesandapplications,″(出版于:2003年11月第11卷语音与音频处理的IEEE学报)。然而,已得知的是,如果辅助信息被粗略量化或分辨率不足,许多传统双耳提示编码解码器提供质量劣化的多声道输出音频信号。鉴于此问题,需要一种将下混频音频信号上混频成上混频的音频信号的改进构思,这在描述上混频信号不同声道中之间的相位关系的辅助信息以相对低分辨率被量化的情况下,减少了听觉印象的降级。
技术实现思路
根据本专利技术的实施例建立一种用于将描述了一个或一个以上下混频音频声道的下混频音频信号上混频成描述了多个上混频音频声道的上混频音频信号的装置。该装置包含上混频器,该上混频器被配置为应用时变上混频参数来对下混频信号进行上混频,以便获得上混频音频信号。该时变上混频参数包含时变平滑的相位值。该装置进一步包含参数确定器,该参数确定器被配置为基于量化的上混频参数输入信息来获得一个或一个以上时间平滑的上混频参数,以由该上混频器使用。该参数确定器被配置为利用相位改变限制算法,来将前一平滑的相位值的缩放版本与输入相位信息的缩放版本相组合,以基于该前一平滑的相位值及该输入相位信息来确定当前平滑的相位值。根据本专利技术的该实施例是基于下述发现:上混频信号中的可听伪像可以通过利用相位改变限制算法来将前一平滑的相位值的缩放版本与输入相位信息的缩放版本相组合来减少或甚至避免,因为结合相位改变限制算法考虑前一平滑的相位值允许将平滑的相位值的不连续性保持适度地小。后续平滑的相位值的间(例如,前一平滑的相位值与当前平滑的相位值)不连续性的减小相应地有助于避免(或保持足够小)应用了后续相位值(例如,前一平滑的相位值与当前平滑的相位值)的音频信号的部分之间的过渡的可听频率变化。综上所述,本专利技术建立参数多声道音频编码的自适应相位处理的一般性概念。根据本专利技术的实施例通过减少由粗略量化或快速改变相位参数而引起的输出信号中的伪像取代其它技术。在优选实施例中,参数确定器被配置为将前一平滑的相位值的缩放版本与输入相位信息的缩放版本相组合,使得当前平滑的相位值在第一角度区域与一第二角度区域中的较小角度区域中,其中第一角度区域沿着数学正方向从前一平滑的相位值所定义的第一开始方向延伸至相位输入信息所定义的第一结束方向,其中第二角度区域沿着数学正方向从输入相位信息所定义的一第二开始方向延伸至前一平滑的相位值所定义的第二结束方向。因此,在本专利技术的一些实施例中,由相位值的递归(无限脉冲响应型)平滑而引入的相位变化保持尽可能小。因此,可听伪像保持尽可能小。例如,装置可以被配置为确保当前平滑的相位值置于两角度范围中的较小角度范围中,其中该两角度范围中的第一角度范围覆盖大于180°及其中该角度范围中的第二角度范围覆盖小于180°,两个角度范围共同覆盖360°。因此,相位改变限制算法确保了前一平滑化的相位值与当前平滑的相位值之间的相位差小于180°,优选地甚至小于90°。这有助于保持可听伪像尽可能小。在优选实施例中,参数确定器被配置为根据相位输入信息与前一平滑的相位值之间的差值,从多个不同组合规本文档来自技高网
...
使用相位值平滑对下混频音频信号进行上混频的装置、方法和计算机程序

【技术保护点】
一种用于将描述一个或多个下混频音频声道的下混频音频信号(110;210)上混频成描述多个上混频音频声道的上混频音频信号(120;214)的装置(100;200),所述装置(100;200)包括:上混频器(130;230),被配置为应用时变上混频参数(114;262)来对下混频音频信号进行上混频,以便获得上混频音频信号,其中时变上混频参数包括时变平滑的相位值(144a;270);参数确定器(140;250),其中所述参数确定器被配置为基于量化的上混频参数输入信息(142;212),来获得一个或多个时间平滑的上混频参数(αn)以供上混频器(130;230)使用,其中参数确定器(140;250)被配置为使用相位改变限制算法将前一平滑的相位值的缩放版本与输入相位信息(αn)的缩放版本(δαn)相组合,以基于前一平滑的相位值和输入相位信息来确定当前平滑的相位值FDA00003025171200011.jpg,FDA00003025171200012.jpg,FDA00003025171200013.jpg

【技术特征摘要】
2009.04.08 US 61/167,6071.一种用于将描述一个或多个下混频音频声道的下混频音频信号(110;210)上混频成描述多个上混频音频声道的上混频音频信号(120;214)的装置(100;200),所述装置(100;200)包括:上混频器(130;230),被配置为应用时变上混频参数(114;262)来对下混频音频信号进行上混频,以便获得上混频音频信号,其中时变上混频参数包括时变平滑的相位值(144a;270);参数确定器(140;250),其中所述参数确定器被配置为基于量化的上混频参数输入信息(142;212),来获得一个或多个时间平滑的上混频参数(αn)以供上混频器(130;230)使用,其中参数确定器(140;250)被配置为使用相位改变限制算法将前一平滑的相位值的缩放版本与输入相位信息(αn)的缩放版本(δαn)相组合,以基于前一平滑的相位值和输入相位信息来确定当前平滑的相位值2.如权利要求1所述的装置(100;200),其中参数确定器(140;250)被配置为将前一平滑的相位值的缩放版本与输入相位信息(αn)的缩放版本(δαn)相组合,使得当前平滑的相位值在第一角度区域和第二角度区域之中的较小角度区域中,其中第一角度区域沿着数学正方向从前一平滑的相位值所定义的第一开始方向延伸至输入相位信息(αn)所定义的第一结束方向,以及第二角度区域沿着数学正方向从输入相位信息(αn)所定义的第二开始方向延伸至前一平滑的相位值所定义的第二结束方向。3.如权利要求1或2所述的装置(100;200),其中参数确定器(140;250)被配置为根据输入相位信息(αn)与前一平滑的相位值之间的差值从多个不同组合规则中选择组合规则,并且使用选定的组合规则来确定当前平滑的相位值4.如权利要求3所述的装置(100;200),其中参数确定器(140;250)被配置为在输入相位信息(αn)与前一平滑的相位值之间的差值在-π与+π之间的范围中的情况下,选择基本相位组合规则,否则选择一个或多个不同的相位适应组合规则;其中基本相位组合规则定义了输入相位信息的缩放版本(δαn)与前一平滑的相位值的缩放版本的线性组合,其中无恒定被加数;以及其中一个或多个相位适应组合规则定义了输入相位信息的缩放版本与前一平滑的相位值的缩放版本的线性组合,其中考虑了恒定相位适应被加数(+π,-π)。5.如权利要求1所述的装置(100;200),其中参数确定器(140;250)包括平滑控制器,其中平滑控制器被配置为在平滑的相位量与对应的输入相位量(αn)之间的差值大...

【专利技术属性】
技术研发人员:马蒂亚斯·诺伊辛格朱利安·罗比亚尔约翰内斯·希尔珀特
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1