用于多通道音频的平滑配置切换制造技术

技术编号:11054181 阅读:75 留言:0更新日期:2015-02-18 18:10
解码系统(100)基于输入信号(A)重构n通道音频信号,所述输入信号通过参数译码表示音频信号或者将音频信号表示为n个离散译码通道。参数解码基于控制空间合成级(150)的混合参数(a)以及核心信号进行,所述空间合成级被从下混级(140)供给下混信号。选择器(170)在稳态的参数解码模式和离散解码模式下控制解码系统的组件,并且在这些模式之间进行转变。下混级基于n通道信号实现下混信号上的投影,所述n通道信号是n通道输入信号或者填充有中性值的核心信号。下混级在其中输入信号通过参数译码表示音频信号的每个时间帧中以及至少在每段参数译码时间帧中的最后一个时间帧之后的第一个时间帧中工作。

【技术实现步骤摘要】
【国外来华专利技术】解码系统、重构方法和设备、编码系统、方法和设备及音频发布系统
本文中所公开的本专利技术总地涉及视听媒体发布。具体地讲,本专利技术涉及一种使得能够在解码期间实现高比特率模式和低比特率模式两者以及无缝模式转变的自适应发布格式。本专利技术还涉及用于根据发布格式对信号进行编码和解码的方法和装置。
技术介绍
就收听质量而言,参数立体声和多通道译码方法已知是可伸缩的并且有效率的,这使得它们在低比特率应用中特别有吸引力。然而,在比特率限制是瞬变的性质(例如,网络抖动、载荷变化)的情况下,可以通过使用自适应发布格式来获得可供使用的网络资源的充分益处,其中,在正常状况下使用相对高的比特率,当网络运行不良时,使用较低的比特率。现有的自适应发布格式和相关联的译码(coding/码化)(解码)技术可以从它们的带宽效率、计算效率、差错恢复、算法延迟的角度来进行改进,并且进一步,在视听媒体发布中就比特率切换事件对于享用解码的媒体的人的明显程度来进行改进。附图说明现在将参照附图来描述本专利技术的实施例,其中:图1是根据本专利技术的示例实施例的解码系统的总体框图;图2类似于图1,示出根据本专利技术的示例实施例的编码系统;图3例示位于编码器和解码器侧的下混级的机能;图4示出用于部署在解码系统中的根据示例实施例的上混级的细节;图5示出用于部署在解码系统中的根据示例实施例的空间合成级的细节;图6例示在配备有图5的空间合成级的示例解码系统中出现的数据信号和控制信号;图7示出用于部署在解码系统中的根据示例实施例的空间合成级的细节;图8例示在配备有图7的空间合成级的示例解码系统中出现的数据信号和控制信号;图9示出根据本专利技术的示例实施例的将信息发送到解码器装置的编码系统;图10例示在配备有图5的空间合成级的示例解码系统中出现的数据信号和控制信号;图11是根据本专利技术的示例实施例的解码系统的总体框图;和图12示出用于部署在解码系统中的根据示例实施例的音频解码器的细节。所有的附图都是示意性的,并且仅从大体上示出了为了阐明本专利技术而必需的部分,而其他部分则可以被略去或者仅仅被建议。除非另有指示,否则相似的标号在不同图中指示相似的部分。具体实施方式I.概述如本文中所使用的,音频信号可以是纯音频信号、视听信号或多媒体信号的音频部分、或者与元数据组合的这些信号中的任何一个。在本专利技术的第一方面内,示例性实施例提出了使得能够以改进的比特率选择能力和/或减小的延迟来自适应地发布媒体内容(诸如音频或视频内容)的方法和装置。示例实施例还提供了适合于这样的自适应媒体发布的译码格式,所述译码格式有助于比特率之间的无缝转变。本专利技术的示例实施例提供具有独立权利要求中所阐述的特征的编码方法、编码系统、解码方法、解码系统、音频发布系统和计算机程序产品。解码系统适于基于输入信号重构音频信号,所述输入信号可以直接提供给解码系统,或者可替代地可以被用解码系统所接收的比特流进行编码。输入信号被分割为与音频信号的(重叠的或相连的)时间段相应的时间帧。输入信号的一个时间帧根据译码机制表示音频信号的时间段,所述译码机制选自包括参数译码和离散译码的一组译码机制。特别地,如果编码的音频信号是n通道信号,则输入信号在所接收的它被离散译码的帧中(至少)包含相等数量的通道,即,在离散译码机制中,n个离散编码的通道被用于表示音频信号。在参数译码的所接收的帧中,输入信号包括比n个通道少的通道(但是它可以是n通道格式,其中一些通道不被使用),但是可以另外包括元数据,诸如在编码处理期间例如通过计算信号能量值或相关系数从音频信号推导的至少一个混合参数。可替代地,所述至少一个混合参数可以通过不同的通信路径(例如,经由与承载输入信号的比特流分离的元数据比特流)被供给解码系统。如所指出的,输入信号可以处于至少两种不同的机制(即,参数译码或离散译码),解码系统通过转变到——或者保持处于——参数模式或离散模式来对这些机制做出反应。系统的转变可以具有有限的持续时间,使得解码系统只有在一个或多个时间帧过去之后才进入输入信号的当前译码机制所引起的模式。因此,在操作中,解码系统的模式可能落后于输入信号的机制与一个或多个时间帧相应的时段。参数译码时间帧集合(episode)是指全都通过参数译码表示音频信号的一个或多个连续时间帧的序列。类似地,离散译码时间帧集合是具有n个离散译码通道的一个或多个连续时间帧的序列。如本文中所使用的,解码系统在如下这样的那些时间帧中处于参数模式,在那些时间帧中,解码系统输出对于帧持续时间的更大部分是通过空间合成而生成的(不管底层数据的来源如何);离散模式是指在其中解码系统不处于参数模式的任何时间帧。解码系统包括下混级,所述下混级适于基于输入信号输出m通道下混信号。优选地,解码系统接受控制下混操作的定量和/或定性方面的下混规范(downmixspecification),例如,下混级所形成的将在任何线性组合中施加的增益。优选地,下混规范是可被从数据通信或存储介质提供给至少一个进一步的下混级的数据结构,所述进一步的下混级例如是将输入信号或者对输入信号进行编码的比特流提供给解码系统的编码器中的具有类似的或不同的结构特性的下混级。这样,可以确保这些下混级在功能上是等同的,例如,它们响应于相同的输入信号提供相同的下混信号。下混规范的加载可以相当于部署之后下混级的重新配置,但是可替代地可以在其制造、初始编程、安装、部署等期间执行。下混规范可以用输入信号的特定形式或格式(包括一种格式中的通道的位置或编号)来表达。可替代地,它可以从语义上来表达(包括通道的几何意义,而不管其相对于格式的位置如何)。优选地,下混规范与输入信号的当前形式或格式和/或输入信号的机制无关地制定,从而下混操作可越过输入信号格式改变继续进行,而不中断。解码系统还包括空间合成级,所述空间合成级适于接收下混信号,并且输出音频信号的n通道表示。空间合成级由于其算法延迟的原因与非零通过时间相关联;本专利技术的基础问题之一是尽管存在该延迟,但是仍然实现平滑切换。音频信号的n通道表示可以作为解码系统输出而输出;可替代地,它经受了以更忠实地和/或以更少的伪像和差错重构音频信号为总体目标的附加的处理。空间合成级接受控制空间合成操作的定量和/或定性方面的至少一个混合参数。原则上,空间合成级至少在参数模式下(例如,当下混信号可供使用时)工作(active)。在离散模式下,解码系统通过对n个离散编码的通道中的每个进行解码来从输入信号推导输出信号。根据这个示例实施例,下混级至少在每个离散译码时间帧集合中的第一时间帧中(例如,在整个帧内)以及至少在每个离散译码时间帧集合之后的第一时间帧中(例如,在整个帧内)工作。这意味着,输入信号一从离散译码转变为参数译码,m通道下混信号就可以可供使用。因此,空间合成级可以在较短的时间内启动,即使它包括与固有的非零算法延迟相关联的处理(例如,时频变换、实复转换和/或混合分析滤波)仍如此。此外,音频信号的n通道表示在从参数模式到离散模式的整个转变中可以保持可供使用,并且可以用于使这样的转变更快速和/或更不明显。如本文中所使用的,时间帧(或帧)是输入信号的对于其译码机制可被控制的最小单元。优选地,输入信号的非空通道通过加窗的变换而获得。例如,如MDCT中那样,本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/21/201380030996.html" title="用于多通道音频的平滑配置切换原文来自X技术">用于多通道音频的平滑配置切换</a>

【技术保护点】
一种用于重构n通道音频信号的解码系统(100),其中,所述解码系统适于接收比特流(P),所述比特流(P)对输入信号进行编码,所述输入信号被分割为时间帧,并且在给定时间帧中根据选自以下组的译码机制表示所述音频信号,所述组包含:a)使用至少一个混合参数(α)的参数译码;和b)使用n个离散编码通道的离散译码,所述解码系统能够操作为基于所述n个离散编码通道或者通过空间合成来推导所述音频信号,所述解码系统包括:下混级(140),能够操作为根据下混规范基于所述输入信号来输出m通道下混信号(X),其中,n>m≥1;和空间合成级(150),能够操作为基于所述下混信号和所述至少一个混合参数来输出所述音频信号的n通道表示(Y),其中,所述下混级适于在每一离散译码时间帧集合中的至少第一时间帧中以及在每一离散译码时间帧集合之后的至少第一时间帧中工作。

【技术特征摘要】
【国外来华专利技术】2012.06.14 US 61/659,602;2012.10.12 US 61/713,0251.一种用于重构n通道音频信号的解码系统(100),其中,所述解码系统适于接收比特流(P),所述比特流(P)对输入信号进行编码,所述输入信号被分割为时间帧,并且在给定时间帧中根据选自以下组的译码机制表示所述音频信号,所述组包含:a)使用至少一个混合参数(α)的参数译码;和b)使用n个离散编码通道的离散译码,所述解码系统能够操作为基于所述n个离散编码通道或者通过空间合成来推导所述音频信号,所述解码系统包括:下混级(140),能够操作为根据下混规范基于所述输入信号来输出m通道下混信号(X),其中,n>m≥1;和空间合成级(150),能够操作为基于所述下混信号和所述至少一个混合参数来输出所述音频信号的n通道表示(Y),其中,所述下混级适于在每一离散译码时间帧集合中的至少第一时间帧中以及在每一离散译码时间帧集合之后的至少第一时间帧中工作。2.根据权利要求1所述的解码系统,还包括音频解码器(110),所述音频解码器适于基于所述比特流输出所述输入信号,其中,所述音频解码器适于使用重叠变换窗口来执行时频变换。3.根据权利要求2所述的解码系统,其中,所述时间帧中的每一个等于所述变换窗口中的至少一个的一半长度。4.根据权利要求1所述的解码系统,其中,所述下混级适于在所述输入信号通过参数译码表示所述音频信号的每个时间帧内工作。5.根据权利要求1所述的解码系统,其中,所述解码系统适于接收对输入信号进行编码的比特流,所述输入信号在其中所述输入信号通过参数译码表示音频信号的每个时间帧中包括m通道核心信号,所述m通道核心信号为使得在所述输入信号将音频信号表示为n个离散编码通道的每个时间帧中,能够使用所述下混规范从所述输入信号获得表示相同的音频信号的m通道核心信号。6.根据权利要求5所述的解码系统,其中,所述下混级适于在所述输入信号通过参数译码表示音频信号的每个时间帧中、通过将所述音频信号的参数译码表示的核心信号再现为下混信号来产生所述下混信号。7.根据权利要求1所述的解码系统,其中,所述解码系统适于接收对输入信号进行编码的比特流,所述输入信号在其中所述输入信号通过参数译码表示音频信号的每个时间帧中是n通道信号,其中,n-m个通道不用于表示所述音频信号。8.根据权利要求1所述的解码系统,还包括:第一延迟线(120),适于接收所述输入信号;和混合器(130),通信地连接到所述空间合成级和所述第一延迟线,并且适于-在所述系统的参数模式下,输出空间合成级输出或者从其推导的信号;-在所述系统的离散模式下,输出第一延迟线输出;和-响应于在所述输入信号中发生的参数译码和离散译码之间的变化,输出空间合成级输出与第一延迟线输出之间的混合转变。9.根据权利要求8所述的解码系统,其中,所述第一延迟线能够操作为引起与总通过时间相对应的延迟,所述总通过时间是与所述下混级和所述空间合成级相关联的。10.根据权利要求9所述的解码系统,还包括适于接收混合器输出的第二延迟线(160),其中,所述第一延迟线和第二延迟线所引起的总延迟对应于一个时间帧的长度的倍数。11.根据权利要求1所述的解码系统,其中,所述空间合成级适于应用混合参数值,所述混合参数值通过如下这样的连续时间帧之间的内插而获得,在所述连续时间帧中,在参数译码或者在适用的情况下的缩减参数译码中输入信号定义用于时间帧中的非起始点的明确的混合参数值。12.根据权利要求11所述的解码系统,其中,所述空间合成级适于响应于当前时间帧是时间帧集合中的第一时间帧而发起离散到参数转变,在所述集合中每个时间帧被参数译码或者在适用的情况下被缩减参数译码,所述离散到参数转变包括对最早的明确的混合参数值进行向后外插直到当前时间帧的开始为止。13.根据权利要求11所述的解码系统,其中,所述空间合成级适于响应于当前时间帧是离散译码时间帧集合中的第一时间帧而发起参数到离散转变,所述参数到离散转变包括对最新的明确的混合参数值进行向前外插,直到至少当前时间帧的结束为止。14.根据权利要求1所述的解码系统,其中,所述空间合成级包括:第一变换级(151),适于接收所述m通道下混信号的时域表示,并且基于其输出所述下混信号的频域表示(Xf);上混级(155),适于基于所述下混信号的频域表示和所述至少一个混合参数来输出所述音频信号的所述n通道表示的频域表示(Yf);和第二变换级(152),适于接收所述音频信号的n通道表示的频域表示,并且基于其输出所述音频信号的n通道表示的时域表示作为所述空间合成级的输出。15.根据权利要求14所述的解码系统,其中,所述上混级适于形成包括所述下混信号的m通道频域表示中的通道的线性组合;并且将其输出作为所述音频信号的n通道表示的频域表示,所述至少一个混合参数控制所述线性组合中的所述下混信号的m通道频域表示中的至少一个通道相关的至少一个增益。16.根据权利要求1所述的解码系统,其中,所述下混级适于形成所述输入信号的时域表示的通道的线性组合。17.根据权利要求1所述的解码系统,还包括控制器(170),所述控制器用于基于当前时间帧和前一时间帧的译码机制来控制所述空间合成级和任何混合器。18.根据权利要求17所述的解码系统,其中,所述控制器基于当前时间帧和先前两个时间帧的译码机制来控制所述空间合成级和任何混合器。19.根据权利要求1-18中任一项所述的解码系统,其中,译码机制的组还包括:c)缩减参数译码,所述解码系统适于接收对输入信号进行编码的比特流,所述输入信号在其中输入信号通过缩减参数译码表示音频信号的每个时间帧中具有m通道核心信号的形式,所述m通道核心信号为使得在其中输入信号将音频信号表示为n个离散编码通道的每个时间帧中,能够使用下混规范从所述输入信号获得表示相同的音频信号的m通道核心信号。20.根据权利要求19所述的解码系统,其中,所述空间合成级(150)能够操作为在其中输入信号通过缩减参数译码表示音频信号的每个时间帧中基于所述输入信号和所述至少一个混合参数输出所述音频信号的n通道表示。21.根据权利要求19所述的解码系统,适于接收如下格式的比特流,在所述格式中,所述输入信号的紧接在所述输入信号的参数译码时间帧后面的每个时间帧通过缩减参数译码或离散译码被译码。22.根据权利要求1-18中任一项所述的解码系统,适于接收如下格式的比特流,在所述格式中,所述输入信号的紧接在所述输入信号的离散译码时间帧前面的每个时间帧通过离散译码或参数译码被译码,并且其中,所述输入信号的紧接在所述输入信号的离散译码时间帧后面的每个时间帧通过离散译码或参数译码被译码。23.一种根据权利要求1-18中任一项所述的解码系统,其中,n=6,m=2。24.一种重构n通道音频信号的方法,所述方法包括以下步骤:接收比特流(P),所述比特流对输入信号进行编码,所述输入信号被分割为时间帧,并且在给定时间帧中根据选自以下组的译码机...

【专利技术属性】
技术研发人员:H·普恩哈根L·塞勒斯特罗姆K·J·罗德恩K·克约尔林L·维尔莫斯
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利