用于多通道音频的平滑配置切换制造技术

技术编号：11054181 阅读：84 留言：0更新日期：2015-02-18 18:10

解码系统(100)基于输入信号(A)重构n通道音频信号，所述输入信号通过参数译码表示音频信号或者将音频信号表示为n个离散译码通道。参数解码基于控制空间合成级(150)的混合参数(a)以及核心信号进行，所述空间合成级被从下混级(140)供给下混信号。选择器(170)在稳态的参数解码模式和离散解码模式下控制解码系统的组件，并且在这些模式之间进行转变。下混级基于n通道信号实现下混信号上的投影，所述n通道信号是n通道输入信号或者填充有中性值的核心信号。下混级在其中输入信号通过参数译码表示音频信号的每个时间帧中以及至少在每段参数译码时间帧中的最后一个时间帧之后的第一个时间帧中工作。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】解码系统、重构方法和设备、编码系统、方法和设备及音频发布系统
本文中所公开的本专利技术总地涉及视听媒体发布。具体地讲，本专利技术涉及一种使得能够在解码期间实现高比特率模式和低比特率模式两者以及无缝模式转变的自适应发布格式。本专利技术还涉及用于根据发布格式对信号进行编码和解码的方法和装置。
技术介绍
就收听质量而言，参数立体声和多通道译码方法已知是可伸缩的并且有效率的，这使得它们在低比特率应用中特别有吸引力。然而，在比特率限制是瞬变的性质(例如，网络抖动、载荷变化)的情况下，可以通过使用自适应发布格式来获得可供使用的网络资源的充分益处，其中，在正常状况下使用相对高的比特率，当网络运行不良时，使用较低的比特率。现有的自适应发布格式和相关联的译码(coding/码化)(解码)技术可以从它们的带宽效率、计算效率、差错恢复、算法延迟的角度来进行改进，并且进一步，在视听媒体发布中就比特率切换事件对于享用解码的媒体的人的明显程度来进行改进。附图说明现在将参照附图来描述本专利技术的实施例，其中：图1是根据本专利技术的示例实施例的解码系统的总体框图；图2类似于图1，示出根据本专利技术的示例实施例的编码系统；图3例示位于编码器和解码器侧的下混级的机能；图4示出用于部署在解码系统中的根据示例实施例的上混级的细节；图5示出用于部署在解码系统中的根据示例实施例的空间合成级的细节；图6例示在配备有图5的空间合成级的示例解码系统中出现的数据信号和控制信号；图7示出用于部署在解码系统中的根据示例实施例的空间合成级的细节；图8例示在配备有图7的空间合成级的示例解码系统中出现的数据信号和控制...
<a href="http://www.xjishu.com/zhuanli/21/201380030996.html" title="用于多通道音频的平滑配置切换原文来自X技术">用于多通道音频的平滑配置切换</a>

【技术保护点】
一种用于重构n通道音频信号的解码系统(100)，其中，所述解码系统适于接收比特流(P)，所述比特流(P)对输入信号进行编码，所述输入信号被分割为时间帧，并且在给定时间帧中根据选自以下组的译码机制表示所述音频信号，所述组包含：a)使用至少一个混合参数(α)的参数译码；和b)使用n个离散编码通道的离散译码，所述解码系统能够操作为基于所述n个离散编码通道或者通过空间合成来推导所述音频信号，所述解码系统包括：下混级(140)，能够操作为根据下混规范基于所述输入信号来输出m通道下混信号(X)，其中，n>m≥1；和空间合成级(150)，能够操作为基于所述下混信号和所述至少一个混合参数来输出所述音频信号的n通道表示(Y)，其中，所述下混级适于在每一离散译码时间帧集合中的至少第一时间帧中以及在每一离散译码时间帧集合之后的至少第一时间帧中工作。

【技术特征摘要】
【国外来华专利技术】2012.06.14 US 61/659,602;2012.10.12 US 61/713,0251.一种用于重构n通道音频信号的解码系统(100)，其中，所述解码系统适于接收比特流(P)，所述比特流(P)对输入信号进行编码，所述输入信号被分割为时间帧，并且在给定时间帧中根据选自以下组的译码机制表示所述音频信号，所述组包含：a)使用至少一个混合参数(α)的参数译码；和b)使用n个离散编码通道的离散译码，所述解码系统能够操作为基于所述n个离散编码通道或者通过空间合成来推导所述音频信号，所述解码系统包括：下混级(140)，能够操作为根据下混规范基于所述输入信号来输出m通道下混信号(X)，其中，n＞m≥1；和空间合成级(150)，能够操作为基于所述下混信号和所述至少一个混合参数来输出所述音频信号的n通道表示(Y)，其中，所述下混级适于在每一离散译码时间帧集合中的至少第一时间帧中以及在每一离散译码时间帧集合之后的至少第一时间帧中工作。2.根据权利要求1所述的解码系统，还包括音频解码器(110)，所述音频解码器适于基于所述比特流输出所述输入信号，其中，所述音频解码器适于使用重叠变换窗口来执行时频变换。3.根据权利要求2所述的解码系统，其中，所述时间帧中的每一个等于所述变换窗口中的至少一个的一半长度。4.根据权利要求1所述的解码系统，其中，所述下混级适于在所述输入信号通过参数译码表示所述音频信号的每个时间帧内工作。5.根据权利要求1所述的解码系统，其中，所述解码系统适于接收对输入信号进行编码的比特流，所述输入信号在其中所述输入信号通过参数译码表示音频信号的每个时间帧中包括m通道核心信号，所述m通道核心信号为使得在所述输入信号将音频信号表示为n个离散编码通道的每个时间帧中，能够使用所述下混规范从所述输入信号获得表示相同的音频信号的m通道核心信号。6.根据权利要求5所述的解码系统，其中，所述下混级适于在所述输入信号通过参数译码表示音频信号的每个时间帧中、通过将所述音频信号的参数译码表示的核心信号再现为下混信号来产生所述下混信号。7.根据权利要求1所述的解码系统，其中，所述解码系统适于接收对输入信号进行编码的比特流，所述输入信号在其中所述输入信号通过参数译码表示音频信号的每个时间帧中是n通道信号，其中，n-m个通道不用于表示所述音频信号。8.根据权利要求1所述的解码系统，还包括：第一延迟线(120)，适于接收所述输入信号；和混合器(130)，通信地连接到所述空间合成级和所述第一延迟线，并且适于-在所述系统的参数模式下，输出空间合成级输出或者从其推导的信号；-在所述系统的离散模式下，输出第一延迟线输出；和-响应于在所述输入信号中发生的参数译码和离散译码之间的变化，输出空间合成级输出与第一延迟线输出之间的混合转变。9.根据权利要求8所述的解码系统，其中，所述第一延迟线能够操作为引起与总通过时间相对应的延迟，所述总通过时间是与所述下混级和所述空间合成级相关联的。10.根据权利要求9所述的解码系统，还包括适于接收混合器输出的第二延迟线(160)，其中，所述第一延迟线和第二延迟线所引起的总延迟对应于一个时间帧的长度的倍数。11.根据权利要求1所述的解码系统，其中，所述空间合成级适于应用混合参数值，所述混合参数值通过如下这样的连续时间帧之间的内插而获得，在所述连续时间帧中，在参数译码或者在适用的情况下的缩减参数译码中输入信号定义用于时间帧中的非起始点的明确的混合参数值。12.根据权利要求11所述的解码系统，其中，所述空间合成级适于响应于当前时间帧是时间帧集合中的第一时间帧而发起离散到参数转变，在所述集合中每个时间帧被参数译码或者在适用的情况下被缩减参数译码，所述离散到参数转变包括对最早的明确的混合参数值进行向后外插直到当前时间帧的开始为止。13.根据权利要求11所述的解码系统，其中，所述空间合成级适于响应于当前时间帧是离散译码时间帧集合中的第一时间帧而发起参数到离散转变，所述参数到离散转变包括对最新的明确的混合参数值进行向前外插，直到至少当前时间帧的结束为止。14.根据权利要求1所述的解码系统，其中，所述空间合成级包括：第一变换级(151)，适于接收所述m通道下混信号的时域表示，并且基于其输出所述下混信号的频域表示(Xf)；上混级(155)，适于基于所述下混信号的频域表示和所述至少一个混合参数来输出所述音频信号的所述n通道表示的频域表示(Yf)；和第二变换级(152)，适于接收所述音频信号的n通道表示的频域表示，并且基于其输出所述音频信号的n通道表示的时域表示作为所述空间合成级的输出。15.根据权利要求14所述的解码系统，其中，所述上混级适于形成包括所述下混信号的m通道频域表示中的通道的线性组合；并且将其输出作为所述音频信号的n通道表示的频域表示，所述至少一个混合参数控制所述线性组合中的所述下混信号的m通道频域表示中的至少一个通道相关的至少一个增益。16.根据权利要求1所述的解码系统，其中，所述下混级适于形成所述输入信号的时域表示的通道的线性组合。17.根据权利要求1所述的解码系统，还包括控制器(170)，所述控制器用于基于当前时间帧和前一时间帧的译码机制来控制所述空间合成级和任何混合器。18.根据权利要求17所述的解码系统，其中，所述控制器基于当前时间帧和先前两个时间帧的译码机制来控制所述空间合成级和任何混合器。19.根据权利要求1-18中任一项所述的解码系统，其中，译码机制的组还包括：c)缩减参数译码，所述解码系统适于接收对输入信号进行编码的比特流，所述输入信号在其中输入信号通过缩减参数译码表示音频信号的每个时间帧中具有m通道核心信号的形式，所述m通道核心信号为使得在其中输入信号将音频信号表示为n个离散编码通道的每个时间帧中，能够使用下混规范从所述输入信号获得表示相同的音频信号的m通道核心信号。20.根据权利要求19所述的解码系统，其中，所述空间合成级(150)能够操作为在其中输入信号通过缩减参数译码表示音频信号的每个时间帧中基于所述输入信号和所述至少一个混合参数输出所述音频信号的n通道表示。21.根据权利要求19所述的解码系统，适于接收如下格式的比特流，在所述格式中，所述输入信号的紧接在所述输入信号的参数译码时间帧后面的每个时间帧通过缩减参数译码或离散译码被译码。22.根据权利要求1-18中任一项所述的解码系统，适于接收如下格式的比特流，在所述格式中，所述输入信号的紧接在所述输入信号的离散译码时间帧前面的每个时间帧通过离散译码或参数译码被译码，并且其中，所述输入信号的紧接在所述输入信号的离散译码时间帧后面的每个时间帧通过离散译码或参数译码被译码。23.一种根据权利要求1-18中任一项所述的解码系统，其中，n＝6，m＝2。24.一种重构n通道音频信号的方法，所述方法包括以下步骤：接收比特流(P)，所述比特流对输入信号进行编码，所述输入信号被分割为时间帧，并且在给定时间帧中根据选自以下组的译码机...

【专利技术属性】
技术研发人员：H·普恩哈根，L·塞勒斯特罗姆，K·J·罗德恩，K·克约尔林，L·维尔莫斯，
申请(专利权)人：杜比国际公司，
类型：发明
国别省市：荷兰;NL

全部详细技术资料下载我是这个专利的主人