用于编码/解码信号的装置和方法制造方法及图纸

技术编号:3048377 阅读:175 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种编码方法和装置以及一种解码方法和装置。该解码方法包括:跳过包括在输入比特流中的扩展信息;从输入比特流提取三维(3D)缩减混音信号和空间信息;通过对3D缩减混音信号执行3D渲染操作来从3D缩减混音信号去除3D效果;以及利用通过去除获取的缩减混音信号和空间信息生成多声道信号。因此,高效率地编码具有3D效果的多声道信号,并根据音频再现环境的特性以最优音质自适应地恢复和再现音频信号是可能的。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及编码/解码方法和编码/解码装置,尤其涉及可处理音频信号使得能够产生三维(3D)音响效果的编码/解码装置,以及利用该编码/解码装置的 编码/解码方法。
技术介绍
编码装置将多声道信号縮减混音成具有较少声道的信号,并将经縮减混音 的信号传送到解码装置。然后,解码装置从经縮减混音的信号恢复多声道信号, 并使用如5.1声道扬声器之类的三个或更多扬声器再现所恢复的多声道信号。多声道信号可由诸如耳机之类的2声道扬声器来再现。在这种情况下,为 了使用户觉得由2声道扬声器输出的声音好像从三个或更多声源再现的一样, 有必要开发出能够编码或解码多声道信号使得能够产生3D效果的三维(3D)处 理技术
技术实现思路
技术问题本专利技术提供一种能够通过高效率地处理具有3D效果的信号而在各种再现 环境中再现多声道信号的编码/解码装置以及编码/解码方法。技术解决方案根据本专利技术的一个方面,提供了一种解码信号的解码方法,该解码方法包 括跳过包括在输入比特流中的扩展信息;从输入比特流提取三维(3D)縮减混 音信号和空间信息;通过对3D縮减混音信号执行3D渲染操作来从3D縮减混 音信号去除3D效果;以及利用通过去除获取的縮减混音信号和空间信息生成 多声道信号。根据本专利技术的另一个方面,提供了一种解码信号的解码方法,该解码方法包括跳过包括在输入比特流中的扩展信息;从输入比特流提取縮减混音信号 和空间信息;以及通过对縮减混音信号执行3D渲染操作来生成3D縮减混音 信号。根据本专利技术的另一个方面,提供了一种编码具有多个声道的多声道信号的 编码方法,该编码方法包括将多声道信号编码成具有较少声道的縮减混音信 号并生成关于多个声道的空间信息;生成包括声道扩充信息和残差信息中的至 少一个的扩展信息;生成包括空间信息和扩展信息的比特流;以及将跳过扩展 信息所必需的跳过信息插入该比特流。根据本专利技术的一个方面,提供了一种用于解码信号的解码装置,该解码装 置包括比特拆分单元,其跳过包括在输入比特流中的扩展信息并从输入比特 流提取3D縮减混音信号和空间信息;3D渲染单元,其通过对3D縮减混音信 号执行3D渲染操作来从3D縮减混音信号去除3D效果;以及多声道解码器, 其利用由3D渲染单元执行去除而获取的缩减混音信号和空间信息来生成多声 道信号。根据本专利技术的另一个方面,提供了一种用于解码信号的解码装置,该解码 装置包括比特拆分单元,其跳过包括在输入比特流中的扩展信息并从输入比 特流提取縮减混音信号和空间信息;以及3D渲染单元,其通过对縮减混音信 号执行3D渲染操作来生成3D縮减混音信号。根据本专利技术的另一个方面,提供了一种编码具有多个声道的多声道信号的 编码装置,该编码装置包括多声道编码器,其将多声道信号编码成具有较少 声道的縮减混音信号并生成关于多个声道的空间信息;扩展信息生成单元,其 生成包括声道扩充信息和残差信息中的至少一个的扩展信息;以及比特打包单 元,其生成包括空间信息、扩展信息和跳过扩展信息所必需的跳过信息的比特 流。根据本专利技术的另一个方面,提供了一种具有用于执行上述的解码方法或上 述的编码方法中的任一种的计算机程序的计算机可读记录介质。 有益效果根据本专利技术,可高效地编码具有3D效果的多声道信号,并根据再现环境 的特性以最优音质自适应地恢复和再现音频信号。附图简要说明附图说明图1是根据本专利技术的实施例的编码/解码装置的框图2是根据本专利技术的实施例的编码装置的框图3是根据本专利技术的实施例的解码装置的框图4是根据本专利技术的另一个实施例的编码装置的框图5是根据本专利技术的另一个实施例的解码装置的框图6是根据本专利技术的另一个实施例的解码装置的框图7是根据本专利技术的实施例的三维(3D)渲染装置的框图8至11示出根据本专利技术的实施例的比特流;图12是根据本专利技术的实施例用于处理任意縮减混音信号的编码/解码装置 的框图13是根据本专利技术的实施例的任意縮减混音信号补偿/3D渲染单元的框图14是根据本专利技术的实施例用于处理兼容縮减混音信号的解码装置的框图15是根据本专利技术的实施例的縮减混音兼容性处理/3D渲染单元的框以及图16是根据本专利技术的实施例用于消除串扰的解码装置的框图。 本专利技术的最佳实施方式下文中将参考示出本专利技术的示例性实施例的附图更全面地描述本专利技术。图 l是根据本专利技术的实施例的编码/解码装置的框图。参考图l,编码单元100包 括多声道编码器110、三维(3D)渲染单元120、縮减混音编码器130以及比特 打包单元140多声道编码器110将具有多个声道的多声道信息縮减混音成诸如立体声 或单声道信号之类的縮减混音信号,并生成关于该多声道信号的声道的空间信息。需要空间信息是为了从缩减混音信号恢复多声道信号。空间信息的例子包括指示一对声道的能级之差的声道电平差(CLD)、声道预测系数(CPC)——即用于基于2声道信号生成3声道信号的预测系数、指 示一对声道之间的相关性的声道间相关性(ICC)以及一对声道之间的时间间隔 的声道时间差(CTD)。3D渲染单元120基于縮减混音信号生成3D缩减混音信号。3D縮减混音 信号可以是具有三个或更多方向性的2声道信号,因此可由诸如耳机之类的2 声道扬声器再现并具有3D效果。换言之,3D縮减混音信号可由2声道扬声器 再现,使得用户觉得3D縮减混音信号好像是从具有三个或更多声道的声源再 现的一样。声源的方向可基于分别输入到两耳的两个声音的强度之差、两个声 音之间的时间间隔以及两个声音的相位之差中的至少一个来确定。因此,3D 渲染单元120可基于人类如何利用其听觉确定声源的3D位置来将縮减混音信 号转换成3D縮减混音信号。3D渲染单元120可通过利用滤波器滤波縮减混音信号来生成3D縮减混 音信号。在这种情况下,可由外部源将滤波器相关信息——如滤波器系数输入 到3D渲染单元120。 3D渲染单元120可利用由多声道编码器110提供的空间 信息来基于縮减混音信号生成3D縮减混音信号。更具体地,3D渲染单元120 可通过利用空间信息将缩减混音信号转换成想像的多声道信号并滤波该想像 的多声道信号来将縮减混音信号转换成3D縮减混音信号。3D渲染单元120可通过利用报头相关传递函数(HRTF)滤波器滤波缩减混 音信号来生成3D縮减混音信号。HRTF是一种传递函数,它描述任意位置的声源和耳膜之间声波的传输, 并返回根据声源的方向和高度变化的值。如果利用HRTF滤波没有方向性的信 号,则可听到该信号好像从某方向再现一样。3D渲染单元120可在例如离散傅立叶变换(DFT)域或快速傅立叶变换 (FFT)域之类的频域中执行3D渲染操作。在这种情况下,3D渲染单元120可 在3D渲染操作前执行DFT或FFT,或者可在3D渲染操作后执行逆DFT(IDFT) 或逆FFT(IFFT)。3D渲染单元120可在正交镜像滤波器(QMF)/混合域中执行3D渲染操作。 在这种情况下,3D渲染单元120可在3D渲染操作之前或之后执行QMF/混合 分析和合成操作。3D渲染单元120可在时域中执行3D渲染操作。3D渲染单元120可根据 所需的音质和编码/解码装置的操作能力确定将在哪个域中执行3D渲染操作。縮减混音编码器130编码由多声道编码器110输出的縮减混音信号或由 3D渲染单元120输出的3本文档来自技高网...

【技术保护点】
一种解码信号的解码方法,所述解码方法包括: 跳过包括在输入比特流中的扩展信息; 从所述输入比特流提取三维(3D)缩减混音信号和空间信息; 通过对所述3D缩减混音信号执行3D渲染操作来从所述3D缩减混音信号去除3D效果;以及 利用通过所述去除获取的缩减混音信号和所述空间信息生成多声道信号。

【技术特征摘要】
【国外来华专利技术】US 2006-2-7 60/765,747;US 2006-2-9 60/771,471;US 21. 一种解码信号的解码方法,所述解码方法包括跳过包括在输入比特流中的扩展信息;从所述输入比特流提取三维(3D)缩减混音信号和空间信息;通过对所述3D缩减混音信号执行3D渲染操作来从所述3D缩减混音信号去除3D效果;以及利用通过所述去除获取的缩减混音信号和所述空间信息生成多声道信号。2. 如权利要求1所述的解码方法,其特征在于,所述扩展信息包括声道 扩充信息和残差信息中的至少一个。3. 如权利要求1所述的解码方法,其特征在于,所述去除包括使用用于 生成所述3D縮减混音信号的滤波器的逆滤波器。4. 如权利要求3所述的解码方法,其特征在于,还包括从所述输入比特 流提取与用于生成所述3D縮减混音信号的所述滤波器有关的滤波器信息。5. 如权利要求1所述的解码方法,其特征在于,所述跳过包括使用与所 述扩展信息的比特大小有关的信息。6. 如权利要求5所述的解码方法,其特征在于,与所述扩展信息的比特 大小有关的所述信息被设置在所述扩展信息的开头。7. 如权利要求1所述的解码方法,其特征在于,所述跳过包括使用设置 在所述扩展信息的开头和结尾中的至少一个处的同步字。8. 如权利要求1所述的解码方法,其特征在于,所述跳过包括使用与所 述扩展信息的固定比特大小有关的固定比特大小信息。9. 如权利要求8所述的解码方法,其特征在于,所述固定比特大小信息 包括在所述输入比特流中或存储在解码装置中。10. —种解码信号的解码方法,所述解码方法包括-跳过包括在输入比特流中的扩展信息;从所述输入比特流提取縮减混音信号和空间信息;以及 通过对所述縮减混音信号执行3D渲染操作来生成3D縮减混音信号。11. 如权利要求10所述的解码方法,其特征在于,所述扩展信息包括声 道扩充信息和残差信息中的至少一个。12. 如权利要求10所述的解码方法,其特征在于,所述跳过包括使用与所述扩展信息的比特大小有关的信息。13. 如权利要求10所述的解码方法,其特征在于,所述跳过包括使用设 置在所述扩展信息的开头和结尾中的至少一个处的同步字。14. 如权利要求10所述的解码方法,其特征在于,所述跳过包括使用与 所述扩展信息的固定比特大小有关的固定比特大小信息。15...

【专利技术属性】
技术研发人员:郑亮源房熙锡吴贤午金东秀林宰显
申请(专利权)人:LG电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1