利用频域维纳滤波对空间音频编码进行时间包络整形制造技术

技术编号：8413617 阅读：215 留言：0更新日期：2013-03-14 11:56

本发明专利技术涉及利用频域维纳滤波对空间音频编码进行时间包络整形。特定类型的参数空间编码编码器采用声道间幅值差、声道间时间差以及声道间相干或相关性来建立多声道声场的参数模型，解码器采用该参数模型来构造对原始声场的近似。然而，所述参数模型没有构造声场声道的原始时间包络，而声场声道的原始时间包络被发现对于一些音频信号极为重要。本发明专利技术在空间编码系统中对一个或更多个解码声道的时间包络进行整形以更好地与一个或更多个原始时间包络相匹配。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及基于块的音频编码器，其中音频信息在被解码时具有由块率限定的时间包络分辨率，该编码器包括感知的且参数化的音频编码器、解码器及系统，本专利技术还涉及对应的方法，用于实现这种方法的计算机程序，以及由这种编码器生成的位流。
技术介绍
很多降低比特率的音频编码技术都是“基于块”的，其中，编码包括如下处理对解码成多个时间块的一个或更多个音频信号中的每一个进行划分，并且以不高于块率的频率对与解码音频相关联的一些附带信息(side information)进行更新。因此,音频信息在被解码时具有由块率限定的时间包络分辨率。因此，基于时间的解码音频信号的具体结构被保留的时间段不小于编码技术的粒度(granularity)(通常在每块8到50毫秒的范围内)。这种基于块的音频编码技术不仅包括已经建立的感知编码技术，已知有AC_3、AAC以及各种MPEG，在该技术中通常通过编码/解码处理保留离散的声道，而且包括最近引入的比特率受限编码技术，有时将其称为“心理声学编码(Binaural Cue Coding)”以及“参数立体声编码”，在该技术中通过编码/解码处理将多个输入声道缩混为单个声道，并且从单个声道上混为多个声道。这种编码系统的详情包含在不同文档中，包括下面在标题“引用并入”下所引用的那些文档。由于在这种编码系统中使用了单个声道，所以重构的输出信号必须是彼此幅度成比例的——对于特定块，不同输出信号必须具有基本上相同的精细包络结构。虽然所有基于块的音频编码技术都可因为其解码音频信号的时间包络分辨率的提高而得益，但是在整个编码/解码处理中不保留离散声道的、基于块的...

【技术保护点】
一种用于对解码的输出信号的时间包络进行整形以更接近地近似于输入信号的时间包络的方法，所述方法包括：接收包含缩混信号和包络附带信息的经空间编码的位流，其中所述缩混信号包括被划分成时隙的音频信息，并且包络附带信息与音频信息相关并且在对解码的输出信号的时间包络进行整形时有用，包络附带信息表示输入信号的包络与从缩混信号导出的信号的包络的比较的结果，缩混信号至少从所述输入信号缩混，对所述经空间编码的位流进行解码以产生解码的输出信号，以及根据包络附带信息对解码的输出信号的时间包络进行整形以更接近地近似于输入信号的时间包络。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：马克·S·温顿，阿兰·J·泽费尔特，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人