音频处理单元和音频解码方法。音频处理单元包括:缓冲存储器,被配置为存储编码音频比特流的帧,其中编码音频比特流包括音频数据和元数据容器,元数据容器包括报头和元数据有效载荷,元数据有效载荷包括DRC元数据,并且DRC元数据是或者包括简档元数据,简档元数据指示DRC元数据是否包括在根据压缩简档对音频数据的块所指示的音频内容执行DRC时使用的DRC控制值,如果简档元数据指示DRC元数据包括在根据压缩简档执行DRC时使用的DRC控制值,则DRC元数据还包括一组根据压缩简档生成的DRC控制值;分析器,被配置为分析编码音频比特流;以及子系统,被配置为使用DRC元数据对音频数据或者对解码音频数据执行DRC。
【技术实现步骤摘要】
本申请是申请日为2014年6月12日、申请号为“201480008799.7”、专利技术名称为“使用节目信息或子流结构元数据的音频编码器和解码器”的专利技术专利申请的分案申请。相关申请的交叉引用本申请要求在2013年6月19日提交的美国临时专利申请61/836,865号的优先权,其全部内容通过引用合并于此。
本专利技术涉及音频信号处理,以及更具体地,涉及具有指示与由比特流所指示的音频内容有关的子流结构和/或节目信息的元数据的音频数据比特流的编码和解码。本专利技术的一些实施方式以被称为杜比数字(AC-3)、杜比数字+(增强的AC-3或E-AC-3)或杜比E的格式中的一种格式生成或解码音频数据。
技术介绍
杜比、杜比数字、杜比数字+、和杜比E是杜比实验室特许公司的商标。杜比实验室提供分别被称为杜比数字和杜比数字+的AC-3和E-AC-3的专有实现。音频数据处理单元通常以盲方式(blindfashion)操作并且不关注在数据被接收之前发生的音频数据的处理历史。这可以在这样的处理框架中工作:其中单个实体进行各种目标媒体渲染装置的所有的音频数据处理和编码而目标媒体渲染装置进行编码音频数据的所有的解码和渲染。然而,该盲处理在多个音频处理单元跨多样化的网络被散布(scatter)或串联(即,链)放置并且期望它们最佳地执行其相应类型的音频处理的情形下不能很好地(或完全不)工作。例如,一些音频数据可能针对高性能媒体系统被编码,并且可能需要被转换成适合于沿着媒体处理链的移动设备的简化形式。因此,音频处理单元可能不必要地对音频数据执行已经被执行过的类型的处理。例如,音量校平(leveling)单元可能对输入音频片断执行处理,不管以前是否已经对输入音频片断执行了相同的或相似的音量校平。因此,即使当不必要时,音量校平单元也可能执行校平。该不必要的处理还可能导致当渲染音频数据的内容时具体特征的退化和/或消除。
技术实现思路
在一类实施方式中,本专利技术是能够对编码比特流进行解码的音频处理单元,该编码比特流包括比特流的至少一个帧的至少一个段中的子流结构元数据和/或节目信息元数据(可选地还包括其他元数据,例如,响度处理状态元数据)以及帧的至少一个其他段中的音频数据。在本文中,子流结构元数据(或“SSM”)表示编码比特流(或编码比特流的集合)的元数据,其指示编码比特流的音频内容的子流结构,并且“节目信息元数据”(或“PIM”)表示编码音频比特流的元数据,其指示至少一个音频节目(例如,两个或更多个音频节目),其中节目信息元数据指示至少一个所述节目的音频内容的至少一个属性或特性(例如,指示对节目的音频数据执行的处理的类型或参数的元数据,或指示节目的哪些通道是活动通道(activechannel)的元数据)。在典型的情况(例如,其中编码比特流为AC-3或E-AC-3比特流)下,节目信息元数据(PIM)指示实际上不能在比特流的其他部分中携带的节目信息。例如,PIM可以指示在编码(例如,AC-3或E-AC-3编码)之前对PCM音频所应用的处理,音频节目的哪些频带已经使用具体的音频编码技术被编码以及用于在比特流中创建动态范围压缩(DRC)数据的压缩简档(profile)。在另一类实施方式中,方法包括在比特流的每个帧(或至少一些帧中的每个帧)中将编码音频数据与SSM和/或PIM复用的步骤。在典型的解码中,解码器从比特流中提取SSM和/或PIM(包括通过对SSM和/或PIM以及音频数据进行分析和去复用),并且对音频数据进行处理以生成解码音频数据的流(以及在某些情况下还执行音频数据的自适应处理)。在一些实施方式中,解码音频数据以及SSM和/或PIM从解码器被转发至后处理器,该后处理器被配置成使用SSM和/或PIM对解码音频数据执行自适应处理。在一类实施方式中,本专利技术的编码方法生成包括音频数据段(例如,图4所示的帧的AB0至AB5段或图7所示的帧的段AB0至AB5中的全部或一些)的编码音频比特流(例如,AC-3或E-AC-3比特流),音频数据段包括编码音频数据以及与音频数据段时分复用的元数据段(包括SSM和/或PIM,可选地还包括其他元数据)。在一些实施方式中,每个元数据段(在本文中有时称为“容器”)具有包括元数据段报头(可选地还包括其他强制性的或“核心”元素)、以及在元数据段报头之后的一个或更多个元数据有效载荷。如果存在,SIM被包括在元数据有效载荷之一中(由有效载荷报头标识,并且通常具有第一类型的格式)。如果存在,PIM被包括在元数据有效载荷中的另一个中(由有效载荷报头标识,并且通常具有第二类型的格式)。类似地,元数据的每个其他类型(如果存在)被包括在元数据有效载荷中的另一个中(由有效载荷报头标识,并且通常具有特定于元数据的类型的格式)。示例性格式允许在除了比特流的解码期间之外的时间(例如,由解码之后的后处理器,或由被配置成在不执行对编码比特流的完全解码的情况下识别元数据的处理器)对SSM、PIM或其他元数据的方便的访问,并且允许在比特流的解码期间(例如,子流识别的)方便的和高效的误差检测和校正。例如,在不以示例性格式访问SSM的情况下,解码器可能错误地识别与节目相关联的子流的正确数量。元数据段中的一个元数据有效载荷可以包括SSM,元数据段中的另一元数据有效载荷可以包括PIM,并且可选地,元数据段中的至少一个其他元数据有效载荷可以包括其他元数据(例如,响度处理状态元数据或“LPSM”)。根据一个实施例,提供一种音频处理单元,包括:缓冲存储器,被配置为存储编码音频比特流的至少一个帧,其中编码音频比特流包括音频数据和元数据容器,其中元数据容器包括报头和报头之后的一个或更多个元数据有效载荷,一个或更多个元数据有效载荷包括动态范围压缩元数据,并且动态范围压缩元数据是或者包括简档元数据,简档元数据指示动态范围压缩元数据是否包括在根据至少一个压缩简档对音频数据的至少一个块所指示的音频内容执行动态范围压缩时使用的动态范围压缩控制值,并且其中如果简档元数据指示动态范围压缩元数据包括在根据一个压缩简档执行动态范围压缩时使用的动态范围压缩控制值,则动态范围压缩元数据还包括一组根据压缩简档生成的动态范围压缩控制值;分析器,其耦合至缓冲存储器并且被配置为分析编码音频比特流;以及子系统,其耦合至分析器并且被配置为使用至少一些动态范围压缩元数据对至少一些音频数据或者对通过解码至少一些音频数据而生成的解码音频数据执行动态范围压缩。根据另一个实施例,提供一种音频解码方法,包括步骤:接收编码音频比特流,其中编码音频比特流被划分成一个或更多个帧;从编码音频比特流提取音频数据和元数据容器,其中元数据容器包括报头和报头之后的一个或更多个元数据有效载荷,并且其中一个或更多个元数据有效载荷包括动态范围压缩元数据,并且动态范围压缩元数据是或者包括简档元数据,简档元数据指示动态范围压缩元数据是否包括在根据至少一个压缩简档对音频数据的至少一个块所指示的音频内容执行动态范围压缩时使用的动态范围压缩控制值,并且其中如果简档元数据指示动态范围压缩元数据包括在根据一个压缩简档执行动态范围压缩时使用的动态范围压缩控制值,则动态范围压缩元数据还包括一组根据压缩简档生成的动态范围压缩控制值;以及使用至少本文档来自技高网...
【技术保护点】
一种音频处理单元,包括:缓冲存储器,被配置为存储编码音频比特流的至少一个帧,其中所述编码音频比特流包括音频数据和元数据容器,其中所述元数据容器包括报头和所述报头之后的一个或更多个元数据有效载荷,所述一个或更多个元数据有效载荷包括动态范围压缩元数据,并且所述动态范围压缩元数据是或者包括简档元数据,所述简档元数据指示所述动态范围压缩元数据是否包括在根据至少一个压缩简档对所述音频数据的至少一个块所指示的音频内容执行动态范围压缩时使用的动态范围压缩控制值,并且其中如果所述简档元数据指示所述动态范围压缩元数据包括在根据一个所述压缩简档执行动态范围压缩时使用的动态范围压缩控制值,则所述动态范围压缩元数据还包括一组根据所述压缩简档生成的动态范围压缩控制值;分析器,其耦合至所述缓冲存储器并且被配置为分析所述编码音频比特流;以及子系统,其耦合至所述分析器并且被配置为使用至少一些所述动态范围压缩元数据对至少一些所述音频数据或者对通过解码所述至少一些所述音频数据而生成的解码音频数据执行动态范围压缩。
【技术特征摘要】
2013.06.19 US 61/836,8651.一种音频处理单元,包括:缓冲存储器,被配置为存储编码音频比特流的至少一个帧,其中所述编码音频比特流包括音频数据和元数据容器,其中所述元数据容器包括报头和所述报头之后的一个或更多个元数据有效载荷,所述一个或更多个元数据有效载荷包括动态范围压缩元数据,并且所述动态范围压缩元数据是或者包括简档元数据,所述简档元数据指示所述动态范围压缩元数据是否包括在根据至少一个压缩简档对所述音频数据的至少一个块所指示的音频内容执行动态范围压缩时使用的动态范围压缩控制值,并且其中如果所述简档元数据指示所述动态范围压缩元数据包括在根据一个所述压缩简档执行动态范围压缩时使用的动态范围压缩控制值,则所述动态范围压缩元数据还包括一组根据所述压缩简档生成的动态范围压缩控制值;分析器,其耦合至所述缓冲存储器并且被配置为分析所述编码音频比特流;以及子系统,其耦合至所述分析器并且被配置为使用至少一些所述动态范围压缩元数据对至少一些所述音频数据或者对通过解码所述至少一些所述音频数据而生成的解码音频数据执行动态范围压缩。2.根据权利要求1所述的音频处理单元,其中,一个所述压缩简档是针对指示语音的音频数据的动态范围压缩的简档。3.根据权利要求1所述的音频处理单元,其中,一个所述压缩简档是电影标准压缩简档、电影轻度压缩简档、音乐标准压缩简档或音乐轻度压缩简档。4.根据权利要求1所述的音频处理单元,还包括:音频解码器,其耦合至所述缓冲存储器并且被配置为解码所述音频数据从而生成解码音频数据。5.根据权利要求4所述的音频处理单元,其中,耦合至所述分析...
【专利技术属性】
技术研发人员:杰弗里·里德米勒,迈克尔·沃德,
申请(专利权)人:杜比实验室特许公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。