用于下一代视频的预测和编码的内容自适应划分制造技术

技术编号：11991082 阅读：148 留言：0更新日期：2015-09-02 19:22

描述了与用于预测和编码的内容自适应划分相关联的技术。一种用于视频编码中的划分的计算机实现的方法包括：接收视频帧；将视频帧分割成多个瓦片、编码单元或超片段；针对至少一个瓦片、编码单元或超片段确定选定划分技术以用于进行预测或编码划分，其中，所述选定划分技术包括结构化划分技术，其包括二分树划分技术、k-d树划分技术、二分树划分技术的码本表示或者k-d树划分技术的码本表示中的至少一个；采用所述选定划分技术将所述至少一个瓦片、编码单元或超片段划分成多个预测分区；以及将与所述多个预测分区相关联的划分指示符或码字编码到比特流当中。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于下一代视频的预测和编码的内容自适应划分相关申请本申请要求2013年1月30日提交的专利技术名称为“NEXTGENERATIONVIDEOCODING”的美国临时申请No.61/758,314的优先权，在此将其内容全文并入本文。
技术介绍
视频编码器压缩视频信息，使得更多的信息可以通过给定的带宽被发送。压缩的信号然后可以被传送到具有解码器的接收机，所述解码器在显示之前对信号进行解码或解压缩。高效视频编码(HEVC)是最新的视频压缩标准，其是由ISO/IEC运动图片专家组(MPEG)和ITU-T视频编码专家组(VCEG)组成的视频编码联合组(JCT-VC)开发的。HEVC响应于以前的H.264/AVC(高级视频编码)标准不提供足够的压缩而进行开发，以用于发展较高分辨率视频应用。类似于以前的视频编码标准，HEVC包括基本功能模块，例如，帧内/帧间预测、变换、量化、循环内滤波和熵编码。正在发展的HEVC标准可以试图改进对H.264/AVC标准的限制，例如，对被允许的预测分区和编码分区的有限选择、有限的被允许的多参考和预测生成、有限的变换块尺寸和实际变换、用于减少编码伪像的有限机制、和低效熵编码技术。然而，正在发展的HEVC标准可以使用迭代方法来解决这样的问题。附图说明本文描述的材料作为示例而不是作为限制在附图中示出。为了举例说明的简单和清楚，在附图中所示的元件不一定按比例绘制。例如，为了清楚，一些元件的尺寸可以相对于其它元件被放大。此外，在被认为适当的场合，附图标记在附图当中重复以指示相对应的或类似的元件。在附图中：图1是示例下一代视频编码器的示意图；图2是示例下一...

【技术保护点】
一种用于视频编码中的划分的计算机实现的方法，其包括：接收视频帧；将所述视频帧分割成多个瓦片、编码单元或超片段；针对至少一个瓦片、编码单元或超片段确定选定划分技术以用于进行预测或编码划分，其中，所述选定划分技术包括结构化划分技术，其包括二分树划分技术、k‑d树划分技术、二分树划分技术的码本表示或者k‑d树划分技术的码本表示中的至少一个；采用所述选定划分技术将所述至少一个瓦片、编码单元或超片段划分成多个预测分区；以及将与所述多个预测分区相关联的划分指示符或码字编码到比特流当中。

【技术特征摘要】
【国外来华专利技术】2013.01.30 US 61/758,3141.一种用于视频编码中的划分的计算机实现的方法，其包括：接收视频帧；将所述视频帧分割成多个瓦片、编码单元或超片段；针对至少一个瓦片、编码单元或超片段确定选定划分技术以用于进行预测或编码划分，包括：至少部分地取决于所述视频帧的图片类型来选择所述划分技术，使得I图片是通过使用k-d树划分技术来进行划分的，并且P图片是通过使用二分树划分技术来进行划分的；其中，所述选定划分技术包括结构化划分技术，其包括所述二分树划分技术、所述k-d树划分技术、所述二分树划分技术的码本表示或者所述k-d树划分技术的码本表示中的至少一个；采用所述选定划分技术将所述至少一个瓦片、编码单元或超片段划分成多个预测分区；以及将与所述多个预测分区相关联的划分指示符或码字编码到比特流当中。2.根据权利要求1所述的方法，还包括：将所述视频帧分割成两个或更多个区域层，其中，将所述视频帧分割成所述多个瓦片、编码单元或超片段包括将所述视频帧分割成多个超片段，并且其中，至少一个超片段包括所述两个或更多个区域层中的单独的区域层。3.根据权利要求1所述的方法，其中，将所述视频帧分割成所述多个瓦片、编码单元或超片段包括将所述视频帧分割成多个瓦片。4.根据权利要求1所述的方法，还包括：确定与所述多个预测分区相关联的多个预测的分区和相对应的原始像素数据的差异，以生成相对应的多个预测误差数据分区；确定所述多个预测误差数据分区中的单独的预测误差数据分区需要编码；以及对于需要编码的所述单独的预测误差数据分区：将所述预测误差数据分区划分成多个编码分区，其中，对所述预测误差数据分区进行划分包括二分树划分。5.根据权利要求1所述的方法，还包括：生成与所述多个预测分区的第一单独的预测分区相关联的帧间预测数据；生成与第二视频帧的第二瓦片、编码单元或超片段的第二多个预测分区的第二单独的预测分区相关联的帧内预测数据；确定所述多个预测分区和相对应的原始像素数据的差异，以生成相对应的多个预测误差数据分区；确定所述多个预测误差数据分区中的单独的预测误差数据分区需要编码；对于需要编码的所述单独的预测误差数据分区：将所述预测误差数据分区划分成多个编码分区，其中，对所述预测误差数据分区进行划分包括二分树划分；采用编码分区索引值来对所述多个编码分区编索引；将所述编码分区和所述编码分区索引值发送至编码控制器；以及对所述单独的预测误差数据分区的编码分区执行前向变换和量化以生成与所述单独的预测误差数据分区相关联的数据；将与所述第一单独的预测分区相关联的帧间预测数据、限定所述第一单独的预测分区的数据、与所述第二单独的预测分区相关联的帧内预测数据、限定所述第二单独的预测分区的数据以及与所述单独的预测误差数据分区相关联的数据熵编码到比特流当中。6.根据权利要求1所述的方法，其中，确定所述选定划分技术包括至少部分地基于所述视频帧的图片类型来确定所述选定划分技术，其中，所述图片类型包括F/B图片，并且其中，所述选定划分技术包括所述二分树划分技术。7.根据权利要求1所述的方法，其中，确定所述选定划分技术包括至少部分地基于所述至少一个瓦片、编码单元或超片段的特征来确定所述选定划分技术，其中，所述特征包括所述至少一个瓦片、编码单元或超片段中的帧内块的预期量，并且其中，在所述帧内块的预期量大于阈值时，所述选定划分技术包括所述k-d树划分技术，并且其中，在所述帧内块的预期量低于阈值时，所述选定划分技术包括所述二分树划分技术。8.根据权利要求1所述的方法，其中，对所述至少一个瓦片、编码单元或超片段进行划分包括划分约束条件。9.根据权利要求1所述的方法，还包括：将所述视频帧分割成两个或更多个区域层，其中，所述两个或更多个区域层包括4像素、8像素或16像素中的至少一个的精确度，其中，所述两个或更多个区域层包括区域边界，其中，将所述视频帧分割成所述多个瓦片、编码单元或超片段包括将所述视频帧分割成多个超片段，其中，对所述视频帧进行分割包括采用16×16像素块的符号运行编码，并且其中，至少一个超片段包括所述两个或更多个区域层的单独的区域层；对所述区域边界进行编码，其中，对所述区域边界进行编码包括符号运行编码或者生成在瓦片网格上逼近所述区域边界的码本中的至少一个，其中，所述瓦片网格是具有32×32像素或者64×64像素中的至少一个尺寸的等间隔瓦片网格；采用预测分区索引值来对所述多个预测分区编索引；将所述多个预测分区和预测分区索引值发送至编码控制器；生成与所述多个预测分区中的第一单独的预测分区相关联的帧间预测数据，其中，所述帧间预测数据包括运动矢量数据；生成与第二视频帧的第二瓦片、编码单元或超片段的第二多个预测分区的第二单独的预测分区相关联的帧内预测数据；确定与所述多个预测分区相关联的多个预测的分区和相对应的原始像素数据的差异，以生成相对应的多个预测误差数据分区，其中，所述多个预测的分区中的第一预测的分区至少部分地基于参考帧进行预测，所述参考帧包括紧挨着的之前的参考帧、更早的之前的参考帧、未来参考帧、变形参考帧或合成参考帧；基于所述参考帧来生成针对所述第一预测的分区的参考类型指示符；基于所述第一预测的分区的预测模式来生成预测模式指示符，其中，所述预测模式从帧间、多重、帧内、跳过、自动或拆分中的至少一个中进行选择；将所述参考类型指示符和所述预测模式编码到所述比特流当中；确定所述多个预测误差数据分区中的单独的预测误差数据分区需要编码；对于需要编码的所述单独的预测误差数据分区：将所述预测误差数据分区划分成多个编码分区，其中，对所述预测误差数据分区进行划分包括二分树划分；采用编码分区索引值来对所述多个编码分区编索引；将所述编码分区和所述编码分区索引值发送至所述编码控制器；以及对所述单独的预测误差数据分区的编码分区执行前向变换和量化以生成与所述单独的预测误差数据分区相关联的数据；将与所述第一单独的预测分区相关联的帧间预测数据、限定所述第一单独的预测分区的数据、与所述第二单独的预测分区相关联的帧内预测数据、限定所述第二单独的预测分区的数据、以及与所述单独的预测误差数据分区相关联的数据熵编码到比特流当中；发送所述比特流；接收所述比特流；对所述比特流进行熵解码，以确定与所述第一单独的预测分区相关联的帧间预测数据、限定所述第一单独的预测分区的数据、与所述第二单独的预测分区相关联的帧内预测数据、限定所述第二单独的预测分区的数据、以及与所述单独的预测误差数据分区相关联的数据，其中，所述第一单独的预测分区包括二分树分区，以及所述第二单独的预测分区包括k-d树分区；至少部分地基于与所述单独的预测误差数据分区相关联的数据来执行反向量化和反向变换，以生成解码的编码分区；合并解码的编码分区以生成解码的预测误差数据分区；将第一单独解码的预测的分区加到解码的预测误差数据分区以生成第一重构分区；装配所述第一重构分区和第二重构分区以生成第一瓦片、第一编码单元或第一超片段中的至少一个；将解块滤波或质量恢复滤波中的至少一个应用到所述第一瓦片、所述第一编码单元或所述第一超片段，以生成第一最终解码的瓦片、编码单元或超片段；将所述第一最终解码的瓦片、编码单元或超片段与第二最终解码的瓦片、编码单元或超片段进行装配以生成第一解码的视频帧；至少部分地基于所述帧间预测数据来执行运动补偿以生成第二解码的单独的预测分区；至少部分地基于所述帧内预测数据来执行针对第二多个分区的第三解码的单独的预测分区的帧内预测；至少部分地基于所述运动补偿来生成第二解码的视频帧；至少部分地基于所述帧内预测来生成第三解码的视频帧；以及发送所述第一、第二和第三解码的视频帧以经由显示设备进行呈现，其中，将所述视频帧分割成所述多个瓦片、或编码单元、或超片段包括将所述视频帧分割成多个瓦片，其中，确定所述选定划分技术包括至少部分地基于所述视频帧的图片类型来确定所述选定划分技术，其中，所述图片类型包括I图片(帧内图片)、P图片(预测性图片)或者F/B图片(功能/双向图片)中的至少一个，其中，所述图片类型包括所述I图片，并且其中，所述选定划分技术包括所述k-d树划分技术，其中，所述图片类型包括所述P图片，并且其中，所述选定划分技术包括所述二分树划分技术，其中，所述图片类型包括所述F/B图片，并且其中，所述选定划分技术包括所述二分树划分技术，其中，确定所述选定划分技术包括至少部分地基于所述至少一个瓦片、编码单元或超片段的特征来确定所述选定划分技术，其中，所述特征包括所述至少一个瓦片、编码单元或超片段中的帧内块的预期量，并且其中，在所述帧内块的预期量大于阈值时，所述选定划分技术包括所述k-d树划分技术，并且其中，在所述帧内块的预期量低于阈值时，所述选定划分技术包括所述二分树划分技术，并且其中，对所述至少一个瓦片、编码单元或超片段进行划分包括划分约束条件，其中，所述划分约束条件包括将第一分区预定义为沿第一维度对至少一个帧部分进行二等分，以及将第二分区预定义为沿第二维度对所述至少一个帧部分进行二等分，并且其中，所述第一维度包括垂直维度，以及所述第二维度包括水平维度。10.一种视频编码器，其包括：图像缓冲器；包括预测分区发生器逻辑电路的图形处理单元，其中，所述图形处理单元通信地耦合至所述图像缓冲器并且其中，所述预测分区发生器逻辑电路被配置为：接收视频帧；将所述视频帧分割成多个瓦片、编码单元或超片段；针对至少一个瓦片、编码单元或超片段来确定选定划分技术，包括：至少部分地取决于所述视频帧中帧内块的预期量来选择所述划分技术，使得当所述帧内块的预期量大于阈值时k-d树划分技术被选择，并且当所述帧内块的预期量小于阈值时，二分树划分技术被选择；其中，所述选定划分技术包括结构化划分技术，所述结构化划分技术包括所述二分树划分技术、所述k-d树划分技术、所述二分树划分技术的码本表示或者所述k-d树划分技术的码本表示中的至少一个；以及采用所述选定划分技术将所述至少一个瓦片、编码单元或超片段划分成多个预测分区。11.根据权利要求10所述的视频编码器，其中，所述预测分区发生器逻辑电路还被配置为：将所述视频帧分割成两个或更多个区域层，其中，将所述视频帧分割成多个瓦片、编码单元或超片段包括所述预测分区发生器逻辑电路被配置为将所述视频帧划分成多个超片段，并且其中，至少一个超片段包括所述两个或更多个区域层的单独的区域层。12.根据权利要求10所述的视频编码器，其中，将所述视频帧分割成多个瓦片、编码单元或超片段包括所述预测分区发生器逻辑电路被配置为将所述视频帧分割成多个瓦片。13.根据权利要求10所述的视频编码器，所述图形处理单元还包括：差异确定逻辑电路，其被配置为：确定与所述多个预测分区相关联的多个预测的分区和相对应的原始像素数据的差异，以生成相对应的多个预测误差数据分区；编码分区发生器逻辑电路，其被配置为：确定所述多个预测误差数据分区中的单独的预测误差数据分区需要编码；并且对于需要编码的单独的残差：将所述预测误差数据分区划分成多个编码分区，其中，对所述预测误差数据分区进行划分包括二分树划分。14.根据权利要求10所述的视频编码器，其中，确定所述选定划分技术包括所述预测分区发生器逻辑电路被配置为至少部分地基于所述视频帧的图片类型来确定所述选定划分技术。15.根据权利要求10所述的视频编码器，其中，确定所述选定划分技术包括所述预测分区发生器逻辑电路被配置为至少部分地基于在相同的帧上的并且与瓦片、编码单元或超片段的另一相同类型的分区的特征不同的至少一个瓦片、编码单元或超片段的特征来确定所述选定划分技术。16.根据权利要求10所述的视频编码器，所述图形处理单元还包括：帧间预测逻辑电路，其被配置为：生成与所述多个预测分区中的第一单独的预测分区相关联的帧间预测数据，其中，所述帧间预测数据包括运动矢量数据；帧内预测逻辑电路，其被配置为：生成与第二视频帧的第二瓦片、编码单元或超片段的第二多个预测分区的第二单独的预测分区相关联的帧内预测数据；差异确定逻辑电路，其被配置为：确定与所述多个预测分区相关联的多个预测的分区和相对应的原始像素数据的差异，以生成相对应的多个预测误差数据分区，其中，所述多个预测的分区中的第一预测的分区至少部分地基于参考帧进行预测，所述参考帧包括紧挨着的之前的参考帧、更早的之前的参考帧、未来参考帧、变形参考帧或合成参考帧；编码分区发生器逻辑电路，其被配置为：确定所述多个预测误差数据分区中的单独的预测误差数据分区需要编码；以及对于需要编码的单独的残差：将所述预测误差数据分区划分成多个编码分区，其中，对所述预测误差数据分区进行划分包括二分树划分；采用编码分区索引值来对所述多个编码分区编索引；以及将所述编码分区和所述编码分区索引值发送至编码控制器；自适应变换逻辑电路和自适应量化逻辑电路，其被配置为对所述单独的预测误差数据分区的编码分区执行前向变换和量化以生成与所述单独的预测误差数据分区相关联的数据；以及自适应熵编码器逻辑电路，其被配置为：将与所述第一单独的预测分区相关联的帧间预测数据、限定所述第一单独的预测分区的数据、与所述第二单独的预测分区相关联的帧内预测数据、限定所述第二单独的预测分区的数据以及与所述单独的预测误差数据分区相关联的数据熵编码到比特流当中；并且发送所述比特流，其中，所述预测分区发生器逻辑电路还被配置为：将所述视频帧分割成两个或更多个区域层，其中，所述两个或更多个区域层包括4像素、8像素或16像素中的至少一个的精确度，其中，所述两个或更多个区域层包括区域边界，其中，将所述视频帧分割成所述多个瓦片、编码单元或超片段包括所述预测分区发生器逻辑电路进一步被配置为将所述视频帧分割成多个超片段，其中，将所述视频帧分割成所述多个瓦片、编码单元或超片段包括所述预测分区发生器逻辑电路进一步被配置为采用16×16像素块通过符号运行编码来对所述视频帧进行分割，并且其中，至少一个超片段包括所述两个或更多个区域层的单独的区域层；对所述区域边界进行编码，其中，对所述区域边界进行编码包括符号运行编码或者生成在瓦片网格上逼近所述区域边界的码本中的至少一个，其中，所述瓦片网格是具有32×32像素或者64×64像素中的至少一个的尺寸的等间隔瓦片网格；采用预测分区索引值来对所述多个预测分区编索引；将所述多个预测分区和所述预测分区索引值发送至编码控制器；其中，将所述视频帧分割成所述多个瓦片、编码单元或超片段包括所述预测分区发生器逻辑电路被配置为将所述视频帧分割成多个瓦片，其中，确定所述选定划分技术包括所述预测分区发生器逻辑电路被配置为至少部分地基于所述视...

【专利技术属性】
技术研发人员：A·普里，N·N·戈卡莱，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人