跨层参考限制条件制造技术

技术编号:34944449 阅读:20 留言:0更新日期:2022-09-17 12:19
本揭露提供了一种使用层间预测或参考的视频编解码方法。视频解码器接收来自承载多个不同层中的视频图片的比特流的数据。所述复数层中的至少一个包括一对应在分层时间预测结构中的级别的时间子层。每个所述时间子层与一时间识别码相关联。视频解码器接收限制层间预测中使用的最大时间子层的层间预测限制参数。视频解码器通过参考第二层中的第二图片的数据执行层间预测,用以重建在一第一层中的第一图片。参考数据的时间识别码满足接收到的层间预测限制参数。预测限制参数。预测限制参数。

【技术实现步骤摘要】
【国外来华专利技术】跨层参考限制条件
[0001]交叉引用
[0002]本申请享有2020年2月19日提交的申请号为62/978,360、2020年4月7日提交的申请号为63/006,658、2020年4月17日提交的申请号为63/011,849的美国临时专利申请的优先权,该先前申请在此全文引用。


[0003]本揭露一般涉及视频编解码,特别是涉及层间参考和预测。

技术介绍

[0004]除非在此另有说明,本节中描述的方法不是下面列出的请求保护范围的现有技术,并且不被承认为包含在本节中的现有技术。
[0005]高效视频编码(High

efficiency video coding,简称HEVC)是由视频编码联合协作组(JCT

VC)开发的国际视频编码标准。输入视频信号是从重建信号中预测出来的,重建信号是从编码图片区域导出的。通过线性变换处理预测残差信号。变换系数与比特流中的其他辅助信息一起被量化和熵编码。重建信号是在去量化变换系数进行逆变换之后,根据预测信号和重建残差信号生成的。重建信号通过环路滤波进一步处理以去除编码伪影。解码后的图片存储在帧缓冲器中,用于预测输入视频信号中的未来图片。
[0006]在HEVC中,编码图片被分割成由相关联的编码树单元(Coding Tree Unit,简称CTU)表示的非重迭方形块区域。一个CTU可以使用递归四叉树(Quadtree,简称QT)结构划分为多个不重迭的编码单元(Coding Unit,简称CU),以适应各种局部运动和纹理特征。一个CTU也可以被一个使用二元和三元分割的嵌套多类型树的四叉树分割成一个或多个较小尺寸的CU。所生成的CU分区可以是正方形或矩形。
[0007]为每个CU指定一个或多个预测单元(Predicted Unit,简称PU)。预测单元与相关联的CU语法一起用作用于通知预测器信息的基本单元。指定的预测流程用于预测PU内相关像素样本的值。可以使用残差四叉树(Residential Quadtree,简称RQT)结构进一步分割CU,以表示相关联的预测残差信号。RQT的叶节点对应于变换单元(Transform Unit简称TU)。变换单元由大小为8x8、16x16或32x32的亮度样本的变换块(Transform Block,简称TB)或具4:2:0色彩格式图片的大小为4x4的亮度样本的四个变换块、以及色度样本的两个相应变换块组成。整数变换应用于一变换块,而量化系数的平均值与其他辅助信息一起在比特流中进行熵编解码。
[0008]术语编码树块(CTB)、编码块(CB)、预测块(PB)和变换块(TB)被定义为指定分别与CTU、CU、PU和TU对应的一色彩分量的二维取样阵列。因此,一个CTU由一个亮度CTB、两个色度CTB和相关的语法元素组成。类似的关系适用于CU、PU和TU。树分区通常同时应用于亮度和色度,但当色度达到某些最小尺寸时会出现例外情况。
[0009]网络抽象层(Network Abstraction Layer,简称NAL)单元是编码视频比特流中包装语法结构的逻辑数据单元,因此,所述逻辑数据单元可以包含后续的数据的类型的指示
以及包含以原始比特组序列负荷(raw byte sequence payload,简称RBSP)形式的数据的比特组。每个NAL单元都有一个NAL单元标头(NAL unit header,简称NUH)。用于为视频编码层(video coding layer,简称VCL)携带压缩视频数据的NAL单元称为VCL NAL单元。NAL单元也可用于仅携带参数而无需实际视频数据,这些被称为非VCL NAL单元。
[0010]每个NAL单元的标头也在语法元素nal_unit_type中指示NAL单元的类型。举例而言,nal_unit_type可以用来表示NAL单元携带的图片类型,图片类型如渐进解码刷新(gradual decoding refres,简称GDR)图片、帧内随机访问图片(intra random access picture,简称IRAP)、瞬时解码刷新(instantaneous decoding refresh简称IDR)图片、随机访问可解码前导(random access decodable leading,简称RADL)图片、随机访问跳过前导(random access skipped leading,简称RASL)图片等。
[0011]编码视频可以在多个子流中具有多层数据以实现可适性视频编解码(scalable video coding)。承载不同层的不同子流包装在不同的NAL单元中,每个NAL单元的标头(NUH)在语法元素nuh_layer_id中标识NAL单元的层。nuh_layer_id的不同值表示不同的层,属于同一层的VCL NAL单元和关联的非VCL NAL单元具有相同的nuh_layer_id。

技术实现思路

[0012]以下概述仅是说明性的,并不旨在以任何方式进行限制。即,提供以下概要以介绍本文描述的新颖且非显而易见的技术的概念、强调、益处和优点。在下面的详细描述中进一步描述了选择而不是所有的实现。因此,以下概述不旨在确定要求保护的主题的基本特征,也不旨在用于确定要求保护的主题的范围。
[0013]本揭露的一些实施例提供了一种使用层间预测或参考的视频编码方法。视频解码器接收来自承载多个不同层中的视频图片的比特流的数据。所述复数层中的至少一个包括多个时间子层,所述多个时间子层对应在分层时间预测结构中的多个级别。每个所述时间子层与一时间识别码相关联。视频解码器接收限制层间预测中使用的最大时间子层的层间预测限制参数。视频解码器通过参考第二层中的第二图片的参考数据执行层间预测,用以重建在第一层中的一第一图片。参考数据对应的时间识别码满足接收到的层间预测限制参数的限制。
[0014]在一些实施例中,当视频参数集(video parameter set,简称VPS)中的特定旗标指示存在层间预测限制参数时,在适用于第一图片的视频参数集中发送层间预测限制参数的讯号。在一些实施例中,当时间识别码小于或等于由层间预测限制参数指示的数值时,参考数据的时间识别码满足接收的层间预测限制参数的限制。在一些实施例中,当层间预测限制参数被设置为零时,视频解码器不允许对第一图片进行层间预测。
[0015]当第三图片与大于层间预测限制参数所指示数值的时间识别码相关联时,视频解码器可以排除第三图片以用作第一图片的层间预测的参考。
[0016]在一些实施例中,层间预测限制参数仅适用于第二层用作第一层的层间预测的参考层时,当另一层作为参考层用于第一层的层间预测时,层间预测限制参数则不适用。在一些实施例中,第一图片(带条)的层间参考预测(inter

layer reference prediction简称ILRP)列表中的条目是帧内随机访问点图片(IRAP)或一参考层中具有满足适用于第一层和参考层的层间预测限制参数限制的时间本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种视频解码方法,包括:接收来自承载多个不同层中的视频图片的比特流的数据,其中所述复数层中的至少一个包括多个时间子层,所述多个时间子层对应在分层时间预测结构中的多个级别,每个所述时间子层与时间识别码相关联;接收层间预测限制参数;和通过参考第二层中的第二图片的参考数据执行层间预测,用以重建在第一层中的第一图片,其中所述参考数据对应的时间识别码满足接收到的层间预测限制参数的限制。2.根据权利要求1所述的视频解码方法,其特征在于,所述视频图片数据由网络抽象层(NAL)单元携带,并且所述参考数据的时间识别码编码于承载所述第二层中所述第二图片的网络抽象层单元的标头。3.根据权利要求1所述的视频解码方法,其特征在于,当视频参数集(VPS)中的特定旗标指示所述层间预测限制参数存在时,所述的层间预测限制参数被信号发送于适用于所述第一图片的视频参数集中。4.根据权利要求1所述的视频解码方法,其特征在于,当所述时间识别码小于或等于由所述层间预测限制参数指示的数值时,所述参考数据的时间识别码满足接收到的所述层间预测限制参数的限制。5.根据权利要求1所述的视频解码方法,其特征在于,更包括:当第三图片的时间识别码大于由所述层间预测限制参数所指示的数值时,排除所述第三图片用作所述第一图片的层间预测的参考。6.根据权利要求1所述的视频解码方法,其特征在于,更包括:当层间预测限制参数被设置为零时,不允许对所述第一图片进行层间预测。7.根据权利要求1所述的视频解码方法,其特征在于,当所述第二层用作所述第一层的层间预测的参考层时,所述层间预测限制参数适用,而当另一层作为所述参考层用于所述第一层的层间预测时,所述层间预测限制参数则不适用。...

【专利技术属性】
技术研发人员:赖贞延陈庆晔庄子德欧莱娜
申请(专利权)人:寰发股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1