视频解码的方法和设备技术

技术编号：35127882 阅读：13 留言：0更新日期：2022-10-05 09:59

本公开的各方面包括视频编码/解码的方法、设备和非暂时性计算机可读存储介质。一种设备包括处理电路，所述处理电路解码出当前图片中的当前块的预测信息，所述当前图片为已编码视频序列的一部分。所述预测信息指示用于所述当前块的多个帧内预测方向中的一个帧内预测方向。所述处理电路基于所述预测信息中指示的所述多个帧内预测方向中的所述一个帧内预测方向，确定多个参考行的子集。所述处理电路基于已确定的所述多个参考行的子集，执行对所述当前块的帧内预测；所述处理电路基于所述当前块的所述帧内预测，重建所述当前块。重建所述当前块。重建所述当前块。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】视频解码的方法和设备
引用并入
[0001]本申请要求于2021年6月28日提交的美国专利申请第17/360,803号，“视频解码的方法和设备(METHOD AND APPARATUS FOR VIDEO CODING)”的优先权，该申请要求于2020年9月24日提交的美国临时申请第63/082,806号，“无插值定向帧内预测(INTERPOLATION
‑
FREE DIRECTIONAL INTRA PREDICTION)”的优先权。这些在先申请的全部公开内容在此通过引用整体并入本文。

[0002]本申请描述总体上涉及视频解码的实施例。

技术介绍

[0003]本文所提供的背景描述旨在整体呈现本申请的背景。在
技术介绍
部分以及本说明书的各个方面中所描述的目前已署名的专利技术人的工作所进行的程度，并不表明其在本申请提交时作为现有技术，且从未明示或暗示其被承认为本申请的现有技术。
[0004]可以使用具有运动补偿的帧间图片预测来进行视频编码和解码。未压缩的数字视频可包括一系列图片，每个图片具有例如1920
×
1080亮度样本及相关色度样本的空间维度。所述系列图片具有固定的或可变的图片速率(也非正式地称为帧率)，例如每秒60个图片或60Hz。未压缩的视频具有非常大的比特率要求。例如，每个样本8比特的1080p60 4:2:0的视频(1920x1080亮度样本分辨率，60Hz帧率)要求接近1.5Gbit/s带宽。一小时这样的视频就需要超过600GB的存储空间。
>[0005]视频编码和解码的一个目的，是通过压缩减少输入视频信号的冗余信息。视频压缩可以帮助降低对上述带宽或存储空间的要求，在某些情况下可降低两个或更多数量级。无损和有损压缩，以及两者的组合均可采用。无损压缩是指从压缩的原始信号中重建原始信号精确副本的技术。当使用有损压缩时，重建信号可能与原始信号不完全相同，但是原始信号和重建信号之间的失真足够小，使得重建信号可用于预期应用。有损压缩广泛应用于视频。容许的失真量取决于应用。例如，相比于电视应用的用户，某些消费流媒体应用的用户可以容忍更高的失真。可实现的压缩比反映出：较高的允许/容许失真可产生较高的压缩比。
[0006]视频编码器和解码器可利用几大类技术，例如包括：运动补偿、变换、量化和熵编码。
[0007]视频编解码器技术可包括已知的帧内编码技术。在帧内编码中，在不参考先前重建的参考图片的样本或其它数据的情况下表示样本值。在一些视频编解码器中，图片在空间上被细分为样本块。当所有的样本块都以帧内模式编码时，该图片可以为帧内图片。帧内图片及其衍生(例如独立解码器刷新图片)可用于复位解码器状态，并且因此可用作编码视频比特流和视频会话中的第一图片，或用作静止图像。帧内块的样本可用于变换，且可在熵编码之前量化变换系数。帧内预测可以是使预变换域中的样本值最小化的技术。在某些情
形下，变换后的DC值越小，且AC系数越小，则在给定的量化步长尺寸下需要越少的比特来表示熵编码之后的块。
[0008]如同从诸如MPEG
‑
2代编码技术中所获知的，传统帧内编码不使用帧内预测。然而，一些较新的视频压缩技术包括：试图从例如周围样本数据和/或元数据中得到数据块的技术，其中周围样本数据和/或元数据是在空间相邻的编码和/或解码期间、且在解码顺序之前获得的。这种技术后来被称为"帧内预测"技术。需要注意的是，至少在某些情形下，帧内预测仅使用正在重建的当前图片的参考数据，而不使用参考图片的参考数据。
[0009]可以存在许多不同形式的帧内预测。当在给定的视频编码技术中可以使用超过一种这样的技术时，所使用的技术可以按帧内预测模式进行编码。在某些情形下，模式可具有子模式和/或参数，且这些模式可单独编码或包含在模式码字中。将哪个码字用于给定模式，子模式和/或参数组合会通过帧内预测影响编码效率增益，因此用于将码字转换成比特流的熵编码技术也会出现这种情况。
[0010]H.264引入了一种帧内预测模式，其在H.265中进行了改进，在更新的编码技术中，例如，联合探索模型(JEM)、通用视频编码(VVC)、基准集合(BMS)等等，对其进一步进行了改进。通过使用属于已经可用的样本的相邻样本值可以形成预测块。将相邻样本的样本值按照某一方向复制到预测块中。对所使用方向的引用可以被编码在比特流中，或者本身可以被预测。
[0011]参照图1A，右下方描绘了来自H.265的33个可能的预测方向(对应于35个内部模式中的33个角度模式)中已知的九个预测方向的子集。箭头会聚的点(101)表示正在被预测的样本。箭头表示样本正在被预测的方向。例如，箭头(102)表示根据右上方与水平方向成45度角的一个或多个样本，预测样本(101)。类似地，箭头(103)表示根据左下方与水平方向成22.5度角的一个或多个样本，预测样本(101)。
[0012]仍然参考图1A，在左上方示出了一个包括4
×
4个样本的正方形块(104)(由粗虚线表示)。正方形块(104)由16个样本组成，每个样本用“S”、以及其在Y维度(例如，行索引)上的位置和在X维度(例如，列索引)上的位置来标记。例如，样本S21是Y维度上的第二个样本(从顶部开始)和X维度上的第一个(从左侧开始)样本。类似地，样本S44在Y维度和X维度上都是块(104)中的第四个样本。由于该块为4
×
4尺寸的样本，因此S44位于右下角。还示出了遵循类似编号方案的参考样本。参考样本用"R"、以及其相对于块(104)的Y位置(例如，行索引)和X位置(例如，列索引)来标记。在H.264与H.265中，预测样本与正在重建的块相邻，因此不需要使用负值。
[0013]通过从信号通知的预测方向所占用的相邻样本来复制参考样本值，可以进行帧内图片预测。例如，假设编码视频比特流包括信令，对于该块，该信令指示与箭头(102)一致的预测方向，即，根据右上方与水平方向成45度角的一个或多个预测样本来预测样本。在这种情况下，根据同一参考样本R05，预测样本S41、S32、S23和S14。然后，根据参考样本R08，预测样本S44。
[0014]在某些情况下，例如通过插值，可以合并多个参考样本的值，以便计算参考样本，尤其是当方向不能被45度整除时。
[0015]随着视频编码技术的发展，可能的方向的数量已经增加了。在H.264(2003年)中，可以表示九种不同的方向。在H.265(2013年)和JEM/VVC/BMS中增加到了33个，而在此申请
时，可以支持多达65个方向。已经进行了实验来识别最可能的方向，并且熵编码中的某些技术被用于使用少量比特来表示那些可能的方向，对于较不可能的方向则接受某些代价。此外，有时可以根据在相邻的、已经解码的块中所使用的相邻方向来预测方向本身。
[0016]图1B是一种示意图(105)，其描述了根据JEM的65种帧内预测方向，以说明随着时间的推移预测方向的数量增加。
本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种在解码器中进行视频解码的方法，其特征在于，所述方法包括：解码出当前图片中的当前块的预测信息，所述当前图片为已编码视频序列的一部分，所述预测信息指示用于所述当前块的多个帧内预测方向中的一个帧内预测方向；基于所述预测信息中指示的所述多个帧内预测方向中的所述一个帧内预测方向，确定多个参考行的子集；基于已确定的所述多个参考行的子集，执行对所述当前块的帧内预测；以及基于所述当前块的所述帧内预测，重建所述当前块。2.根据权利要求1所述的方法，其中，已确定的所述多个参考行的子集中的参考行的数目大于1。3.根据权利要求1所述的方法，其中，与所述多个参考行中的第一参考行相关联的帧内预测方向，不同于与所述多个参考行中的第二参考行相关联的帧内预测方向。4.根据权利要求1所述的方法，其中，所述多个帧内预测方向与所述多个参考行中的第一参考行相关联，并且所述多个帧内预测方向的子集与所述多个参考行中的第二参考行相关联。5.根据权利要求1所述的方法，其中，所述确定包括：基于所述帧内预测方向中的所述一个帧内预测方向和相应样本的位置，为所述当前块的每个样本确定所述多个参考行的所述子集中的一。6.根据权利要求1所述的方法，其中，所述预测信息包括语法元素，所述语法元素指示是否要基于所述多个参考行对所述当前块执行所述帧内预测。7.根据权利要求1所述的方法，其中，所述当前块不位于包括所述当前块的编码树单元的顶部边界附近。8.根据权利要求1所述的方法，其中，与所述多个帧内预测方向中的所述一个帧内预测方向相关联的预测角度的正切值和余切值中的一个为整数。9.根据权利要求1所述的方法，其中，所述确定包括：基于与所述帧内预测方向中的所述一个帧内预测方向相关联的预测角度的正切值和所述当前块的所述相应样本行的行号，为所述当前块的样本的每行确定所述多个参考行的所述子集中的一个参考行的参考行索引。10.一种设备，包括处理电路，其特征在于，所述处理电路被配置为：解码出当前图片中的当前块的预测信息，所述当前图片为已编码视频序列的一部分，所述预测信息指示用于所述当前块的多个帧内预测方向中的一个帧内预测方向；基于所述预测信息中指示的所述多个帧内预测方向中的所述一个帧内预测方向，确定多个参考行的子集；基于已确定的所述多个参考行的子集，执行...

【专利技术属性】
技术研发人员：赵欣，赵亮，刘杉，
申请(专利权)人：腾讯美国有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人