用于视频编码的方法和装置制造方法及图纸

技术编号:38428681 阅读:12 留言:0更新日期:2023-08-07 11:25
本公开内容的各方面提供了用于视频解码的方法和装置。在一些示例中,该装置包括处理电路。该处理电路从已编码视频比特流解码当前图片中的当前块的预测信息并且预测信息指示帧间预测。该处理电路针对当前块确定运动信息,运动信息包括第一运动矢量(MV),第一运动矢量具有x分量和y分量,其中,x分量和y分量中的每一个具有分数MV精度,分数MV精度为当前块中的样本大小的2

【技术实现步骤摘要】
用于视频编码的方法和装置
[0001]优先权信息
[0002]本申请要求于2018年8月3日提交的美国临时申请62/714,546号和2019年4月24日提交的美国专利申请第16/393,587号的优先权,其全部公开内容通过引用并入本文中。
[0003]本申请对申请号为201980021172.8,申请日为2019年7月15日,专利技术名称为“用于视频解码的方法和装置”的中国专利申请提出分案申请。


[0004]本公开内容描述了一般地与视频编码有关的实施方式。

技术介绍

[0005]本文提供的
技术介绍
描述是出于大概呈现本公开内容的上下文的目的。就本
技术介绍
部分中描述的工作而言,目前署名的专利技术人的工作以及在提交时可能不符合作为现有技术的说明书的各方面,既没有明确地也没有隐含地被承认为针对本公开内容的现有技术。
[0006]可以使用具有运动补偿的帧间图片预测来执行视频编码和解码。未压缩的数字视频可以包括一系列图片,每个图片的空间维度为例如1920
×
1080亮度样本和相关联的色度样本。该一系列图片可以具有例如每秒60个图片或60Hz的固定的或可变的图片速率(也被非正式地称为帧速率)。未压缩的视频具有显著的比特率要求。例如,每样本8比特的1080p60 4:2:0视频(60Hz帧速率下1920
×
1080亮度样本分辨率)需要接近1.5Gbit/s的带宽。一小时的这样的视频需要大于600GB的存储空间。
[0007]视频编码和解码的目的之一是通过压缩来减少输入视频信号中的冗余。压缩可以帮助减少以上提及的带宽或存储空间需求,在一些情况下减少两个数量级或更多。可以采用无损和有损压缩及其组合。无损压缩是指可以根据压缩的原始信号重建原始信号的精确副本的技术。当使用有损压缩时,重建的信号可能与原始信号不同,但是原始信号与重建的信号之间的失真足够小,以使重建的信号对于预期应用有用。在视频的情况下,有损压缩应用广泛。容忍的失真量取决于应用;例如,某些消费者流式应用的用户可能比电视分配应用的用户容忍更高的失真。可达到的压缩比可以反映出:更高的可允许/可容忍的失真可以产生更高的压缩比。
[0008]运动补偿可以是有损压缩技术,并且可以涉及下述技术:来自先前重建的图片或其一部分(参考图片)的样本数据的块在由运动矢量(此后被称为MV(motion vector,MV))指示的方向上被空间移位之后,被用来预测新重建的图片或图片部分。在一些情况下,参考图片可以与当前处于重建中的图片相同。MV可以具有两个维度X和Y,也可以具有三个维度,第三维度是使用中的参考图片的指示(后者间接地可以是时间维度)。
[0009]在一些视频压缩技术中,可以根据其他MV预测适用于样本数据的特定区域的MV,例如,根据与在空间上相邻于重建中的区域的样本数据的另一区域有关、并且在解码顺序上先于该MV的MV。这样做可以大幅减少对MV进行编码所需的数据量,从而消除冗余并且增
加压缩。MV预测可以有效地工作,例如,因为在对从摄像装置得到的输入视频信号(被称为自然视频)进行编码时,存在统计上的可能性,即,比单个MV适用的区域大的区域在相似的方向上移动,并且因此可以在一些情况下使用根据邻近区域的MV得到的相似运动矢量被进行预测。这使得针对给定区域找到的MV与根据周围MV预测的MV相似或相同,并且又可以在熵编码之后以比直接对MV进行编码的情况下将使用的比特数小的比特数来表示。在一些情况下,MV预测可以是根据原始信号(即:样本流)得到的信号(即:MV)的无损压缩的示例。在其他情况下,MV预测本身可以是有损的,例如由于根据若干周围MV计算预测器时的舍入误差。
[0010]在H.265/HEVC(ITU

T H.265建议书,“High Efficiency Video Coding”,2016年12月)中描述了各种MV预测机制。在H.265提供的多种MV预测机制中,本文描述的是在下文被称为“空间合并”的技术。
[0011]参照图1,当前块(101)包括在运动搜索处理期间已经由编码器发现的能够根据已经进行空间移位的相同大小的先前块被预测的样本。替代直接对MV进行编码,MV可以根据与例如来自(按解码顺序)最近的参考图片的一个或更多个参考图片相关联的元数据、使用与被表示为A0、A1和B0、B1、B2(分别地,102到106)的五个周围样本中的任一样本相关联的MV来得到。在H.265中,MV预测可以使用来自相邻块正在使用的相同参考图片的预测器。

技术实现思路

[0012]本公开内容的各方面提供了用于视频解码的方法和装置。在一些示例中,用于视频解码的装置包括处理电路。该处理电路从已编码视频比特流解码当前图片中的当前块的预测信息并且预测信息指示帧间预测。该处理电路针对当前块确定运动信息,运动信息包括第一运动矢量(MV),第一运动矢量具有x分量和y分量,其中,x分量和y分量中的每一个具有分数MV精度,分数MV精度为当前块中的样本大小的2

N
,并且x分量和y分量中的每一个具有拥有分数MV精度的2
L+1
个MV值中的一个。N为大于2的整数并且L为正整数。该处理电路基于运动信息来重建当前块的至少一个样本。
[0013]在实施方式中,第一MV的x分量和y分量中的每一个由(L+1)比特来表示,(L+1)比特包括用于量值(magnitude)的L比特和用于方向的1比特,并且2
L+1
个MV值在MV范围[
‑2L
,2
L
‑1]内。
[0014]在实施方式中,处理电路将运动信息存储在存储空间中。存储空间的大小为至少J比特,J比特是为第一MV和第二MV、第一参考索引、第二参考索引及用于帧间预测方向的指示符而保留的。第二MV的x分量和y分量中的每一个由(L+1)比特表示,第一参考索引由K比特表示并且指示第一参考列表中与第一MV相关联的第一参考图片,第二参考索引由K比特表示并且指示第二参考列表中与所述第二MV相关联的第二参考图片,指示符由I比特表示。帧间预测方向是以下之一:与第一MV和第一参考图片相关联的前向单向预测、与第二MV和第二参考图片相关联的后向单向预测、以及与第一MV和第二MV及第一参考图片和第二参考图片相关联的双向预测。K为正整数,I是以下之一:0和2,并且J等于(4(L+1)+2K+I)。
[0015]在示例中,L为17,N为4,K为4,I为2,并且为存储空间保留的J比特为82,将18比特用于第一MV和第二MV的x分量和y分量中的每一个。
[0016]在示例中,L为18,N为4,K为4,并且I为2。因此,将19比特用于第一MV和第二MV的x
分量和y分量中的每一个,将4比特用于第一参考索引和第二参考索引中的每一个,将2比特用于指示符,并且为存储空间保留的J比特为86。
[0017]在示例中,L为18,N为4,K为5,并且I为0。在示例中,L为19,N为4,K本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频编码的方法,其特征在于,所述方法包括:接收当前图片中当前块的至少一个样本;确定所述当前块的运动信息;所述运动信息包括第一运动矢量(MV),所述第一运动矢量具有x分量和y分量,其中,所述x分量和所述y分量中的每一个具有分数MV精度,所述分数MV精度是所述当前块中的样本大小的2

N
,并且所述x分量和所述y分量中的每一个具有所述分数MV精度的2
L+1
个MV值中的一个,N为4,其指示分数MV精度,L为17,其指示分数MV范围,且所述x分量和所述y分量中的每一个都在具有所述分数MV精度的所述分数MV范围内;基于所述当前块的运动信息,确定所述当前块的预测信息;所述预测信息指示帧间编码;基于所述当前块的预测信息,对所述当前块的至少一个样本进行编码。2.根据权利要求1所述的方法,其特征在于,所述第一MV的x分量和y分量中的每一个由(L+1)比特来表示,所述(L+1)比特包括用于量值的L比特和用于指示方向的1比特,并且所述2
L+1
个MV值在所述分数MV范围[
‑2L
,2
L

1]内。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:将所述运动信息存储在存储空间中,所述存储空间的大小为至少J比特,所述J比特是为所述第一MV和第二MV、第一参考索引、第二参考索引以及用于表征帧间预测方向的指示符保留的;其中,所述第二MV的x分量和y分量中的每一个由(L+1)比特表示,所述第一参考索引由K比特表示,并且指示第一参考列表中与所述第一MV相关联的第一参考图片,所述K为正整数,所述第二参考索引由K比特表示,并且指示第二参考列表中与所述第二MV相关联的第二参考图片,所述指示符由I比特表示,所述I以下之一:0和2,并且,所述J等于(4(L+1)+2K+I),所述帧间预测方向是以下任一种:与所述第一MV和所述第一参考图片相关联的前向单向预测、与所述第二MV和所述第二参考图片相关联的后向单向预测、以及与所述第一MV和所述第二MV及所述第一参考图片和所述第二参考图片相关联的双向预测。4.根据权利要求3所述的方法,其特征在于,所述L为17,所述K为4,所述I为2,并且为所述存储空间保留的J比特为82,将18比特用于存储所述第一MV和所述第二MV的x分量和y分量中的每一个。5.根据权利要求3所述的方法,其特征在于,所述L、所述K和所述I对应于以下任一种:所述L为18,所述K为4并且所述I为2;所述L为18,所述K为5并且所述I为0;所述L为19,所述K为4并且所述I为2;所述L为22,所述K为4并且所述I为2;所述L为22,所述K为5并且所述I为0。6.根据权利要求3所述的方法,其特征在于,所述运动信息还包括:所述第二MV、所述第一参考索引、所述第二参考索引、以及指示所述双向预测的所述指示符。7.根据权利要求2所述的方法,其特征在于,所述确定所述当前块的运动信息,包括:基于MV差和MV预测器对应的x分量和y分量,分别确定所述第一MV的x分量和y分量。
8.根据权利要求7所述的方法,其特征在于,所述预测信息指示用于所述帧间预测的合并模式;并且,所述确定所述第一MV的x分量和y分量,包括:在没有所述MV差的情况下,基于所述MV预测器对应的x分量和y分量,确定所述第一MV的x分量和y分量。9.根据权利...

【专利技术属性】
技术研发人员:许晓中李翔刘杉
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1