用于运动矢量差的经改进的信令方法和装置制造方法及图纸

技术编号:39001669 阅读:27 留言:0更新日期:2023-10-07 10:33
本公开总体上涉及视频编解码,更具体地涉及用于为运动矢量差提供信令方案的方法和系统。公开了一种对视频码流的当前视频块解码的示例方法。该方法包括接收已编码视频码流;从已编码视频码流中获得用于当前视频块的第一运动矢量差(MVD)和动态参考列表(DRL)索引;基于第一MVD,导出用于当前视频块的第二MVD;由设备基于第一MVD、导出的第二MVD和由DRL索引指示的运动矢量预测值(MVP),生成运动矢量(MV)对;以及由设备基于MV对,对当前视频块进行解码。行解码。行解码。

【技术实现步骤摘要】
【国外来华专利技术】用于运动矢量差的经改进的信令方法和装置
[0001]引用并入
[0002]本申请基于2021年9月15日提交的申请号为63/261,252的美国临时专利申请并要求其优先权,该临时专利申请的全部内容通过引用并入本申请中。本申请基于2022年9月15日提交的申请号为17/945,935的美国非临时专利申请并要求其优先权,该非临时专利申请的全部内容通过引用并入本申请中。


[0003]本公开总体上涉及视频编解码,更具体地涉及用于为运动矢量差提供信令方案的方法和系统。

技术介绍

[0004]本文中提供的
技术介绍
描述是为了大体上呈现本申请的上下文。在此
技术介绍
部分描述的程度上,当前署名的专利技术人的工作,以及在本申请提交时可能不具有作为现有技术的资格的描述的各方面,既不明确认为也不隐含认为是本申请的现有技术。
[0005]视频编码和解码可以使用具有运动补偿的图片间预测,未压缩的数字视频可包括一系列的图片,每个图片具有一定的空间维度,例如,具有1920
×
1080的亮度样本和相关的全色度样本或子采样的色度样本。所述一系列的图片可以具有固定的或可变的图片速率(可替换地称为帧率),例如,每秒60个图片或每秒60个帧。未压缩的视频对于流式传输或数据处理有着特定的比特率要求。例如,具有1920
×
1080的像素分辨率、每秒60帧的帧率以及每个颜色通道每个像素8比特的4:2:0的色度下采样的视频需要接近1.5Gbit/s的带宽。这样的视频一小时需要超过600GB的存储空间。
>[0006]视频编码和解码的一个目的可以是通过压缩来减少未压缩的输入视频信号中的冗余。压缩可有助于降低上述带宽和/或存储空间的要求,在一些情况下,可降低两个或更多的数量级。无损压缩和有损压缩以及其组合均可以用于视频编码和解码。无损压缩是指可以由压缩的原始信号通过解码过程重建原始信号的精确副本的技术。有损压缩是指原始视频信号在编码过程中未完全保持、在解码过程中未完全恢复的编码/解码过程。当使用有损压缩时,重建的信号可能与原始信号不完全一致,但是使原始信号与重建的信号之间的失真小得足以致使重建的信号可以用于预期应用,虽然有一些信息损失。对于视频,有损压缩广泛应用于许多应用中。有损压缩可容许的失真量取决于应用。例如,与电影或电视广播应用的用户相比,某些视频流式传输应用的消费者用户可以容忍较高的失真。特定的编码算法可实现的压缩比可以选择或调节,以反应各种失真容差:可容许的失真越高,通常允许使用可产生较高损失和较高压缩比的编码算法。
[0007]视频编码器和解码器可以使用几大类技术和步骤,包括例如运动补偿、傅里叶变换、量化和熵编码。
[0008]视频编解码技术可以包括帧内编码技术。在帧内编码技术中,样本值的表示不参考先前已重建的参考图片中的样本或其它数据。在一些视频编解码技术中,将图片从空间
上划分为样本块。当所有的样本块都是通过帧内模式进行编码时,该图片可以称作帧内图片。帧内图片以及他们的衍生图片,例如,独立解码器刷新的图片,可以用于对解码器的状态进行重置,因此可以用作已编码视频码流和视频会话中的第一幅图片,或者作为一副静止图片。然后可以将经过帧内预测的块的样本变换到频域,并且可以在进行熵编码之前,对如此生成的变换系数进行量化。帧内预测表示一种将样本值在预变换域最小化的技术。在一些情况下,变换后的DC值越小以及AC系数越小,给定量化步长大小的情况下,表示熵编码后的块所需的比特数目越少。
[0009]传统的帧内编码技术,例如,已知的MPEG

2编码技术并不使用帧内预测。然而,一些较新的视频压缩技术包括尝试基于例如邻近的样本数据和/或元数据对块进行编码/解码的技术,所述邻近的样本数据和/或元数据是在对与正在帧内编码或解码中的数据快空间上相邻且解码顺序上在先的数据块进行编码和/或解码的过程中获得的。因此,这种技术称为“帧内预测”技术。请注意,至少在一些情况下,帧内预测仅使用正在重建的当前图片中的参考数据,而不使用其他参考图片中的参考数据。
[0010]帧内预测可以有很多种不同的形式。当给定的视频编码技术中有一个以上的这种技术可用时,该使用中的技术可以称作帧内预测模式。一个或多个帧内预测模式可以提供在特定的编解码中。在某些情况下,一些模式具有子模式和/或与各种参数相关联,视频块的模式/子模式信息和帧内编码参数可以单独编码或者可以集体包含在模式码字中。某个给定模式/子模式和/或参数的组合使用何种码字,会通过帧内预测影响到编码效率增益,将码字转译为码流所用的熵编码技术同样对其也会产生影响。
[0011]H.264标准引入了某个模式的帧内预测,H.265标准对其进行了改进,在较新的编码技术中,例如,联合探索模型(JEM)、通用视频编码(VVC)、基准集合(BMS)等等,对其进一步进行了改进。通常,对于帧内预测,预测子(predictor)块可以使用已经可用的相邻的样本值形成。例如,可以将沿着特定方向和/或行的特定集合的相邻样本的可用值复制到预测子块中。所使用的方向的参考可以编码到码流中,或者其本身可以预测。
[0012]参考图1A,在其右下方描绘的是H.265标准的33个可能的帧内预测子方向(predictor direction)(对应于H.265标准中规定的35个帧内模式的33个角度模式)中已知的一个具有9个预测子方向的子集。其中,各箭头的汇聚点(101)表示正在预测中的样本。箭头表示使用相邻样本对101处的样本进行预测的方向。例如,箭头(102)表示根据与水平轴成45度角度的右上角的一个或多个相邻样本,对样本(101)进行预测。类似地,箭头(103)表示根据与水平方向成22.5度角度的左下角的一个或多个相邻样本,对样本(101)进行预测。
[0013]仍参考图1A所示,图1A的左上方描绘的是一个具有4
×
4个样本的正方形块(104)(用加粗的虚线表示)。正方形块(104)包括16个样本,每个样本标记有“S”、其在Y维度上的位置(例如,行索引)以及其在X维度上的位置(例如,列索引)。例如,样本S21是在Y维度上的第二个(从上往下数)、X维度上的第一个(从左往右数)样本。类似地,样本S44是在块(104)中X维度和Y维度上都是第四的样本。因为该块的大小是4
×
4个样本,所以S44是在其右下角。图1A进一步示出了示例参考样本,参考样本遵循类似的编号方法。参考样本标记有R、其相对于所述块(104)的Y位置(例如,行索引)和X位置(例如,列索引)。在H.264标准和H.265标准中,使用与重建中的块紧邻的预测样本。
[0014]块104的帧内图片预测可以开始于根据信号表示的预测方向,通过复制相邻样本的参考样本值。例如,假设已编码视频码流中包含有信令,对于所述块104,该信令表示了箭头(102)的预测方向,即,根据与水平方向成45度角度的右上角的一个或多个参考样本对所述块中的样本进行预测。在这种情况下,样本S41、S32、S23、S14本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种对视频码流的当前视频块解码的方法,其特征在于,包括:由包括存储指令的存储器和与所述存储器通信的处理器的设备接收已编码视频码流;由所述设备从所述已编码视频码流中获得用于当前视频块的第一运动矢量差(MVD)和动态参考列表(DRL)索引;由所述设备基于所述第一MVD,导出用于所述当前视频块的第二MVD;由所述设备基于所述第一MVD、导出的第二MVD和由所述DRL索引指示的运动矢量预测子(MVP),生成运动矢量(MV)对;以及由所述设备基于所述MV对,对所述当前视频块进行解码。2.根据权利要求1所述的方法,其特征在于:所述当前视频块处于具有两个参考帧的复合参考模式;所述复合参考模式包括NEW_NEAR模式或NEAR_NEW模式。3.根据权利要求1所述的方法,其特征在于,进一步包括:由所述设备从所述已编码视频码流中获得用于所述当前视频块的标志,其中:响应于所述当前视频块处于NEW_NEAR模式的复合参考模式,所述标志指示是否将所述第二MVD添加到由所述DRL索引指示的第二列表中的MVP,响应于所述当前视频块处于NEAR_NEW模式的复合参考模式,所述标志指示是否将所述第一MVD添加到由所述DRL索引指示的第一列表中的MVP。4.根据权利要求1所述的方法,其特征在于,进一步包括:响应于满足所述当前视频块的条件,由所述设备从所述已编码视频码流中获得用于所述当前视频块的标志,其中:响应于所述当前视频块处于NEW_NEAR模式的复合参考模式,所述标志指示是否将所述第二MVD添加到由所述DRL索引指示的第二列表中的MVP,响应于所述当前视频块处于NEAR_NEW模式的复合参考模式,...

【专利技术属性】
技术研发人员:赵亮赵欣刘杉
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1