用于帧间预测的运动向量舍入、截取和存储的方法和装置制造方法及图纸

技术编号:31318049 阅读:14 留言:0更新日期:2021-12-12 23:58
提供了一种用于视频编解码的方法,包括:设置运动向量(MV)舍入过程,所述MV舍入过程被配置为执行MV舍入操作;将所述MV舍入过程应用于第一预测工具中使用的至少第一MV,第一预测工具从包括以下各项的第一组工具中选择:按对合并候选项、三角预测模式和仿射模式;和将所述MV舍入过程应用于第二预测工具中使用的至少第二MV,第二预测工具从包括以下各项的第二组工具中选择:时域运动向量预测(TMVP)、高级时域运动向量预测(ATMVP)以及具有运动向量差的合并模式(MMVD)。的合并模式(MMVD)。的合并模式(MMVD)。

【技术实现步骤摘要】
用于帧间预测的运动向量舍入、截取和存储的方法和装置
[0001]本申请是申请日为2020年2月19日,申请号为202080014012.3并且专利技术名称为“用于帧间预测的运动向量舍入、截取和存储的方法和装置”申请的分案申请。
[0002]对相关申请的交叉引用本申请要求2019年2月20日提交的标题为“Methods and Apparatus on Motion Vector Rounding and Storage for Inter Prediction”的美国临时申请号62/808,276和 2019 年 3 月 8 日提交的标题为“Methods and Apparatuses on Motion Vector Rounding and Storage for Inter Prediction”的美国临时申请号62/816,025的优先权,出于所有目的,这两者均通过引用整体并入本文。


[0003]本申请一般地涉及视频编解码和压缩,并且具体地但不限于用于视频编解码的运动向量舍入、截取和存储的方法和装置。

技术介绍

[0004]数字视频被各种电子设备支持,诸如数字电视、膝上型或台式计算机、平板计算机、数码相机、数字记录设备、数字媒体播放器、视频游戏控制台、智能电话、视频电话会议设备、视频流送设备等。这些电子设备通过实现视频压缩/解压缩来传输、接收、编码、解码和/或存储数字视频数据。数字视频设备实现视频编解码技术,诸如由通用视频编解码 (VVC)、联合探索测试模型 (JEM)、MPEG

2、MPEG

4、ITU

T H.263、ITU

T H.264/MPEG

4第 10 部分、高级视频编解码 (AVC)、ITU

T H.265/高效视频编解码 (HEVC) 以及此类标准的扩展定义的标准中描述的那些技术。
[0005]视频编解码通常利用预测方法(例如,帧间预测、帧内预测),该预测方法利用视频图像或序列中存在的冗余。视频编解码技术的重要目标是将视频数据压缩成使用较低比特率的形式,同时避免或最小化视频质量的下降。随着不断演进的视频服务变得可用,需要具有更好编解码效率的编码技术。
[0006]视频压缩通常包括执行空间域(帧内)预测和/或时域(帧间)预测以减少或去除视频数据中固有的冗余。在基于块的视频编解码中,输入的视频信号被逐块处理。对于每个块(也称为编码单元(CU)),可以执行空间域预测和/或时域预测。每个 CU 可以采用帧内、帧间或 IBC 模式进行编解码。使用相对于同一视频帧内的相邻块中的参考样本的空间域预测来编码视频帧的帧内编解码 (I) 切片中的视频块。视频帧的帧间编解码(P或B)切片中的视频块可使用相对于同一视频帧内相邻块中的参考样本的空间域预测或相对于其它先前和/或未来参考视频帧中的参考样本的时域预测。
[0007]基于先前已编码的参考块(例如,相邻块)的空间域或时域预测产生要编解码的当前视频块的预测块。寻找参考块的过程可以通过块匹配算法来完成。表示要编解码的当前块和预测块之间的像素点差异的残差数据被称为残差块或预测误差。帧间编解码块根据指向形成预测块的参考帧中的参考块的运动向量和残差块进行编码。确定运动向量的过程通
常称为运动估计。帧内编解码块根据帧内预测模式和残差块进行编码。为了进一步压缩,残差块从像素域被变换到变换域,例如频域,产生残差变换系数,然后可以对残差变换系数进行量化。最初以二维阵列布置的量化变换系数可以被扫描以产生变换系数的一维向量,然后被熵编码到视频比特流中以实现甚至更进一步的压缩。
[0008]编码的视频比特流然后被保存在计算机可读存储介质(例如,闪存)中以供具有数字视频能力的另一电子设备访问或者被直接有线或无线地传输到所述电子设备。所述电子设备然后通过例如解析该编码视频比特流以从比特流获得语义元素并且至少部分地基于从比特流获得的语义元素从编码的视频比特流将所述数字视频数据重构为其原始格式来执行视频解压缩(这是与上述视频压缩相反的过程),并且在电子设备的显示器上呈现重构的数字视频数据。
[0009]随着数字视频质量从高清到 4Kx2K 或甚至 8Kx4K,要编码/解码的视频数据量呈指数增长。如何在保持解码的视频数据的图像质量的同时能够更高效地编码/解码视频数据是持续的挑战。
[0010]在联合视频专家组 (JVET) 会议上,JVET 定义了通用视频编解码(VVC)的初稿和 VVC 测试模型 1 (VTM l) 编码方法。决定包括具有使用二元和三元划分编解码块结构的嵌套多类型树的四叉树作为 VVC 的初始新编解码特征。从那时起,在 JVET 会议期间开发了用于实现所述编码方法和VVC 解码过程草案的参考软件VTM。

技术实现思路

[0011]一般而言,本公开描述了与用于视频编解码的运动向量舍入和截取有关的技术的示例。
[0012]根据本公开的第一方面,提供了一种用于视频编解码的方法,包括:设置运动向量(MV)舍入过程,MV舍入过程被配置为执行MV舍入操作;将MV舍入过程应用于第一预测工具中使用的至少第一 MV,第一预测工具从由以下各项组成的组中选择:按对合并候选项、三角预测模式和仿射模式;以及将MV舍入过程应用于第二预测工具中使用的至少第二 MV,所述第二预测工具从由以下各项组成的组中选择:时域运动向量预测 (TMVP) 和高级时域运动向量预测 (ATMVP) 以及具有运动向量差的合并模式 (MMVD)。
[0013]根据本公开的第二方面,提供了一种用于视频编解码的方法,包括:设置运动向量(MV)截取(clipping)过程,MV截取过程被配置为执行截取操作;将MV截取过程应用于第一预测工具中使用的至少第一 MV,该第一预测工具从由以下各项组成的组中选择:高级运动向量预测 (AMVP) 模式、高级时域运动向量预测 (ATMVP) 模式、三角模式、具有运动向量差的合并模式(MMVD)的模式、解码器侧运动向量导出(DMVR)模式和仿射继承模式;以及将MV截取过程应用于第二预测工具中使用的至少第二 MV,第二预测工具从由以下各项组成的组中选择:显式正常帧间模式和显式仿射模式。
[0014]根据本公开的第三方面,提供了一种用于视频编解码的装置,包括:处理器;和存储器,配置为存储处理器可执行的指令;其中,处理器在执行指令时被配置为:设置运动向量(MV)舍入过程,MV舍入过程被配置为执行MV舍入操作;将MV舍入过程应用于第一预测工具中使用的至少第一 MV,第一预测工具从由以下各项组成的组中选择:按对合并候选项、三角预测模式和仿射模式;以及将MV舍入过程应用于第二预测工具中使用的至少第二 MV,
所述第二预测工具从由以下各项组成的组中选择:时域运动向量预测 (TMVP) 和高级时域运动向量预测 (ATMVP) 以及具有运动向量差的合并模式 (MMVD)。
[0015]根据本公开的第四方面,提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于视频编码的方法,包括:确定帧间预测过程;响应于确定所述帧间预测过程是用于以下各项的导出过程之一,根据第一MV舍入模式在所述帧间预测过程中对至少一个MV执行运动向量 (MV) 舍入操作:时域运动向量预测 (TMVP)、高级时域运动向量预测 (ATMVP) 或具有运动向量差的合并模式 (MMVD) ,其中所述第一MV舍入模式包括在逐位右移之前针对输入值的第一偏移量值,所述第一偏移量值取决于所述输入值的符号。2.如权利要求1所述的方法,其中所述第一MV舍入模式基于以下等式:其中:A是舍入前的MV值;Shift 是应用于MV舍入的按位右移量;the_first_offset是舍入偏移量,其基于基础偏移量和A的符号而调整;所述基础偏移量被设置为等于;并且L是舍入后MV的值。3.如权利要求2所述的方法,其中the_first_offset由以下等式确定:所述基础偏移量+(A < 0 1: 0)。4.如权利要求1所述的方法,其中所述MV舍入过程被应用于所有MV的舍入操作,所述MV包括第一MV、第二MV和其他MV。5.如权利要求3所述的方法,还包括: 应用所述MV舍入过程以执行也基于所述等式的样本舍入操作,其中在以下过程中的至少一个中执行所述样本舍入操作:运动补偿样本插值,自适应环路滤波器(ALF),双向光流(BDOF),和广义双向预测 (GBi)。6.如权利要求5所述的方法,其中所述MV舍入过程被应用于所有样本和所有MV的舍入操作。7.一种用于视频编码的方法,包括:确定帧间预测过程;响应于确定所述帧间预测过程是用于以下各项的导出过程之一,根据第一MV截取模式在所述帧间预测过程中对至少一个MV执行运动向量(MV)截取操作:高级运动向量预测(AMVP)模式、高级时域运动向量预测(ATMVP)模式、具有运动向量差的合并模式(MMVD)的模式、解码器侧运动向量导出 (DMVR)模式、仿射继承模式或显式仿射模式,其中所述第一MV截取模式的上限为2
17

1,并且所述第一MV截取模式的下限为
‑217
。8.如权利要求7所述的方法,其中所述MV截取操作由以下等式定义:
其中L为舍入前的MV值;并且L
clip
是截取后MV的值。9.如权利要求7所述的方法,还包括:将所述MV截取过程应用于在具有运动向量差的合并模式(MMVD)的模式、解码器侧运动向量导出(DMVR)模式和仿射继承模式中导出的所有MV和CPMV。10.一种用于视频编码的装置,包括:处理器;和存储器,被配置为存储处理器可执行的指令;其中,所述处理器在执行所述指令时被配置为:确定帧间预测过程;响应于确定所述帧间预测过程是用于以下各项的导出过程之一,根据第一MV舍入模式在所述帧间预测过程中对至少一个MV执行运动向量 (MV) 舍入...

【专利技术属性】
技术研发人员:修晓宇陈漪纹王祥林
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1