鉴于解码端运动矢量修正/推导是译码系统的标准方面,编码器也需要执行相同的误差面技术,以免编码器重建与解码器重建之间有任何漂移。因此,所有实施例的各方面都适用于编码系统和解码系统。在模板匹配中,修正移动仅在参考中发生,从子像素精确中心开始,其中,所述子像素精确中心是基于显式指示的融合索引导出的或通过代价评估隐式推导的。在双边匹配(有或没有平均模板)中,所述修正在参考列表L0和L1中从相应的子像素精确中心开始,其中,所述子像素精确中心是基于所述显式指示的融合索引推导或通过代价评估隐式推导的。引推导或通过代价评估隐式推导的。引推导或通过代价评估隐式推导的。
【技术实现步骤摘要】
【国外来华专利技术】用于解码端运动矢量修正的基于误差面的子像素精确修正方法
[0001]相关申请案交叉申请
[0002]本申请要求于2018年07月02日提交、申请号为201831024666、专利技术名称为“用于解码端运动矢量修正的基于误差面的子像素精确修正方法(AN ERROR SURFACE BASED SUB-PIXEL ACCURATE REFINEMENT METHOD FOR DECODER SIDE MOTION VECTOR REFINEMENT)”的印度临时专利申请的权益,其全部内容通过引用的方式并入本文中。
技术介绍
[0003]目前的混合视频编解码器(如H.264/AVC或H.265/HEVC)采用包括预测译码在内的压缩。将视频序列的图像划分为像素块,然后对这些块进行译码。不是逐个像素对块进行译码,而是使用与整个块空间相邻或时间相邻的已编码像素来预测该块。编码器仅进一步对该块与其预测块之间的差值进行处理。所述进一步处理通常包括将块像素变换为变换域中的系数。然后,可以通过量化进一步压缩系数,并进一步通过熵译码进行压缩以形成码流。所述码流还包括能够对编码视频进行解码的任何信令信息。例如,所述信令信息可包括编码相关的设置,如输入图像的大小、帧率、量化步长指示、应用于图像块的预测等。以编码器和解码器已知的方式在码流内对经译码信令信息和经译码信号进行排序。这使解码器能够对经译码信令信息和经译码信号进行解析。
[0004]时间预测利用视频图像(也称为帧)之间的时间相关性。时间预测也称为帧间预测,因为它是利用(帧间)不同的视频帧之间的相关性进行预测。因此,根据一个或多个先前编码的图像(也称为一个或多个参考图像)对正在编码的块(也称为当前块)进行预测。参考图像不一定按照视频序列的显示顺序,是当前块所在的当前图像的前一张图像。编码器可以按不同于显示顺序的译码顺序对图像进行编码。可以确定参考图像中的共址块作为当前块的预测块。共址块是位于参考图像中与当前图像中的当前块位置相同的块。这种预测对于静止的图像区域(即没有从一个图像移动到另一个图像的图像区域)而言是准确的。
[0005]为了获得考虑了移动的预测值,即运动补偿预测值,通常在确定当前块的预测时采用运动估计。因此,根据参考图像中的块预测当前块,该块位于与共址块的位置相距运动矢量所给定的距离的位置处。为了使解码器能够确定当前块的相同预测,可以在码流中指示运动矢量。为了进一步减少为每个块指示运动矢量而引起的信令开销,可以估计运动矢量本身。可以根据空域和/或时域中邻块的运动矢量进行运动矢量估计。
[0006]可以使用一个参考图像或通过对从两个或更多个参考图像获得的预测进行加权来计算当前块的预测。参考图像可以是相邻图像,即按显示顺序紧接当前图像之前和/或紧接当前图像之后的图像,因为相邻图像最有可能与当前图像类似。然而,通常,参考图像还可以是码流中按显示顺序在当前图像之前或之后的任何其它图像(解码顺序)。例如,在视频内容中有遮挡和/或非线性移动的情况下,这是有利的。因此,还可以在码流中指示参考图像标识。
[0007]帧间预测的一种特殊模式是双向预测,其中使用两个参考图像生成当前块的预
测。特别地,将对相应的两个参考图像确定的两个预测组合成当前块的预测信号。双向预测可以产生比单向预测(即仅使用单个参考图像进行的预测)更精确的当前块预测。更精确的预测使得当前块的像素与预测之间的差值(也称为“残差”)较小,从而可以更有效地编码,即压缩成更短的码流。通常,可以使用多于两个参考图像来查找相应的多于两个参考块,以预测当前块,即,可以应用多参考帧间预测。因此,术语“多参考预测”包括双向预测以及使用多于两个参考图像的预测。
[0008]为了提供更精确的运动估计,可以通过在像素之间插值像素点来提高参考图像的分辨率。可以通过对最近像素进行加权平均来进行分数像素插值。例如,在半像素分辨率的情况下,通常采用双线性插值。其它分数像素计算为按相应的最近像素与所预测像素之间的距离的倒数加权的最近像素的平均值。
[0009]运动矢量估计是一项计算复杂的任务,计算当前块与参考图像中候选运动矢量所指向的对应预测块之间的相似度。通常,搜索区域包括图像的M
×
M个像素点,并且测试M
×
M个候选位置的每个像素点位置。该测试包括计算N
×
N参考块C与位于搜索区域的测试候选位置的块R之间的相似度度量。绝对差值和(sum of absolute difference,SAD)是为简单起见经常使用的一种度量,通过以下给出:
[0010][0011]在上述公式中,x和y定义了搜索区域内的候选位置,而索引i和j表示参考块C和候选块R内的像素点。候选位置通常称为块位移或块偏移,反映出块匹配表示为参考块在搜索区域内的移位,并计算参考块C与搜索区域的重叠部分之间的相似度。为了降低复杂度,通常通过将候选运动矢量限制在一定的搜索空间内来减少候选运动矢量的数量。例如,搜索空间可以由参考图像中与当前图像中当前块的位置对应的位置周围的像素的数量和/或位置来定义。在计算所有M
×
M个候选位置x和y的SAD之后,最佳匹配块R为具有最低SAD的位置上的块,最低SAD对应与参考块C的最大相似度。另一方面,候选运动矢量可以由邻块的运动矢量组成的候选运动矢量列表定义。
[0012]运动矢量通常至少部分地在编码端确定,并在编码码流内向解码器指示。然而,也可以在解码器侧导出运动矢量。在这种情况下,无法在解码器侧获得当前块,并且该当前块不能用于计算与参考图像中候选运动矢量所指向的块的相似度。因此,使用由已解码块的像素构造的模板代替当前块。例如,可以使用与当前块相邻的已解码像素。这种运动估计的优点在于减少信令:在编码器和解码器侧以相同的方式导出运动矢量,因此不需要信令。另一方面,这种运动估计的精确度可能较低。
[0013]为了在精确度与信令开销之间实现权衡,运动矢量估计可以分为两个步骤:运动矢量推导和运动矢量修正。例如,运动矢量推导可包括从候选列表中选择运动矢量。这种选择的运动矢量可以通过在搜索空间内搜索等方式进一步修正。搜索空间中的搜索是基于计算每个候选运动矢量的代价函数,即,候选运动矢量所指向的块的每个候选位置的代价函数。
[0014]X.Chen、J.An、J.Zeng发表的文献JVET-D0029:基于双边模板匹配的解码端运动矢量修正(该文献可见于:http://phenix.it-sudparis.eu/jvet/site)展示了运动矢量修正,其中,查找整数像素分辨率的第一运动矢量,并通过在第一运动矢量周围的搜索空间中
以半像素分辨率搜索来进一步修正。采用基于块模板的双向运动矢量搜索。
[0015]运动矢量估计是现代视频编解码器的关键特性,因为它在质量、速率和复杂度方面的效率都直接影响到视频编解码的效率。
技术实现思路
[0016]本专利技术涉及视频的编码和解码,具体涉及确定运动矢量。
[0017]在本申请的第一方面中,提本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种解码端运动矢量修正方法,其特征在于,所述方法包括:通过比较相对于初始运动矢量的候选整数运动矢量位移对应的整数距离代价,确定目标整数运动矢量位移;通过计算所述整数距离代价,确定子像素运动矢量位移;根据所述目标整数运动矢量位移、所述子像素运动矢量位移和所述初始运动矢量,确定修正运动矢量。2.根据权利要求1所述的方法,其特征在于,所述子像素运动矢量位移通过以下等式确定:x0=(E(
–
1,0)
–
E(1,0))/(2
×
(E(
–
1,0)+E(1,0)
–2×
E(0,0)));且y0=(E(0,
–
1)
–
E(0,1))/(2
×
(E(0,
–
1)+E(0,1)
–2×
E(0,0)));其中,x0和y0为与子像素运动矢量位移相对于中心(0,0)相关联的坐标;E(
–
1,0)、E(1,0)、E(0,0)、E(0,
–
1)和E(0,1)为整数距离代价,所述整数距离代价分别与相对于初始运动矢量的候选整数运动矢量位移(
–
1,0)、(1,0)、(0,0)、(0,
–
1)和(0,1)相对应。3.根据权利要求2所述的方法,其特征在于,通过对E(
–
1,0)、E(1,0)和E(0,0)进行移位、比较和增加操作中的至少一种来确定x0。4.根据权利要求2所述的方法,其特征在于,通过对E(0,
–
1)、E(0,1)和E(0,0)进行移位、比较和增加操作中的至少一种来确定y0。5.根据权利要求1所述的方法,其特征在于,所述子像素运动矢量位移限定在
–
0.5与+0.5个像素之间。6.根据权利要求1所述的方法,其特征在于,还包括:在确定所述子像素运动矢量位移之前,确定预定运动矢量位移是否包括所述目标整数运动矢量位移;在所述预定运动矢量位移包括所述目标整数运动矢量位移的情况下:通过计算所述整数距离代价,确定所述子像素运动矢量位移。7.根据权利要求6所述的方法,其特征在于,还包括:在所述预定运动矢量位移不包括所述目标整数运动矢量位移的情况下:根据所述目标整数运动矢量位移和所述初始运动矢量计算修正运动矢量。8.根据权利要求1所述的方法,其特征在于,确定所述目标整数运动矢量位移包括:计算每个候选整数运动矢量位移的整数距离代价;选择与最低整数距离代价对应的候选整数运动矢量位移,作为所述目标整数运动矢量位移。9.根据权利要求1所述的方法,其特征在于,所述目标整数运动矢量位移包括与参考图像列表L0对应的第一运动矢量位移,和与参考图像列表L1对应的第二运动矢量位移,所述方法还包括:通过比较整数代价,确定所述第一运动矢量位移,其中,所述整数代价和所述参考图像列表L0对应的候选整数运动矢量位移相对应;通过对所述第一运动矢量位移取反,确定所述第二运动矢量位移。10.一种装置,其特征在于,包括:输入端,用于接收已编码的视频数据;
熵解码单元,用于对所述接收的已编码的视频数据进行解码以获得解码数据;一个或多个处理器,与所述熵解码单元耦合,用于:根据所述解码...
【专利技术属性】
技术研发人员:斯利拉姆,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。