视频编解码系统中编解码模式选择的方法和装置制造方法及图纸

技术编号:38095779 阅读:13 留言:0更新日期:2023-07-06 09:10
一种用于视频编解码的方法和装置。根据该方法,确定一组与编码模式或编码参数相关联的候选。通过使用当前块的重建或预测样本和相邻重建或预测样本,确定与候选集合相关联的边界匹配成本,其中,为当前块候选集合中的一个目标候选确定边界匹配成本中的每一个。当前块的重建或预测样本是根据所述一个目标候选确定的。候选集根据边界匹配成本重新排序。然后使用基于候选集合的重新排序的候选从候选集合中选择的最终候选对当前块进行编码或解码。中选择的最终候选对当前块进行编码或解码。中选择的最终候选对当前块进行编码或解码。

【技术实现步骤摘要】
视频编解码系统中编解码模式选择的方法和装置
[0001]交叉引用
[0002]本申请享有2021年12月29日提交的申请号为63/294,426的美国临时专利申请之优先权,该先前申请在此全文引用。


[0003]本专利技术涉及视频编解码系统。特别地,本专利技术涉及依据边界匹配成本重新排序模式候选,以增进编解码效率。

技术介绍

[0004]通用视频编码(VVC)是由ITU

T视频编码专家组(VCEG)的联合视频专家组(JVET)和ISO/IEC运动图像专家组(MPEG)共同制定的最新国际视频编解码标准。该标准已作为ISO标准发布:ISO/IEC 23090

3:2021,信息技术

沉浸式媒体的编码表示

第3部分:通用视频编码,2021年2月发布。VVC是在其前身HEVC(High Efficiency Video Coding)基础上,通过添加更多的编解码工具来提高编解码效率,还可以处理各种类型的视频源,包括3维(3D)视频信号。
[0005]图1A说明了包含循环处理的示例性自适应帧间/帧内视频编码系统。对于帧内预测110,预测数据是根据当前图片中先前编码的视频数据导出的。对于帧间预测112,在编码器侧执行运动估计(ME)并且基于ME的结果执行运动补偿(MC)以提供从其他画面和运动数据导出的预测数据。开关114选择帧内预测110或帧间预测112并且所选择的预测数据被提供给加法器116以形成预测误差,也称为残差。预测误差然后由变换(T)118和随后的量化(Q)120处理。变换和量化的残差然后由熵编码器122编码以包括在对应于压缩视频数据的视频比特流中。与变换系数相关联的比特流然后与辅助信息(例如与帧内预测和帧间预测相关联的运动和编码模式)以及其他信息(例如与应用于底层图像区域的环路滤波器相关联的参数)一起打包。与帧内预测110、帧间预测112和环内滤波器130相关联的辅助信息被提供给熵编码器122,如图1A所示。当使用帧间预测模式时,也必须在编码器端重建一个或多个参考图片。因此,经变换和量化的残差由逆量化(IQ)124和逆变换(IT)126处理以恢复残差。然后在重建(REC)128处将残差加回到预测数据136以重建视频数据。重建的视频数据可以存储在参考图片缓冲器134中并用于预测其他帧。
[0006]如图1A所示,输入的视频数据在编码系统中经过一系列处理。由于一系列处理,来自REC128的重建视频数据可能会受到各种损害。因此,环路滤波器130经常在重构视频数据被存储在参考图片缓冲器134中之前应用于重构视频数据以提高视频质量。例如,可以使用去块滤波器(DF)、样本自适应偏移(SAO)和自适应环路滤波器(ALF)。可能需要将环路滤波器信息合并到比特流中,以便解码器可以正确地恢复所需的信息。因此,环路滤波器信息也被提供给熵编码器122以合并到比特流中。在图1A中,环路滤波器130在重构样本被存储在参考图片缓冲器134中之前被应用于重构视频。图1A中的系统旨在说明典型视频编码器的示例性结构。它可能对应于高效视频编码(HEVC)系统、VP8、VP9、H.264或VVC。
[0007]如图1B所示,解码器可以使用与编码器相似或相同的功能块,除了变换118和量化120之外,因为解码器只需要逆量化124和逆变换126。代替熵编码器122,解码器使用熵解码器140将视频比特流解码为量化的变换系数和所需的编码信息(例如ILPF信息、帧内预测信息和帧间预测信息)。解码器侧的帧内预测150不需要执行模式搜索。相反,解码器仅需要根据从熵解码器140接收的帧内预测信息生成帧内预测。此外,对于帧间预测,解码器仅需要根据从熵解码器140接收的帧间预测信息执行运动补偿(MC 152)而无需运动估计。
[0008]根据VVC,类似于HEVC,输入图片被划分为称为CTU(编码树单元)的非重迭方形块区域。每个CTU都可以划分为一个或多个较小尺寸的编码单元(CU)。生成的CU分区可以是正方形或矩形。此外,VVC将CTU划分为预测单元(PU),作为应用预测过程的单元,例如帧间预测、帧内预测等。
[0009]VVC标准合并了各种新的编码工具以进一步提高超过HEVC标准的编码效率。在各种新的编码工具中,与本专利技术相关的一些编码工具综述如下。
[0010]帧间预测概述
[0011]根据JVET

T2002第3.4节,(Jianle Chen等人,“通用视频编码和测试模型11(VTM 11)的算法描述”,ITU

T SG 16WP 3和ISO/IEC JTC 1/SC 29的联合视频专家组(JVET),第20次会议,电话会议,2020年10月7

16日,档案:JVET

T2002),针对每一帧间预测CU,运动参数包含运动向量、参考图片索引以及参考图片列表使用标识,以及需要的额外信息VVC的新编码功能用于帧间预测样本生成。可以以显式或隐式方式用信号通知运动参数。当CU以跳过(skip)模式编码时,CU与一个PU相关联并且没有显着的残差系数,没有编码的运动向量增量或参考图片索引。指定合并模式,当前CU的运动参数是从相邻CU获得的,包括空间和时间候选,以及VVC中引入的附加调度。合并模式可以应用于任何帧间预测的CU,而不仅仅是跳过模式。合并模式的替代方案是运动参数的显式传输,其中运动向量、每个参考图片列表的相应参考图片索引和参考图片列表使用标识以及其他所需信息按每个CU显式发送。
[0012]除了HEVC中的帧间编码功能外,VVC还包括许多新的和改进的帧间预测编码工具,如下所列:
[0013]–
扩展合并预测(Extended merge prediction)
[0014]–
与MVD(MMVD)的合并模式(Merge mode with MVD(MMVD))
[0015]–
对称MVD(SMVD)信令(Symmetric MVD(SMVD)signalling)
[0016]–
仿射运动补偿预测(Affine motion compensated prediction)
[0017]–
基于子块的时间运动向量预测(SbTMVP)(Subblock

based temporal motion vector prediction(SbTMVP))
[0018]–
自适应运动向量分辨率(AMVR)(Adaptive motion vector resolution(AMVR))
[0019]–
运动场存储:1/16亮度样本MV存储和8x8运动场压缩
[0020]–
CU级权重双向预测(BCW)(Bi

prediction with CU

level weight(BCW))
[0021]–本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频编解码方法,该方法包括:接收与当前块相关联的输入数据,其中,输入数据包括编码器侧待编码的当前块的像素数据或解码器侧与当前待解码块相关联的编码数据;确定一组与编解码模式或编解码参数相关联的候选;确定与候选集合相关联的边界匹配成本,其中通过使用该当前块的重建或预测样本和该当前块的相邻重建或预测样本,为该候选集合的每一个目标候选确定边界匹配成本,其中,该当前块的重建或预测样本是根据所述一个目标候选确定的;以及基于该边界匹配成本中的至少一个,使用从候选集合中选择的最终候选对该当前块进行编码或解码。2.根据权利要求1所述的视频编解码方法,其特征在于,所述一组候选对应于一组与合并编解码模式相关联的合并候选。3.根据权利要求2所述的视频编解码方法,其特征在于,合并索引被分配给合并候选集合,并且其中第一合并索引被分配用于导致最小边界匹配成本的第一合并候选的最小索引值,并且第二合并索引是分配给导致最大边界匹配成本的第二个合并候选分配最大索引值。4.根据权利要求2所述的视频编解码方法,其特征在于,合并索引被分配给该合并候选集合,并且所选合并候选的目标合并索引在编码器侧用信号发送或在解码器侧接收。5.根据权利要求2所述的视频编解码方法,其特征在于,合并索引被分配给该合并候选集合,并且导致最小边界匹配成本的所选择的合并候选的目标合并索引在编码器侧和解码器侧被隐含地确定。6.根据权利要求1所述的视频编解码方法,其特征在于,所述候选集合对应于与不同颜色分量之间的线性模型(LM)预测相关联的LM候选集合。7.根据权利要求6所述的视频编解码方法,其特征在于,该LM候选集合包括来自包括左上LM、仅上LM、仅左LM和多模型(MM)LM的组合的至少两个LM候选。8.根据权利要求6所述的视频编解码方法,其特征在于,LM索引被分配给LM候选集合,并且目标LM索引被分配导致最小边界匹配成本的用于目标LM候选的最小索引值。9.根据权利要求6所述的视频编解码方法,其特征在于,导致最小边界匹配成本的目标LM候选被隐含地选择为最终候选。10.根据权利要求1所述的视频编解码方法,其特征在于,所述一组候选对应于一组MVD合并模式(MMVD)候选,其中每个MMVD候选包括距基本合并候选的偏移方向和偏移距离的组合。11.根据权利要求10所述的视频编解码方法,其特征在于,MMVD索引被分配给MMVD候选集合,并且目标MMVD索引被分配用于导致最小边界匹配成本的目标MMVD候选的最小索引值。12.根据权利要求10所述的视频编解码方法,其特征在于,导致最小边界匹配成本的目标MMVD候选被隐含地选择为最终候选。13.根据权利要求1所述的视频编解码方法,其特征在于,所述每个边界匹...

【专利技术属性】
技术研发人员:江嫚书徐志玮
申请(专利权)人:联发科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1