用于快速视频编码器的二次变换制造技术

技术编号:34316471 阅读:64 留言:0更新日期:2022-07-30 23:12
本发明专利技术提供了一种方法和装置,该方法和装置包括信令和编码低频不可分离变换(LFNST),使得支持快速编码器方法以及传统率失真(RD)搜索。这允许编码器更灵活地使其编码搜索适应其计算能力。还提出将LNFST限制为仅使用第一核并使用CAB AC编码。AC编码。AC编码。

Secondary transform for fast video encoder

【技术实现步骤摘要】
【国外来华专利技术】用于快速视频编码器的二次变换


[0001]本实施方案中的至少一个实施方案一般涉及视频压缩领域。至少一个实施方案尤其旨在用于视频编码的二次变换的编码和使用。

技术介绍

[0002]为了实现高压缩效率,图像和视频编码方案通常采用预测和变换来利用视频内容中的空间和时间冗余。一般来讲,帧内或帧间预测用于利用帧内或帧间相关,然后对在原始块与预测块之间的差异(通常表示为预测误差或预测残差)进行变换、量化和熵编码。为了重构视频,通过对应于熵编码、量化、变换和预测的逆过程对压缩数据进行解码。

技术实现思路

[0003]本实施方案中的一个或多个实施方案提供信令和编码低频不可分离变换(LFNST),使得支持快速编码器方法以及传统率失真(RD)搜索。
[0004]根据至少一个实施方案的第一方面,一种视频编码方法包括:对从初级变换发出的至少一个变换系数应用低频不可分离变换。
[0005]根据至少一个实施方案的第二方面,一种视频编码设备包括用于对从初级变换发出的至少一个变换系数应用低频不可分离变换的装置。
[0006]根据至少一个实施方案的第三方面,呈现了一种包括可由处理器执行的程序代码指令的计算机程序,该计算机程序实施根据至少第一方面或第二方面的方法的步骤。
[0007]根据至少一个实施方案的第四方面,呈现了一种存储在非暂态计算机可读介质上并且包括可由处理器执行的程序代码指令的计算机程序产品,该计算机程序产品实施根据至少第一方面或第二方面的方法的步骤。
附图说明
[0008]图1示出了视频编码器100的示例的框图,诸如高效视频编码(HEVC)编码器。
[0009]图2示出了视频解码器200的示例的框图,诸如HEVC解码器。
[0010]图3示出了在其中实现各种方面和实施方案的系统的示例的框图。
[0011]图4示出了对应于第一实施方案的规格变化。
[0012]图5示出了根据第二实施方案的用于对MIP权重矩阵进行配对的算法的示例。
[0013]图6示出了对应于第三实施方案的规格变化。
[0014]图7示出了根据第三实施方案的示例性编码方法。
[0015]图8示出了对应于第四实施方案的规格变化。
具体实施方式
[0016]本申请中描述的各种方法基于信令和编码低频不可分离变换(LFNST),使得支持快速编码器方法以及传统率失真(RD)搜索。这允许编码器更灵活地使其编码搜索适应其计
算能力。
[0017]此外,尽管描述了与VVC(多功能视频编码)或HEVC(高效视频编码)规格的特定草案相关的原理,但本专利技术方面不限于VVC或HEVC,并且可应用于例如其他标准和推荐(无论是预先存在的还是未来开发的)以及任何此类标准和推荐的扩展(包括VVC和HEVC)。除非另外指明或技术上排除在外,否则本申请中所述的方面可单独或组合使用。
[0018]图1示出了视频编码器100的示例的框图,诸如HEVC编码器。图1还可以示出其中对HEVC标准进行改进的编码器或采用类似于HEVC的技术的编码器,诸如JVET(联合视频探索团队)正在为VVC开发的JEM(联合探索模型)编码器。
[0019]在被编码之前,视频序列可经历预编码处理(101)。例如通过以下方式来执行此操作:将颜色变换应用于输入彩色图片(例如,从RGB 4:4:4到YCbCr 4:2:0的转换),或执行输入图片分量的重新映射,以便获得对压缩更具弹性的信号分布(例如,使用颜色分量中的一个颜色分量的直方图均衡化)。元数据可与预处理相关联并且附接到比特流。
[0020]在HEVC中,为了对具有一个或多个图片的视频序列进行编码,将图片分割(102)成一个或多个切片,其中每个切片可包括一个或多个切片片段。将切片片段分组为编码单元、预测单元和变换单元。HEVC规格区分“块”和“单元”,其中“块”处理样本阵列中的特定区域(例如,亮度、Y),并且“单元”包括与块相关联的所有编码的颜色分量(Y、Cb、Cr或单色)、语法元素和预测数据的并置块(例如,运动向量)。
[0021]对于HEVC中的编码,将图片分割成具有可配置大小的正方形形状的编码树块(CTB),并且将连续的一组编码树块分组为切片。编码树单元(CTU)包含编码的颜色分量的CTB。CTB是分区为编码块(CB)的四叉树的根,并且编码块可被分区为一个或多个预测块(PB)并且形成分区为变换块(TB)的四叉树的根。对应于编码块、预测块和变换框,编码单元(CU)包括预测单元(PU)和树形结构集合的变换单元(TU),PU包括所有颜色分量的预测信息,并且TU包括每个颜色分量的残差编码语法结构。亮度分量的CB、PB和TB的大小适用于对应的CU、PU和TU。在本申请中,术语“块”可用于指代例如CTU、CU、PU、TU、CB、PB和TB中的任一者。另外,“块”还可以用于指代H.264/AVC或其他视频编码标准中所指定的宏块和分区,并且更一般地指代各种大小的数据阵列。
[0022]在编码器100的示例中,图片由编码器元件进行编码,如下所述。以CU为单位处理待编码的图片。使用帧内模式或帧间模式对每个CU进行编码。当CU以帧内模式编码时,其执行帧内预测(160)。在帧间模式中,执行运动估计(175)和补偿(170)。编码器决定(105)帧内模式或帧间模式中的哪一者用于对CU进行编码,并且通过预测模式标志来指示帧内/帧间决定。通过从原始图像块减去(110)预测块来计算预测残差。
[0023]根据同一切片内的重构相邻样本预测处于帧内模式的CU。在HEVC中可用35个帧内预测模式的集合,包括DC、平面和33个角度预测模式。根据与当前块相邻的行和列来重构帧内预测参考。参考使用来自先前重构的块的可用样本在水平和垂直方向上扩展超过块大小的两倍。当使用角度预测模式进行帧内预测时,可沿着由角度预测模式指示的方向复制参考样本。
[0024]用于当前块的适用亮度帧内预测模式可使用两个不同的选项来编码。如果适用模式包含在六个最可能模式(MPM)的构建列表中,则该模式通过MPM列表中的索引来用信号通知。否则,该模式通过模式索引的固定长度二值化来用信号通知。六个最可能模式源自顶部
和左侧相邻块的帧内预测模式(参见下表1)。
[0025][0026]表1
[0027]对于帧间CU,可以多种方法用信号通知运动信息(例如,运动向量和参考图片索引),例如“合并模式”或“高级运动向量预测(AMVP)”。
[0028]在合并模式中,视频编码器或解码器基于已经编码的块组装候选列表,并且视频编码器针对候选列表中的候选中的一个候选用信号通知索引。在解码器端,基于用信号通知的候选来重构运动向量(MV)和参考图片索引。
[0029]在AMVP中,视频编码器或解码器基于根据已经编码的块确定的运动向量来组装候选列表。然后,视频编码器用信号通知候选列表中的索引以标识运动向量预测因子(MVP)并用信号通知运动向量差(MVD)。在解码器端,运动向量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于对图片的当前块进行编码的方法,所述方法包括:

确定是否应该将低频不可分离变换应用于所述当前块,

响应于所述确定:

当不应该应用低频不可分离变换时,确定表示所述低频不可分离变换的信息,所述信息是一位值,

当应该应用低频不可分离变换时,对从初级变换发出的至少一个变换系数应用所述低频不可分离变换,并确定表示所述低频不可分离变换的信息,所述信息是两位值,

使用熵编码对表示所述低频不可分离变换的信息进行编码。2.根据权利要求1所述的方法,其中对用于所述低频不可分离变换的核的选择选自一组核,并且其中所述选择是基于用于所述当前块的帧内预测模式进行的。3.根据权利要求1或2中任一项所述的方法,其中用于所述低频不可分离变换的第一核用于偶数帧内预测模式,并且第二核用于奇数帧内预测模式。4.根据权利要求1至3中任一项所述的方法,其中所述帧内预测模式是基于矩阵帧内预测模式。5.根据权利要求1所述的方法,其中所述一位值是“0”,所述两位值是“10”,并且当应该应用低频不可分离变换时,仅使用第一核。6.一种用于对图片的当前块进行编码的设备,所述设备包括用于以下操作的装置:

确定是否应该将低频不可分离变换应用于所述当前块,
...

【专利技术属性】
技术研发人员:K
申请(专利权)人:交互数字VC控股法国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1