编码/解码在CTU网格中分区的视频图像制造技术

技术编号：43218347 阅读：13 留言：0更新日期：2024-11-05 17:11

本申请涉及将视频图像编码成经编码的视频图像数据的比特流/从经编码的视频图像数据的比特流中解码视频图像。定义高级图像分区结构以指定矩形图像区域，该矩形图像区域的大小可能不等于现有压缩标准中通常在序列参数集(SPS)中发信号通知的默认CTU大小(宽度和高度)的整数倍。定义这样的矩形图像区域的高级图像分区结构提高了CTU网格的表示的灵活性。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本申请一般地涉及视频图像编码和解码。特别地，但非排他地，本申请的涉及在ctu网格中对视频图像进行分区，用于将视频图像数据编码到比特流中或从比特流中解码视频图像数据。

技术介绍

1、本节旨在向读者介绍本领域的各个方面，这些方面可以与下面描述和/或要求保护的本申请的至少一个示例性实施例的各个方面有关。本讨论被认为有助于向读者提供背景信息，以促进对本申请的各个方面的更好理解。因此，应该理解的是，这些陈述应该从这个角度来阅读，而不是作为对现有技术的承认。

2、在诸如hevc(iso/iec 23008-2高效视频编码，itu-t recommendation h.265，https://www.itu.int/rec/t-rec-h.265-202108-p/en)或vvc(iso/iec 23090-3通用视频编码，itu-t recommendation h.266，https://www.itu.int/rec/t-rec-h.266-202008-i/en)的最先进的视频压缩系统中，提供了低级和高级图像分区，以将视频图像划分为图像区域，即所谓的编码树单元(ctu)，对于hevc来说，编码树单元(ctu)的大小通常在8×8和64×64像素之间，而对于vvc来说，编码树单元(ctu)的大小为32×32、64×64或128×128像素。

3、视频图像的ctu划分形成固定大小的ctu的网格，即ctu网格，其中上边界和左边界与视频图像的上边框和左边框在空间上重合。ctu网格表示视频图像的空间分区。

4、

5、ctu在ctu网格中的空间位置是根据ctu地址ctuaddr确定的，该ctu地址ctuaddr定义了ctu的左上角距离原点的空间位置。如图1所图示的，ctu地址可以从包含ctu的更高级空间结构s的左上角定义空间位置。

6、编码树与每个ctu相关联，以确定ctu的树划分。

7、如图1所图示的，在hevc中，编码树是ctu的四叉树划分，其中每个叶子被称为编码单元(cu)。cu在视频图像中的空间位置由cu索引cuidx定义，该cu索引cuidx指示了距ctu的左上角的空间位置。cu在空间上被分区为一个或多个预测单元(pu)。pu在视频图像vp中的空间位置由pu索引puidx定义，该pu索引puidx定义了距ctu的左上角的空间位置，并且分区的pu的元素的空间位置由pu分区索引pupartidx定义，该pu分区索引pupartidx定义了距pu的左上角的空间位置。每个pu被分配一些帧内或帧间预测参数(预测信息)。帧内或帧间编码模式在cu级上分配。根据被称为变换树的四叉树，cu还可以在空间上分区为一个或多个变换单元(tu)。变换单元是变换树的叶子。tu在视频图像中的空间位置由tu索引tuidx定义，该tu索引tuidx定义了距cu的左上角的空间位置。每个tu被分配一些变换参数(预测信息)。在tu级分配变换类型，并且在图像块的编码或解码期间在tu级处进行2d单独变换。

8、hevc中存在的pu分区类型如图2所图示的。它们包括正方形分区(2n×2n和n×n)，它们是唯一在cu内和cu间两者中均使用的分区，对称非正方形分区(2n×n、n×2n，仅在cu间中使用)，以及非对称分区(仅在cu间中使用)。例如，pu类型2n×nu代表pu的不对称水平分区，其中较小的分区位于pu的顶部。根据另一个示例，pu类型2n×nl代表pu的不对称水平分区，其中较小的分区位于pu的顶部。

9、如图3所图示的，在vvc中，编码树从根节点(即ctu)开始。接下来，四叉树(或四元树)分割将根节点划分成对应于相等大小的4个子块的4个节点(实线)。接下来，四元树(或四叉树)叶子然后可以被所谓的多类型树进一步分区，该多类型树涉及根据图4所图示的4个分割模式之一的二元分割或三元分割。这些分割类型是竖直和水平二元分割模式，记为sbtv和sbth，以及竖直和水平三元分割模式spttv和stth。

10、在亮度和色度分量共享的联合编码的情况下，ctu的编码树的叶子是cu。

11、在帧内视频图像(即在没有帧间预测的情况下进行编码的视频图像)中，可以使用分离的编码树，用于一侧的亮度分量和另一侧的色度分量。ctu的亮度分量部分被称为亮度编码树块(亮度ctb)。然后，亮度ctb与编码树相关联，编码树的叶子与亮度编码块相关联。此外，在分离的亮度/色度编码树的情况下，在3-分量图像的情况下，ctu的两个色度分量部分共享相同的编码树，该相同的编码树被称为色度编码树块(色度ctb)。然后，将色度ctb与编码树相关联，编码树的叶子与色度编码块相关联。

12、与hevc相反，在vvc中，在大多数情况下，cu、pu和tu具有相等的大小，这意味着除非在一些特定的编码模式中，否则cu一般不会被分区为pu或tu。

13、与hevc相比，vvc的块结构具有更大的灵活性，因为cu可以是正方形或矩形，并且允许许多矩形块形状。编码结构的这种更大的灵活性使压缩效率提高了大约15％，即在同等图像质量下平均比特率降低了15％。

14、图5示意性地示出了用于根据vvc配置编码树分区的编码参数的示例。

15、编码参数ctu大小是指四元树(或四叉树)的根节点大小。编码参数ctbsizey是指亮度ctb的大小。编码参数mincbsizey是指亮度(y)的最小允许的编码的块大小。编码参数minqtsize是指最小允许的四叉树叶子大小，编码参数maxbtsize是指最大允许的二元树根节点大小，编码参数maxttsize是指最大允许的三元树根节点大小，编码参数maxmttdepth是指从四叉树叶子分割的多类型树的最大允许的层次深度，编码参数minbtsize是指最小允许的二元树叶子大小，编码参数minttsize是指最小允许的三元树叶子大小。

16、vvc编码的视频图像的大小是8的倍数。因此，视频图像大小可能不存在于一组完整的ctu中，即视频图像大小可能不是32、64或128的倍数。在这种情况下，一些部分ctu可能会存在于视频图像的底部或右侧。通常使用一些块分区规则来处理右侧和底部视频图像边框上的块分区。

17、在块分区规则的一个示例性实施例中，如果树节点块(与树节点相关联的块)超出了底部和右侧图像边界(图6)，如果该块可以与四叉树(qt)节点相关联并且该块的大小大于minqtsize，则可以强制qt分割模式(虚线)，否则，可以强制sbth分割模式(图7)。

18、如果树节点块超出了底部或右侧视频图像边框，如果该块是四本文档来自技高网...

【技术保护点】

1.一种用于将视频图像编码成经编码的视频图像数据的比特流的方法，其中所述方法包括：

2.根据权利要求1所述的方法，其中所述方法进一步包括将表示每个编码树单元网格的分区信息数据编码(120)到所述比特流中。

3.根据权利要求1或2所述的方法，其中将所述视频图像分割成矩形图像区域，以将所述视频图像的具有低空间活动性的图像区域与具有高空间活动性的图像区域分开。

4.根据权利要求3所述的方法，其中通过从视频图像内容中检测竖直边缘和水平边缘来确定所述视频图像的空间活动性。

5.根据权利要求1所述的方法，其中根据分解树对所述视频图像进行分割，并且所述分解树的至少一个叶子是矩形图像区域。

6.根据权利要求5所述的方法，其中所述分解树是二叉分解树，并且其中将分割线偏移量编码到所述比特流中，以指示将与父节点相关联的图像区域分割成与两个子节点相关联的两个子区域的线的位置。

7.一种从经编码的视频图像数据的比特流中解码视频图像的方法，其中所述方法包括：

8.根据权利要求7所述的方法，其中根据从所述比特流中解码的分区信息

9.根据权利要求7或8所述的方法，其中所述矩形图像区域由子图像、图块或切片定义，每个图块是编码树单元的序列，切片包括整数个图块或图块内整数个连续的编码树单元行，所述编码树单元中的每个编码树单元的大小等于所述默认大小。

10.根据权利要求7至9中任一项所述的方法，其中通过分区矩形图像区域来确定单个编码树单元网格，并且其中所述单个编码树单元网格用于对所述矩形图像区域的每个分量进行编码/解码。

11.根据权利要求7至9中任一项所述的方法，其中针对矩形图像区域的每分量确定编码树单元网格。

12.一种比特流，被格式化为包括经编码的视频图像数据，并且根据权利要求1至6中任一项所述的方法获得。

13.一种装置，包括用于执行权利要求1至6中任一项所述的方法或权利要求7至11中任一项所述的方法之一的工具。

14.一种计算机程序产品，包括指令，在程序被一个或多个处理器执行时，所述指令使得所述一个或多个处理器执行权利要求1至6中任一项所述的方法，或权利要求7至11中任一项所述的方法。

15.一种非暂时性存储介质，携带用于执行权利要求1至6中任一项所述的方法，或权利要求7至11中任一项所述的方法的程序代码的指令。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于将视频图像编码成经编码的视频图像数据的比特流的方法，其中所述方法包括：

2.根据权利要求1所述的方法，其中所述方法进一步包括将表示每个编码树单元网格的分区信息数据编码(120)到所述比特流中。

4.根据权利要求3所述的方法，其中通过从视频图像内容中检测竖直边缘和水平边缘来确定所述视频图像的空间活动性。

5.根据权利要求1所述的方法，其中根据分解树对所述视频图像进行分割，并且所述分解树的至少一个叶子是矩形图像区域。

7.一种从经编码的视频图像数据的比特流中解码视频图像的方法，其中所述方法包括：

8.根据权利要求7所述的方法，其中根据从所述比特流中解码的分区信息数据来确定(215)所述多个编码树单元网格。

9.根据权利...

【专利技术属性】
技术研发人员：法布里斯勒莱昂内克，皮埃尔安德里翁，
申请(专利权)人：北京小米移动软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人