用于将图像划分为编码单元的方法及装置制造方法及图纸

技术编号：43949126 阅读：13 留言：0更新日期：2025-01-07 21:37

本发明专利技术提供了用于将图像划分为编码单元的装置和方法。将图像划分为编码树单元(coding tree units，简称CTU)，并对所述编码树单元进行层次划分。层次划分包括多类型划分，如二叉树或四叉树划分。对于完全位于图像内的CTU和位于边界的CTU，选择相应的多类型划分深度。本发明专利技术提供了图像边界部分的多类型划分，可增强灵活性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频处理领域，尤其涉及通常被称为混合视频编码和压缩的主题。

技术介绍

1、通用视频编码(versatile video coding，简称vvc)下一代标准是itu-t视频编码专家组(video coding experts group，简称vceg)和iso/iec运动图像专家组(movingpicture experts group，简称mpeg)最近的联合视频项目，这两个标准化组织共同合作，其伙伴关系被称为联合视频探索小组(joint video exploration team，简称jvet)。

2、基于当前块的混合视频编解码器采用预测编码。视频序列的图像被划分为像素块，然后对这些块进行编码。不是逐个像素地对块进行编码，而是使用与整个块空间相邻或时间相邻的编码后像素来预测该块。编码器进一步仅处理该块与其预测块之间的差。所述进一步处理通常包括将该块像素变换为变换域中的系数。然后，可将系数进一步压缩(例如，通过量化)、再压缩(例如，通过熵编码)以形成比特流。所述比特流还可包括任何能够使解码器解码编码视频的信令信息。例如，该信令可包括编码器设置相关的设置，例如输入图像的大小、帧率、量化步长指示、应用于图像块的预测等。

3、块和其预测块之间的差值称为块的残差。更具体地，块的每个像素都有残差，即该像素的强度级别与其预测强度级别之间的差值。像素的强度级别称为像素值。块的所有像素的残差统称为块的残差。换言之，块具有残差，所述残差是所述块的所有像素的残差组成的集合或矩阵。然后所述残差与信令信息一起进

4、在基于块的混合视频编码中，每个图像被划分为像素点(sample)块，并且图像中的多个块被聚合以形成作为独立可解码实体的切片。进行了预测和/或变换的块称为编码单元(coding unit，简称cu)或编码块(coding block，简称cb)。编码单元的大小可以不同。

5、例如，在高效视频编码(high-efficiency video coding，简称hevc，也称为h.265)中，视频帧被划分为编码树单元(coding tree unit，简称ctu，也称为编码树块(coding tree block，简称ctb))。ctb是大小相同但不相交的方块，例如64x64像素点。每个ctb作为块划分四叉树结构(即编码树)的根。沿着编码树结构，ctb可以进一步划分为编码块，该编码块的预测类型是确定的。该编码块可进一步划分为更小的变换块，可对该变换块进行变换和量化。

6、有关hevc中划分的细节，可参见v.sze等人编辑的《高效视频编码(hevc)：算法与架构》，斯普林格出版社，2014年版，第3.2章。

7、另外，wo 2016/090568还展示了一个二叉树结构，通过四叉树加二叉树结构将一个单元划分成多个更小的单元。因此，首先对根单元进行四叉树结构划分，然后再采用二叉树结构划分四叉树叶节点。

技术实现思路

1、本专利技术的实施例由独立权利要求的特征定义，并且由从属权利要求的特征定义实施例的其它有利实现方式。

2、根据一般方面，本专利技术提供了一种用于将图像划分为编码单元的装置，所述装置包括处理电路。所述装置用于将所述图像划分为多个编码树单元ctu，所述多个编码树单元包括非边界ctu以及边界ctu，其中,所述非边界ctu沿水平和竖直方向上具有预定尺寸，所述边界ctu的一部分落在由水平图像边界或竖直图像边界划定的图像内，所述边界ctu位于所述图像内的部分沿垂直于所述水平图像边界或者所述竖直图像边界方向上的尺寸小于所述预定尺寸；将所述非边界ctu和所述边界ctu按层次划分为各个编码单元(cu)，其中，所述非边界ctu的层次划分包括多类型划分，所述非边界ctu的层次划分的多类型划分的划分深度不超出最大非边界多类型划分深度；，所述多类型划分是指所述划分方向为竖直或水平方向的划分，所述边界ctu的层次划分包括多类型划分，所述边界ctu的层次划分的多类型划分的划分深度不超出最大边界多类型划分深度。

3、这可增强边界划分的灵活性。

4、进一步，在所述装置的一种实现方式中，所述最大边界多类型划分深度至少为自适应边界多类型划分深度与预定义多类型划分深度之和，其中，所述自适应边界多类型划分深度为以所述水平图像边界方向或者竖直图像边界为划分方向的多类型划分深度。

5、在边界编码树单元或划分块中使用多类型划分时，这有利于自适应地确定划分深度。

6、例如，所述预定义多类型划分深度等于最大非边界多类型划分深度。

7、这样就可以重复使用最大非边界多类型划分深度。

8、进一步，在所述装置的一种实现方式中，所述和还包括所述图像边界方向上的大小和垂直于所述边界ctu的边界划分块的图像边界方向上的大小之比的函数，所述边界划分块为所述自适应边界多类型划分深度的块。

9、这进一步增加了多类型边界划分的最大深度，从而增强了划分灵活性。

10、例如，所述函数是二进制对数。

11、这是有益的，因为它提供了一种实际的实现方式。

12、进一步，在一些实施例中，所述最大边界多类型划分深度为预定义的。

13、这有助于减少确定层次划分的计算成本。

14、例如，所述边界ctu的层次划分还包括四叉树划分。

15、这样就可以从不同模式中进行灵活选择。

16、进一步，在所述装置的一种实现方式中，所述最大边界多类型划分深度大于或等于所述最大非边界多类型划分深度。

17、这可以增强最大可能边界划分深度。

18、本专利技术还提供了一种用于编码视频序列的图像的装置，所述装置包括根据上述示例和实施例中的任一用于将图像划分为编码单元的装置。所述装置还包括图像编码单元，用于对所述编码单元进行编码，以及比特流形成单元，用于生成比特流，所述比特流包括所述编码后的编码单元和指示如何划分所述编码树单元的划分信息。

19、进一步，在一种实现方式中，所述图像编码装置包括所述图像划分装置，其中所述最大边界多类型划分深度为预定义的；所述比特流还包括编码序列参数集，所述编码序列参数集包括所述最大边界多类型划分深度。

20、此外，本专利技术还提供了一种用于解码视频序列的图片的装置，所述装置包括用于解析比特流的比特流解析器，所述比特流解析器包括编码后的编码单元；根据上述示例和实施例中任一项的图片划分确定装置；以及图片解码单元，用于基于所确定的图片划分对所述编码后的编码单元进行解码。

21、进一步，在一种实现方式中，所述图像解码装置包括所述图像划分确定装置，其中最大边界多类型划分深度为预定义的；所述比特流还包括编码序列参数集，所述编码序列参数集包括所述最大边界多类型划分深度；所述图像划分确定装置还用于从所述序列参数集中获取所本文档来自技高网...

【技术保护点】

1.一种用于将图像划分为编码单元的装置，其特征在于，所述装置包括处理电路，用于：

2.根据权利要求1所述的装置，其特征在于，所述非边界CTU的层次划分的多类型划分的划分深度不超出最大非边界多类型划分深度，所述预定义多类型划分深度等于所述最大非边界多类型划分深度。

3.根据权利要求1或2所述的装置，其特征在于，当所述边界CTU位于所述图像的右下角时，执行水平二叉树或三叉树(BTT)划分，然后执行垂直BTT划分。

4.根据权利要求1所述的装置，其特征在于，所述自适应边界多类型划分深度为以所述水平图像边界方向或者竖直图像边界方向为划分方向的多类型划分深度。

5.根据权利要求4所述的装置，其特征在于，以所述水平图像边界方向或者竖直图像边界方向为划分方向的多类型划分深度，为以所述水平图像边界方向或者竖直图像边界方向为划分方向的二叉树划分深度。

6.根据权利要求1至5中任一项所述的装置，其特征在于，所述边界CTU的层次划分还包括四叉树划分。

7.根据权利要求2所述的装置，其特征在于，所述最大边界多类型划分深度大于或等于所

8.一种用于编码视频序列的图像的装置，其特征在于，包括：

9.根据权利要求8所述的用于编码视频序列的图像的装置，其特征在于，

10.一种用于解码视频序列的图像的装置，其特征在于，包括：

11.根据权利要求10所述的解码视频序列的图像的装置，其特征在于，

12.一种用于将图像划分为编码单元的方法，其特征在于，所述方法包括：

13.根据权利要求12所述的方法，其特征在于，所述非边界CTU的层次划分的多类型划分的划分深度不超出最大非边界多类型划分深度，所述预定义多类型划分深度等于所述最大非边界多类型划分深度。

14.根据权利要求12或13所述的方法，其特征在于，当所述边界CTU位于所述图像的右下角，执行水平二叉树或三叉树(BTT)划分，然后执行垂直BTT划分。

15.根据权利要求12所述的方法，其特征在于，所述自适应边界多类型划分深度为以所述水平图像边界方向或者竖直图像边界方向为划分方向的多类型划分深度。

16.根据权利要求15所述的方法，其特征在于，以所述水平图像边界方向或者竖直图像边界方向为划分方向的多类型划分深度，为以所述水平图像边界方向或者竖直图像边界方向为划分方向的二叉树划分深度。

17.根据权利要求12至16中任一项所述的方法，其特征在于，所述边界CTU的层次划分还包括四叉树划分。

18.根据权利要求13所述的方法，其特征在于，所述最大边界多类型划分深度大于或等于所述最大非边界多类型划分深度。

19.一种用于编码视频序列的图像的方法，其特征在于，所述方法包括：

20.一种用于解码视频序列的图像的方法，其特征在于，所述方法包括：

21.一种存储指令的计算机可读介质，其特征在于，所述指令被处理电路执行时，使得所述处理电路执行根据权利要求12至18中任一项所述的方法。

...

【技术特征摘要】

1.一种用于将图像划分为编码单元的装置，其特征在于，所述装置包括处理电路，用于：

2.根据权利要求1所述的装置，其特征在于，所述非边界ctu的层次划分的多类型划分的划分深度不超出最大非边界多类型划分深度，所述预定义多类型划分深度等于所述最大非边界多类型划分深度。

3.根据权利要求1或2所述的装置，其特征在于，当所述边界ctu位于所述图像的右下角时，执行水平二叉树或三叉树(btt)划分，然后执行垂直btt划分。

6.根据权利要求1至5中任一项所述的装置，其特征在于，所述边界ctu的层次划分还包括四叉树划分。

7.根据权利要求2所述的装置，其特征在于，所述最大边界多类型划分深度大于或等于所述最大非边界多类型划分深度。

8.一种用于编码视频序列的图像的装置，其特征在于，包括：

9.根据权利要求8所述的用于编码视频序列的图像的装置，其特征在于，

10.一种用于解码视频序列的图像的装置，其特征在于，包括：

11.根据权利要求10所述的解码视频序列的图像的装置，其特征在于，

12...

【专利技术属性】
技术研发人员：高晗，赵志杰，塞米赫·艾森力克，阿南德·梅赫·科特拉，陈建乐，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人