使用具有控制点运动向量细化的放射运动估计的方法与装置制造方法及图纸

技术编号：44542350 阅读：1 留言：0更新日期：2025-03-11 14:08

用于对仿射编码块使用控制点运动向量(Control‑Point Motion Vectors，简称CPMV)细化或合并候选对象的适应性重新排序(Adaptive Redording of Merge Candidates，简称ARMC)进行视讯编译码的方法和装置。根据该方法，两个或多个CPMV或两个或多个角子块独立运动以生成两个或多个细化的CPMV。包括所述一个或多个细化CPMV的合并列表或高级运动向量预测(Adavanced Motion Vector Prediction，简称AMVP)列表被生成用于对当前块进行编译码。根据另一种方法，被决定用于当前块的仿射模型被应用于当前块的相邻参考子块以导出相邻参考子块的仿射变换参考块。基于仿射变换的参考块，一个或多个范本被决定。模板用于重新排序一合并候选集合，该合并候选集合用于对当前块进行编译码。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

【】本专利技术涉及使用运动估计和运动补偿的视讯编译码。具体地，本专利技术涉及使用译码器导出的运动向量细化相关方法或模板匹配方法的控制点运动向量细化。

技术介绍

0、
技术介绍

1、多功能视讯编译码(versatile video coding，简称vvc)是由itu-t视讯编译码专家组(video coding experts group，简称vceg)和iso/iec运动图像专家组(movingpicture experts group，简称mpeg)的联合视讯专家组(joint video experts team，简称jvet)开发的最新国际视讯编译码标准。该标准已作为iso标准于2021年2月发布：iso/iec23090-3：2021，信息技术-沉浸式媒体的编译码表示-第3部分：多功能视讯编译码。vvc是基于其上一代高效视讯编译码(high efficiency video coding，简称hevc)藉由添加更多的编解碼工具，来提高编解碼效率以及处理包括三维(3-dimensional，简称3d)视频信号在内的各种类型的视讯源。

2、图1a示出结合循环处理的示例适应性帧间/帧内视讯编译码系统。对于帧内预测，预测数据基于当前图片中先前编译码的视讯数据得出。对于帧间预测112，运动估计(motion estimation，简称me)在编码器端执行以及运动补偿(motion compensation，简称mc)基于me的结果执行以提供从其他图片和运动数据导出的预测数据。开关114选择帧内预测110

3、如图1a所示，输入的视讯数据在编码系统中经过一系列处理。由于一系列处理，来自rec 128的重构视讯数据可能会受到各种损害。因此，在重构视讯数据被存储在参考图片缓冲器134中之前，环路滤波器130通常被应用于重构视讯数据，以提高视讯质量。例如，去块滤波器(deblocking filter,简称df)、样本适应性偏移(sample adaptive offset，简称sao)和适应性环路滤波器(adaptive loop filter，简称alf)可被使用。环路滤波器信息可能需要被合并到比特流中，以便译码器可以正确地恢复所需的信息。因此，环路滤波器信息也被提供至熵编码器122以结合到比特流中。在图1a中，在重构样本被存储在参考图片缓冲器134中之前，环路滤波器130被应用于重构的视讯。图1a中的系统旨在说明典型视讯编码器的示例结构。它可以对应于高效视讯编译码(high efficiency video coding，简称hevc)系统、vp8、vp9、h.264或vvc。

4、如图1b所示，译码器可以使用与编码器相似或部分相同的功能块，除了变换118和量化120，因为译码器只需要逆量化124和逆变换126。译码器使用熵译码器140而不是熵编码器122来将视讯比特流译码为量化的变换系数和所需的编译码信息(例如，ilpf信息、帧内预测信息和帧间预测信息)。译码器侧的帧内预测150不需要执行模式搜索。相反，译码器只需要根据从熵译码器140接收到的帧内预测信息生成帧内预测。此外，对于帧间预测，译码器只需要根据从熵译码器140接收到的帧内预测信息执行运动补偿(mc 152)无需运动估计。

5、根据vvc，类似于hevc，输入图片被划分为被称为编译码树单元(coding treeunit，简称ctu)的非重迭正方形块区域。每个ctu都可以被划分为一个或多个较小尺寸的编译码单元(coding unit，简称cu)。生成的cu分区可以是正方形或矩形。此外，vvc将ctu划分为预测单元(prediction unit，简称pu)作为应用预测处理的单元，例如帧间预测，帧内预测等。

6、vvc标准合并各种新的编解碼工具以进一步提高超过hevc标准的编解碼效率。在各种新的编译码工具中，与本专利技术相关的一些编译码工具综述如下。

7、仿射光流(affine optical flow)

8、当编译码单元(coding unit，简称cu)使用仿射模式进行编译码时，编译码单元被划分为4x4子块，以及对于每个子块，一个运动向量基于仿射模型被导出以及运动补偿被执行以生成相应的预测子。使用4x4块作为一个子块而不是使用其他更小尺寸的原因是为了在运动补偿的计算复杂性和编解碼效率之间实现良好的折衷。为了提高编解碼效率，以下文文件中公开了几种方法：jvet-n0236(j.luo，et al.，“ce2-related：predictionrefinement with optical flow for affine mode”，joint video experts team(jvet)of itu-t sg 16 wp 3 and iso/iec jtc 1/sc 29/wg 11，14th meeting：geneva，ch，19-27 march 2019，document：jvet-n0236)，jvet-n0261(k.zhang，et al.，“ce2-1.1：interweaved prediction for affine motion compensation”，joint video expertsteam(jvet)of itu-t sg 16 wp 3 and iso/iec jtc 1/sc 29/wg 11，14th meeting：geneva，ch，19-27march 2019，document：jvet-n0261)，以及jvet-n0262(h.huang，et al.，“ce9-related：disabling dmvr for non-equal weight bpwa”，joint video expertsteam(jvet)of itu-t sg 16wp 3and iso/iec jtc 1/sc 29/wg 11，14th meetin本文档来自技高网...

【技术保护点】

1.一种视讯编译码方法，该方法包括：

2.如权利要求1所述之视讯编译码方法，其中，使用一译码器侧运动向量细化方案或一多遍次译码器侧运动向量细化方案来细化该两个或更多个控制点运动向量或该两个或更多个角子块运动。

3.如权利要求2所述之视讯编译码方法，其中，与该两个或更多个控制点运动向量或该两个或更多个角子块运动中的每一个相关联的一N×N区域用于双边匹配，以及其中N是一正整数。

4.如权利要求3所述之视讯编译码方法，其中，N取决于该当前块的块大小或图片大小。

5.如权利要求3所述之视讯编译码方法，其中，该NxN区域的大小与该当前块的仿射子块大小相同，以及该NxN区域与该当前块的一对应仿射子块对齐。

6.如权利要求3所述之视讯编译码方法，其中，该NxN区域以一相应控制点运动向量的一位置为中心。

7.如权利要求1所述之视讯编译码方法，其中，该两个或更多个控制点运动向量用于导出该两个或更多个角子块运动。

8.如权利要求1所述之视讯编译码方法，其中，该两个或更多个控制点运动向量或该两个或更多个角子块运动使用模板匹配来细化。

9.如权利要求8所述之视讯编译码方法，其中，该模板匹配使用以每个相应控制点运动向量位置为中心的一NxN区域内的多个样本，排除该当前块中的多个当前样本和其他多个未译码样本，作为一个或多个模板。

10.如权利要求8所述之视讯编译码方法，其中，该模板匹配使用的多个样本来自一对应的角子块的上方紧邻的一相邻子块的底下N行样本，或者来自一对应的角子块的左侧紧邻的一相邻子块的右侧M行样本，其中N和M为正整数。

11.一种用于视讯编译码的装置，该装置包括一个或多个电子电路或处理器，用于：

12.一种视讯编译码方法，该方法包括：

13.如权利要求12所述之视讯编译码方法，其中，该等相邻参考子块包括该当前块的多个上方相邻参考子块和多个左侧相邻参考子块。

14.如权利要求13所述之视讯编译码方法，其中，该一个或多个模板包括该等上方相邻参考子块的底部N行和该左侧相邻参考子块的右侧M行，其中N和M为正整数。

15.如权利要求14所述之视讯编译码方法，其中，N和M取决于该当前块的块大小或图片大小。

16.一种用于视讯编译码的装置，该装置包括一个或多个电子电路或处理器，用于：

...

【技术特征摘要】
【国外来华专利技术】

1.一种视讯编译码方法，该方法包括：

3.如权利要求2所述之视讯编译码方法，其中，与该两个或更多个控制点运动向量或该两个或更多个角子块运动中的每一个相关联的一n×n区域用于双边匹配，以及其中n是一正整数。

4.如权利要求3所述之视讯编译码方法，其中，n取决于该当前块的块大小或图片大小。

5.如权利要求3所述之视讯编译码方法，其中，该nxn区域的大小与该当前块的仿射子块大小相同，以及该nxn区域与该当前块的一对应仿射子块对齐。

6.如权利要求3所述之视讯编译码方法，其中，该nxn区域以一相应控制点运动向量的一位置为中心。

7.如权利要求1所述之视讯编译码方法，其中，该两个或更多个控制点运动向量用于导出该两个或更多个角子块运动。

8.如权利要求1所述之视讯编译码方法，其中，该两个或更多个控制点运动向量或该两个或更多个角子块运动使用模板匹配来细化。

9.如权利要...

【专利技术属性】
技术研发人员：赖贞延，庄子德，陈庆晔，徐志玮，罗志轩，
申请(专利权)人：联发科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人