使用不对称运动分割的视频译码技术制造技术

技术编号:14864903 阅读:78 留言:0更新日期:2017-03-19 20:11
本发明专利技术涉及用于对视频数据进行解码的技术,包含:接收对应于视频数据块的残余数据,其中所述视频数据块是使用不对称运动分割经编码,是使用后向视图合成预测BVSP经单向预测,且具有16x12、12x16、16x4或4x16的大小;将所述视频数据块分割为子块,每一子块具有8x4或4x8的大小;从对应于参考图片的深度图片中的对应深度块导出所述子块中的每一者的视差运动向量;使用所述相应导出的视差运动向量合成所述子块中的每一者的相应参考块;以及通过使用所述残余数据和所述经合成相应参考块对所述子块中的每一者执行运动补偿而对所述视频数据块进行解码。

【技术实现步骤摘要】
【国外来华专利技术】本申请案主张2013年9月13日申请的第61/877,793号美国临时申请案和2013年9月23日申请的第61/881,383号美国临时申请案的权益,以上美国临时申请案两者的整个内容以引用的方式并入本文中。
本专利技术涉及视频译码,即,视频数据的编码或解码。
技术介绍
数字视频能力可以并入到多种多样的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子图书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频流式传输装置及其类似者。数字视频装置实施视频译码技术,例如由MPEG-2、MPEG-4、ITU-TH.263、ITU-TH.264/MPEG-4第10部分高级视频译码(AVC)定义的标准、目前正在开发的高效率视频译码(HEVC)标准及此类标准的扩展中所描述的视频译码技术。视频装置可通过实施此些视频译码技术而更有效地发射、接收、编码、解码和/或存储数字视频信息。视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码,视频切片(即,视频帧或视频帧的一部分)可分割成视频块,所述视频块还可被称作树块、译码单元(CU)和/或译码节点。使用关于同一图片中的相邻块中的参考样本的空间预测编码图片的经帧内译码(I)切片中的视频块。图片的经帧间编码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。空间或时间预测导致待译码块的预测性块。残余数据表示待译码原始块与预测性块的间的像素差。经帧间译码块是根据指向形成预测块的参考样本块的运动向量和指示经译码块与预测块之间的差的残余数据编码的。根据帧内译码模式和残余数据来编码经帧内译码块。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,可接着量化所述残余变换系数。可扫描一开始按二维阵列排列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
技术实现思路
一般来说,本专利技术涉及基于高级编解码器的三维(3D)视频译码,在一些实例中包含深度译码技术。本专利技术描述当结合不对称运动分割使用时用于视图合成预测译码的技术,包含块大小的确定。本专利技术还描述当结合不对称运动分割使用时用于高级运动预测的技术。在本专利技术的一个实例中,一种对视频数据进行解码的方法包括:接收对应于视频数据块的残余数据,其中所述视频数据块是使用不对称运动分割经编码,是使用后向视图合成预测(BVSP)经单向预测,且具有16x12、12x16、16x4或4x16的大小;将所述视频数据块分割为子块,每一子块具有8x4或4x8的大小;从对应于参考图片的深度图片中的对应深度块导出所述子块中的每一者的相应视差运动向量;使用所述相应导出的视差运动向量合成所述子块中的每一者的相应参考块;以及通过使用所述残余数据和所述经合成相应参考块对所述子块中的每一者执行运动补偿而对所述视频数据块进行解码。在本专利技术的另一实例中,一种对视频数据进行编码的方法包括:使用不对称运动分割产生视频数据块,其中所述视频数据块是使用后向视图合成预测(BVSP)经单向预测且具有16x12、12x16、16x4或4x16的大小;将所述视频数据块分割为子块,每一子块具有8x4或4x8的大小;从对应于参考图片的深度图片中的对应深度块导出所述子块中的每一者的相应视差运动向量;使用所述相应导出的视差运动向量合成所述子块中的每一者的相应参考块;以及通过使用所述经合成相应参考块对所述子块中的每一者执行运动补偿而对所述视频数据块进行编码。在本专利技术的另一实例中,一种经配置以对视频数据进行解码的设备包括:视频存储器,其经配置以存储对应于视频数据块的信息;以及一或多个处理器,其经配置以:接收对应于所述视频数据块的残余数据,其中所述视频数据块是使用不对称运动分割经编码,是使用后向视图合成预测(BVSP)经单向预测,且具有16x12、12x16、16x4或4x16的大小;将所述视频数据块分割为子块,每一子块具有8x4或4x8的大小;从对应于参考图片的深度图片中的对应深度块导出所述子块中的每一者的相应视差运动向量;使用所述相应导出的视差运动向量合成所述子块中的每一者的相应参考块;以及通过使用所述残余数据和所述经合成相应参考块对所述子块中的每一者执行运动补偿而对所述视频数据块进行解码。在本专利技术的另一实例中,一种经配置以对视频数据进行解码的设备包括:用于接收对应于视频数据块的残余数据的装置,其中所述视频数据块是使用不对称运动分割经编码,是使用后向视图合成预测(BVSP)经单向预测,且具有16x12、12x16、16x4或4x16的大小;用于将所述视频数据块分割为子块的装置,每一子块具有8x4或4x8的大小;用于从对应于参考图片的深度图片中的对应深度块导出所述子块中的每一者的相应视差运动向量的装置;用于使用所述相应导出的视差运动向量合成所述子块中的每一者的相应参考块的装置;以及用于通过使用所述残余数据和所述经合成相应参考块对所述子块中的每一者执行运动补偿而对所述视频数据块进行解码的装置。在附图和下文描述中陈述本专利技术的一或多个实例的细节。其它特征、目标和优点将从所述描述、图式以及权利要求书显而易见。附图说明图1是说明可利用本专利技术的帧间预测技术的实例视频编码及解码系统的框图。图2是说明用于多视图视频的实例解码次序的概念图。图3是说明用于多视图视频的实例预测结构的概念图。图4是说明用于3D视频的纹理和深度值的概念图。图5是说明实例分割类型的概念图。图6是说明合并模式运动向量候选者的概念图。图7是指示合并候选者索引的实例规范的表。图8是说明用于实例视差向量导出过程的相邻块的概念图。图9是说明相邻块视差向量导出过程的概念图。图10是说明8x8深度块的四个拐角像素的概念图。图11是说明用于合并/跳过模式的经视图间预测的运动向量候选者的实例导出的概念图。图12是指示3D-HEVC中的参考索引的实例规范的表。图13是说明用于深度译码的运动向量继承候选者的实例导出的概念图。图14说明多视图视频译码中的高级残余预测(ARP)的预测结构。图15是说明当前块、参考块和运动补偿块之间的实例关系的概念图本文档来自技高网
...

【技术保护点】
一种对视频数据进行解码的方法,所述方法包括:接收对应于视频数据块的残余数据,其中所述视频数据块是使用不对称运动分割经编码,是使用后向视图合成预测BVSP经单向预测,且具有16x12、12x16、16x4或4x16的大小;将所述视频数据块分割为子块,每一子块具有8x4或4x8的大小;从对应于参考图片的深度图片中的对应深度块导出所述子块中的每一者的相应视差运动向量;使用所述相应导出的视差运动向量合成所述子块中的每一者的相应参考块;以及通过使用所述残余数据和所述经合成相应参考块对所述子块中的每一者执行运动补偿而对所述视频数据块进行解码。

【技术特征摘要】
【国外来华专利技术】2013.09.13 US 61/877,793;2013.09.23 US 61/881,383;1.一种对视频数据进行解码的方法,所述方法包括:
接收对应于视频数据块的残余数据,其中所述视频数据块是使用不对称运动分割
经编码,是使用后向视图合成预测BVSP经单向预测,且具有16x12、12x16、16x4
或4x16的大小;
将所述视频数据块分割为子块,每一子块具有8x4或4x8的大小;
从对应于参考图片的深度图片中的对应深度块导出所述子块中的每一者的相应
视差运动向量;
使用所述相应导出的视差运动向量合成所述子块中的每一者的相应参考块;以及
通过使用所述残余数据和所述经合成相应参考块对所述子块中的每一者执行运
动补偿而对所述视频数据块进行解码。
2.根据权利要求1所述的方法,其中所述视频数据块是预测单元。
3.根据权利要求2所述的方法,其进一步包括:
接收指示所述预测单元是使用不对称运动分割经编码且指示所述预测单元是使
用后向视图合成预测经单向预测的一或多个语法元素;以及
接收指向BVSP候选者的合并候选者索引。
4.根据权利要求1所述的方法,其中导出所述子块中的每一者的所述相应视差运动向
量包括:
导出所述视频数据块的视差向量;
使用所述所导出的视差向量定位所述子块中的每一者的所述对应深度块;以及
将所述子块中的每一者的所述对应深度块的一个选定深度值转换为所述相应视
差运动向量。
5.根据权利要求1所述的方法,其中所述视频数据块是第一视频数据块,所述方法进
一步包括:
接收对应于第二视频数据块的残余数据,其中所述第二视频数据块是使用视图间
运动预测或运动向量继承中的至少一者经编码且具有16x4或4x16的大小;
将所述第二视频数据块分割为子块,每一子块具有8x4或4x8的大小;
从一个相应参考块导出所述子块中的每一者的运动信息;以及
通过使用所述残余数据、所述所导出运动信息和一个参考图片列表对所述子块中
的每一者执行运动补偿而对所述第二视频数据块进行解码。
6.根据权利要求5所述的方法,其中执行运动补偿包括相对于所述一个参考图片列表
中的图片执行单向运动补偿。
7.根据权利要求1所述的方法,其中所述视频数据块是第一视频数据块,所述方法进
一步包括:
接收对应于第二视频数据块的残余数据,其中所述第二视频数据块是使用视图间
运动预测或运动向量继承中的至少一者经编码且具有大小16x12或12x16;
将所述第二视频数据块分割为多个子块;以及
以单向预测性预测对所述多个子块中的每一者进行解码。
8.一种对视频数据进行编码的方法,所述方法包括:
使用不对称运动分割产生视频数据块,其中所述视频数据块是使用后向视图合成
预测BVSP经单向预测且具有16x12、12x16、16x4或4x16的大小;
将所述视频数据块分割为子块,每一子块具有8x4或4x8的大小;
从对应于参考图片的深度图片中的对应深度块导出所述子块中的每一者的相应
视差运动向量;
使用所述相应导出的视差运动向量合成所述子块中的每一者的相应参考块;以及
通过使用所述经合成相应参考块对所述子块中的每一者执行运动补偿而对所述
视频数据块进行编码。
9.根据权利要求8所述的方法,其中所述视频数据块是预测单元。
10.根据权利要求9所述的方法,其进一步包括:
产生指示所述预测单元是使用不对称运动分割经编码且指示所述预测单元是使
用后向视图合成预测经单向预测的一或多个语法元素;以及
产生指向BVSP候选者的合并候选者索引。
11.根据权利要求8所述的方法,其中导出所述子块中的每一者的所述相应视差运动向
量包括:
导出所述视频数据块的视差向量;
使用所述所导出的视差向量定位所述子块中的每一者的所述对应深度块;以及
将所述子块中的每一者的所述对应深度块的一个选定深度值转换为所述相应视
差运动向量。
12.根据权利要求8所述的方法,其中所述视频数据块是第一视频数据块,所述方法进
一步包括:
使用不对称运动分割产生第二视频数据块,其中所述第二视频数据块是使用视图
间运动预测或运动向量继承中的至少一者经编码且具有16x4或4x16的大小;
将所述第二视频数据块分割为子块,每一子块具有8x4或4x8的大小;
从一个相应参考块导出所述子块中的每一者的运动信息;以及
通过使用所述所导出运动信息和一个参考图片列表对所述子块中的每一者执行
运动补偿而对所述第二视频数据块进行编码。
13.根据权利要求12所述的方法,其中执行运动补偿包括相对于所述一个参考图片列
表中的图片执行单向运动补偿。
14.根据权利要求8所述的方法,其中所述视频数据块是第一视频数据块,所述方法进
一步包括:
使用不对称运动分割产生第二视频数据块,其中所述第二视频数据块是使用视图
间运动预测或运动向量继承中的至少一者经编码且具有大小16x12或12x16;
将所述第二视频数据块分割为多个子块;以及
以单向预测性预测对所述多个子块中的每一者进行编码。
15.一种经配置以对视频数据进行解码的设备,所述设备包括:
视频存储器,其经配置以存储对应于视频数据块的信息;以及
一或多个处理器,其经配置以:
接收对应于所述视频数据块的残余数据,其中所述视频数据块是使用不对称运

\t动分割经编码,是使用后向视图合成预测BVSP经单向预测,且具有16x12...

【专利技术属性】
技术研发人员:陈颖张莉
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1