本申请涉及视频编码中的非零舍入与预测模式选择技术。在本发明专利技术的一方面中,可特意消除对双向预测性数据的舍入调整以提供缺乏任何舍入偏置的预测性数据。在这种情况下,可在速率-失真分析中考虑经舍入的预测性数据与未经舍入的预测性数据两者以识别用于预测给定视频块的最佳数据。在本发明专利技术的另一方面中,描述用于在缺省加权预测、隐式加权预测及显式加权预测当中进行选择的技术。在这一背景下,还描述用于将偏移加至预测数据的技术,例如,使用显式加权预测的格式以允许实现原本由隐式或缺省加权预测确定的对预测性数据的偏移。
【技术实现步骤摘要】
视频编码中的非零舍入与预测模式选择技术本案是一件分案申请。本案的母案是国际申请号为PCT/US2010/041423、申请日为2010年7月8日、PCT申请进入中国国家阶段后申请号为201080029582.6、专利技术名称为“视频编码中的非零舍入与预测模式选择技术”的专利技术专利申请案。以下同在申请中且共同转让的申请案以引用的方式明确地并入本文中:MartaKarczewicz、PeisongChen及YanYe的与本申请案同日申请且代理人档案号码082069U2的「视频编码中的非零舍入与预测模式选择技术(Non-ZeroRoundingAndPredictionModeSelectionTechniquesInVideoEncoding)」。
本专利技术涉及视频编码,且更具体来说,涉及使用双向预测的视频编码技术。
技术介绍
数字多媒体能力可并入于广泛范围的装置中,包括数字电视、数字直播系统、无线通信装置、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数字式照相机、数字记录装置、视频游戏装置、视频游戏主机、蜂窝式或卫星无线电电话、数字媒体播放器及其类似者。数字多媒体装置可实施例如MPEG-2、ITU-H.263、MPEG-4或ITU-H.264/MPEG-4第10部分(高级视频编码(AVC))的视频编码技术以更有效地发射及接收或存储及检索数字视频数据。视频编码技术可经由空间及时间预测执行视频压缩以减少或移除视频序列中固有的冗余。在视频编码中,压缩常常包括空间预测、运动估计及运动补偿。帧内编码依赖于空间预测及变换编码(例如,离散余弦变换(DCT)),以减少或移除给定视频帧内的视频块之间的空间冗余。帧间编码依赖于时间预测及变换编码以减少或移除视频序列的连续视频帧的视频块之间的时间冗余。帧内编码的帧(「I帧」)常常用作随机存取点以及其他帧的帧间编码的参考。然而,I帧通常展现比其他帧少的压缩。术语「I单元」可指代I帧、I片或I帧的其他可独立解码部分。对于帧间编码,视频编码器执行运动估计,以追踪两个或两个以上邻近帧或其他被编码的单元(例如,帧的片)之间的匹配视频块的移动。被帧间编码的帧可包括:预测性帧(「P帧」),其可包括根据先前帧预测的块;以及双向预测性帧(「B帧」),其可包括根据视频序列的先前帧及后续帧预测的块。在早期编码技术将预测限制在特定方向上的意义上,术语「P帧」及「B帧」为稍微有历史性的。较新的编码格式及标准可能不限制P帧或B帧的预测方向。因此,术语「双向」现指代基于两个或两个以上参考数据的列表(而不管这种参考数据相对于被编码的数据的时间关系)的预测。举例来说,与例如ITUH.264的较新视频标准一致的双向预测可基于两个不同列表,所述两个不同列表未必需要具有在时间上位于当前视频块之前及之后的数据。换句话说,可根据两个数据列表预测B视频块,所述两个数据列表可对应于来自两个先前帧、两个后续帧或一先前帧及一后续帧的数据。相对照地,基于可对应于一个预测性帧(例如,一个先前帧或一个后续帧)的一个列表(即,一个数据结构)预测P视频块。B帧及P帧可更通常地称作P单元及B单元。也可在较小的编码单元(例如,帧的片或帧的部分)中实现P单元及B单元。B单元可包括B视频块、P视频块或I视频块。P单元可包括P视频块或I视频块。I单元可仅包括I视频块。对于P视频块及B视频块来说,运动估计产生运动矢量,所述运动矢量指示视频块相对于预测性参考帧或其他编码单元中的对应预测视频块的位移。运动补偿使用运动矢量以根据预测性参考帧或其他编码单元产生预测视频块。在运动补偿之后,通过自将要被编码的原始视频块减去预测视频块而形成残余视频块。视频编码器通常应用变换、量子化及熵编码过程以进一步减小与残余块的通信相关联的位速率。I单元及P单元通常用以定义用于P单元及B单元的帧间编码的参考块。
技术实现思路
本专利技术描述可适用于双向预测的视频编码及解码技术。在双向预测中,可基于预测性参考数据的两个不同列表来预测性地编码及解码视频块。在本专利技术的一个方面中,可特意消除对双向预测性数据的舍入调整以提供缺乏任何舍入偏置的预测性数据。在这种情况下,可在速率-失真分析中考虑经舍入的预测性数据与未经舍入的预测性数据两者以识别用于预测一给定视频块的最佳数据。可编码一个或一个以上语法元素以指示所述选择,且解码器可解释所述一个或一个以上语法元素以便确定是否应使用舍入。在本专利技术的另一方面中,描述用于在缺省加权预测、隐式加权预测及显式加权预测当中进行选择的技术。在这一背景下,也描述用于将偏移加至预测数据的技术,例如,使用显式加权预测的格式以允许实现原本由隐式或缺省加权预测定义的对预测性数据的偏移。在一个实例中,本专利技术描述一种编码视频数据的方法。所述方法包含:产生取决于两个或两个以上数据列表且包括舍入调整的第一加权预测数据,产生取决于所述两个或两个以上数据列表且不包括所述舍入调整的第二加权预测数据,基于预测数据的多个候选者的速率-失真分析来选择用于编码所述视频数据的预测数据,其中预测数据的所述多个候选者包括所述第一加权预测数据及所述第二加权预测数据,及使用所述选定预测数据编码所述视频数据。在另一实例中,本专利技术描述一种包含以下各项的方法:接收编码的视频数据,接收指示舍入调整是否被用以编码所述编码的视频数据的一个或一个以上语法元素,产生取决于两个或两个以上数据列表的加权预测数据,其中在所述一个或一个以上语法元素指示所述舍入调整未用以编码所述编码的视频数据的情况下所述加权预测数据不包括所述舍入调整,及使用所述加权预测数据解码所述视频数据。在另一实例中,本专利技术描述一种编码视频数据的视频编码器设备。所述设备包含:存储器,所述存储器存储所述视频数据及用以预测性地编码所述视频数据的两个或两个以上数据列表;以及运动补偿单元。所述运动补偿单元产生取决于所述两个或两个以上数据列表且包括舍入调整的第一加权预测数据,产生取决于所述两个或两个以上数据列表且不包括所述舍入调整的第二加权预测数据,且基于预测数据的多个候选者的速率-失真分析来选择用于编码所述视频数据的预测数据,其中预测数据的所述多个候选者包括所述第一加权预测数据及所述第二加权预测数据。所述视频编码器设备使用所述选定预测数据编码所述视频数据。在另一实例中,本专利技术描述一种视频解码器设备,其包含:熵单元,所述熵单元接收编码的视频数据,且将指示舍入调整是否被用以编码所述编码的视频数据的一个或一个以上语法元素解码;及预测单元,其产生取决于两个或两个以上数据列表的加权预测数据,其中在所述一个或一个以上语法元素指示所述舍入调整未用以编码所述编码的视频数据的情况下所述加权预测数据不包括所述舍入调整,其中所述视频解码器使用所述加权预测数据解码所述视频数据。在另一实例中,本专利技术描述一种编码视频数据的装置,所述装置包含:用于产生取决于两个或两个以上数据列表且包括舍入调整的第一加权预测数据的装置,用于产生取决于所述两个或两个以上数据列表且不包括所述舍入调整的第二加权预测数据的装置,用于基于预测数据的多个候选者的速率-失真分析来选择用于编码所述视频数据的预测数据的装置,其中预测数据的所述多个候选者包括所述第一加权预测数据及所述第二加权预测数据,及用于使用所述本文档来自技高网...
【技术保护点】
一种用于预测取决于两个以上或两个以上预测数据列表的视频数据的方法,所述方法包含:产生取决于所述两个或两个以上预测数据列表且包括至少两个偏移及舍入调整的加权预测数据,其中根据以下方程近似产生所述加权预测数据:pred(i,j)=(pred0(i,j)*w0+pred1(i,j)*w1+((o1+o2)<<r)+2r)>>(r+1),其中pred(i,j)为所述加权预测数据,pred0(i,j)及pred1(i,j)为来自所述两个或两个以上预测数据列表的数据,w0及w1为权重因数,o1及o2所述至少两个偏移,且r及2r为与移位(r+1)个位的右移位运算|>>」相结合提供所述舍入的舍入调整;及使用所述加权预测数据重建所述视频数据。
【技术特征摘要】
2009.07.09 US 12/499,9901.一种用于预测取决于两个或两个以上预测数据列表的视频数据的方法,所述方法包含:产生取决于所述两个或两个以上预测数据列表且包括至少两个偏移及舍入调整的加权预测数据,其中根据以下方程近似产生所述加权预测数据:pred(i,j)=(pred0(i,j)*w0+pred1(i,j)*w1+((o1+o2)<<r)+2r)>>(r+1),其中pred(i,j)为所述加权预测数据,pred0(i,j)及pred1(i,j)为来自所述两个或两个以上预测数据列表的数据,w0及w1为权重因数,o1及o2所述至少两个偏移,且r及2r为与移位(r+1)个位的右移位运算「>>」相结合提供所述舍入的舍入调整;及使用所述加权预测数据重建所述视频数据。2.根据权利要求1所述的方法,其中所述两个或两个以上列表包括列表0和列表1,且其中所述加权预测数据取决于来自所述列表0的第一数据、来自所述列表1的第二数据、两个不同加权因数、两个不同偏移以及至少两个不同舍入项。3.根据权利要求1所述的方法,其中o1是适用于来自列表0的所述pred0(i,j)的第一偏移,且o2是适用于来自所述列表1的所述pred1(i,j)的第二偏移。4.根据权利要求1所述的方法,其中针对亮度块及色度块施加不同偏移。5.根据权利要求1所述的方法,其中将所述至少两个偏移组合为单个偏移o,其中o为适用于来自列表0的所述pred0(i,j)及来自列表1的所述pred1(i,j)的共同偏移。6.根据权利要求1所述的方法,其进一步包含编码指示经重建视频数据的视频位流。7.根据权利要求1所述的方法,其进一步包含使用经重建的视频数据来解码所述视频数据。8.一种用于预测取决于两个或两个以上预测数据列表的视频数据的设备,所述设备包含:存储器,其经配置以存储所...
【专利技术属性】
技术研发人员:马尔塔·卡切维奇,陈培松,叶琰,
申请(专利权)人:高通股份有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。