使用二进制算术译码过程熵译码视频数据的方法及其设备技术

技术编号:10258709 阅读:219 留言:0更新日期:2014-07-25 16:20
本发明专利技术描述用于视频译码中的二进制算术译码的技术,以及用于执行此类技术的视频编码器和解码器。在一些实例中,所述技术可支持二进制算术译码,所述二进制算术译码支持较缓慢适应速率且考虑更极端概率(即,较接近于0和1的概率)同时维持相对较小表格。

【技术实现步骤摘要】
【国外来华专利技术】使用二进制算术译码过程熵译码视频数据的方法及其设备本申请案主张2011年10月27日申请的第61/552,426号美国临时申请案的权益,所述申请案的全部内容以引用的方式并入本文中。
本专利技术涉及视频译码且,更明确地说,涉及用于进行视频数据的二进制算术译码的技术。
技术介绍
数字视频能力可并入到广泛范围的装置中,广泛范围的装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数字摄像机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置等等。数字视频装置实施视频压缩技术以更有效率地发射、接收及存储数字视频信息,视频压缩技术例如以下各标准中所描述的视频压缩技术等:由MPEG-2、MPEG-4、ITU-TH.263、ITU-TH.264/MPEG-4(第10部分,高级视频译码(AVC))定义的标准、目前在开发中的高效率视频译码(HEVC)标准,以及此类标准的扩展。视频压缩技术包含空间预测和/或时间预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频帧或切片分割成多个块。可进一步分割每一块。经帧内译码(I)帧或切片中的块是使用相对于同一帧或切片中的相邻块中的参考样本的空间预测来编码。经帧间译码(P或B)帧或切片中的块可使用相对于同一帧或切片中的相邻块中的参考样本的空间预测或相对于其它参考帧中的参考样本的时间预测。空间预测或时间预测导致译码块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本的块的运动向量以及指示经译码块与预测性块之间的差异的残余数据来编码。经帧内译码块是根据帧内译码模式和残余数据来编码。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生接着可进行量化的残余变换系数。可以特定次序来扫描最初以二维阵列布置的经量化的变换系数以产生变换系数的一维向量以用于进行熵译码。各种熵译码过程可用以译码残余变换系数、运动向量信息、语法元素和其它相关联信息。各种熵译码及其它数据压缩过程的实例包含上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、概率区间分割熵译码(PIPE)、哥伦布译码(Golombcoding)、哥伦布-莱斯译码(Golomb-Ricecoding)以及指数哥伦布译码(exponentialGolombcoding)。
技术实现思路
一般来说,本专利技术描述用于视频译码中的二进制算术译码的技术,以及用于执行此类技术的视频编码器和解码器。在一些实例中,所述技术可支持二进制算术译码,所述二进制算术译码递送较缓慢适应速率且考虑更极端概率(即,较接近于0和1的概率)同时维持相对较小表格。所述技术可包含使用增加的数目个概率状态,以使得表格可提供较缓慢适应和较低概率。在一些实例中,可将最高概率(p0)的值修改为(例如)低于1/2。在另一实例中,为了避免范围表中的状态的数目的大增加,本专利技术的技术可包含将指示概率状态的索引映射到比其它常规技术中使用的索引大小低的大小(即,少数索引),以便对最小可能符号(LPS)的范围编索引。在一些实例中,可将概率状态索引除以二以产生新的索引,且可将新的索引用作范围LPS表的条目。在此情况下,不是使用概率状态σ来对范围LPS表中的条目编索引,而是所述技术可使用(σ>>1),即,除以二的状态且将状态舍入到较低整数。状态索引的分组可通过表格来描述,所述表格从初始数目个概率状态索引到减少的数目个概率状态索引(分组状态索引)。使用此种表格可以额外存储器为代价来提高性能(与除法或右移相比较),借此呈现存储器与性能之间的所希望的设计折衷。尽管可使用概率状态索引到范围LPS表中的条目的线性映射,但还可能希望提供非线性映射。举例来说,可根据对数映射来映射概率状态索引。在一些实例中,可使用逐段线性映射来实现对数映射。一般来说,可使用例如预先计算的映射表等表格来定义对数或其它映射,或在其它实例中有可能经由应用一个或一个以上数学公式来定义对数或其它映射。在一个实例中,本专利技术描述一种在视频译码过程中使用二进制算术译码过程熵译码视频数据的方法。所述方法包括:在二进制算术译码过程中确定符号的概率状态,其中所述概率状态包括多个概率状态中的一者;以及将指示所述所确定概率状态的索引映射到多个分组索引中的一者,其中所述分组索引中的至少一者表示所述多个概率状态中的至少两者,且其中所述分组索引中的每一者识别表格中的概率符号的一范围。在另一实例中,本专利技术描述一种经配置以在视频译码过程中使用二进制算术译码过程熵译码视频数据的设备。所述设备包括:用于在二进制算术译码过程中确定符号的概率状态的装置,其中所述概率状态包括多个概率状态中的一者;以及用于将指示所述所确定概率状态的索引映射到多个分组索引中的一者的装置,其中所述分组索引中的至少一者表示所述多个概率状态中的至少两者,且其中所述分组索引中的每一者识别表格中的概率符号的一范围。在另一实例中,本专利技术描述一种经配置以在视频译码过程中使用二进制算术译码过程熵译码视频数据的设备。所述设备包括视频译码器,所述视频译码器经配置以:在二进制算术译码过程中确定符号的概率状态,其中所述概率状态包括多个概率状态中的一者;以及将指示所述所确定概率状态的索引映射到多个分组索引中的一者,其中所述分组索引中的至少一者表示所述多个概率状态中的至少两者,且其中所述分组索引中的每一者识别表格中的概率符号的一范围。在另一实例中,本专利技术描述一种存储指令的计算机可读存储媒体,所述指令在经执行时致使一个或一个以上处理器:在视频译码过程中使用二进制算术译码过程熵译码视频数据。所述指令致使所述一个或一个以上处理器:在二进制算术译码过程中确定符号的概率状态,其中所述概率状态包括多个概率状态中的一者;以及将指示所述所确定概率状态的索引映射到多个分组索引中的一者,其中所述分组索引中的至少一者表示所述多个概率状态中的至少两者,且其中所述分组索引中的每一者识别表格中的概率符号的一范围。一个或一个以上实例的细节阐述于附图及以下描述中。其它特征、目标及优点将从描述和附图及从权利要求书中显而易见。附图说明图1为说明实例视频编码及解码系统的框图。图2A和2B为说明二进制算术译码中的范围更新过程的概念图。图3为说明二进制算术译码中的输出过程的概念图。图4为说明实例视频编码器的框图。图5为说明视频编码器中的上下文自适应二进制算术译码器的框图。图6为说明实例视频解码器的框图。图7为说明视频解码器中的上下文自适应二进制算术译码器的框图。图8为说明根据本专利技术的技术的实例方法的流程图。具体实施方式本专利技术描述用于二进制算术译码(BAC)的技术。在一个或一个以上实例中,本专利技术的技术可在视频译码期间在上下文自适应二进制算术译码(CABAC)过程中使用。举例来说,可在经配置以执行此类技术的视频编码器和解码器中执行此类技术。本专利技术中所描述的译码技术还可适用于其它类型的数据译码。然而,在本专利技术中,将描述视频译码以实现说明的目的。关于先前所使用的BAC方法(包含在H.264/AVC(高级视频译码)中使用的BAC方法和用于新近新兴的高效率视频译码(HEVC本文档来自技高网
...
使用二进制算术译码过程熵译码视频数据的方法及其设备

【技术保护点】
一种在视频译码过程中使用二进制算术译码过程熵译码视频数据的方法,所述方法包括:在二进制算术译码过程中确定符号的概率状态,其中所述概率状态包括多个概率状态中的一者;以及将指示所述所确定概率状态的索引映射到多个分组索引中的一者,其中所述分组索引中的至少一者表示所述多个概率状态中的至少两者,且其中所述分组索引中的每一者识别表格中的概率符号的一范围。

【技术特征摘要】
【国外来华专利技术】2011.10.27 US 61/552,426;2012.10.25 US 13/660,5401.一种在视频译码过程中使用二进制算术译码过程熵译码视频数据的方法,所述方法包括:在所述二进制算术译码过程中确定和高清晰度(HD)视频内容有关的符号的概率状态,其中所述概率状态确定自用于所述HD视频内容的多个概率状态,其中所述多个概率状态的数目大于六十四,且其中六十四个概率状态表示用于视频内容的概率状态的数目,所述视频内容具有比和所述HD视频内容相关的分辨率低的分辨率;以及将指示所确定概率状态的索引映射到多个六十四个分组索引中的一个,其中所述六十四个分组索引中的至少一个分组索引表示所述多个概率状态中的至少两个,且其中所述六十四个分组索引中的每一个在表格中识别概率状态的范围。2.根据权利要求1所述的方法,其中所述多个概率状态的所述数目为128。3.根据权利要求1所述的方法,其进一步包括基于所述分组索引和所述概率状态而译码所述符号。4.根据权利要求3所述的方法,其中译码所述符号包括基于所述分组索引根据表格译码所述符号。5.根据权利要求3所述的方法,其中译码所述符号包括根据对所述索引执行以产生所述分组索引的数学运算译码所述符号。6.根据权利要求1所述的方法,其中映射包括根据表格将所述索引映射到分组索引。7.根据权利要求1所述的方法,其中映射包括根据数学运算将所述索引映射到所述分组索引。8.根据权利要求7所述的方法,其中映射包括根据除以二运算将所述索引映射到所述分组索引。9.根据权利要求1所述的方法,其中映射包括根据线性映射将所述索引映射到所述分组索引。10.根据权利要求1所述的方法,其中映射包括根据对数映射将所述索引映射到所述分组索引。11.根据权利要求1所述的方法,其中映射包括根据逐段非线性映射将所述索引映射到所述分组索引。12.根据权利要求1所述的方法,其中所述多个概率状态包含最高概率状态p0,且其中连续概率状态是通过将前一概率状态乘以参数α来确定,其中α大于0.9493,且其中p0小于0.5。13.根据权利要求12所述的方法,其中α为0.9689且其中p0为0.493。14.根据权利要求3所述的方法,其中所述视频译码过程为视频编码过程,所述方法进一步包括:编码视频数据以产生残余数据;变换残余数据以产生变换系数;以及将变换系数二进制化以产生所述符号。15.根据权利要求3所述的方法,其中所述视频译码过程为视频解码过程,其中基于所述分组索引和所述概率状态而译码所述符号产生经解码分格,所述方法进一步包括:接收所述符号;将所述经解码分格反二进制化以产生变换系数;将所述变换系数反变换以产生残余数据;以及解码所述残余数据以产生经解码视频数据。16.一种经配置以在视频译码过程中使用二进制算术译码过程执行视频数据的熵译码的设备,所述设备包括:存储器,其经配置以:至少存储所述视频数据的部分;以及一个或多个视频译码处理器,其经配置以:在所述二进制算术译码过程中确定和高清晰度(HD)视频内容有关的符号的概率状态,其中所述概率状态确定自用于所述HD视频内容的多个概率状态,其中所述多个概率状态的数目大于六十四,且其中六十四个概率状态表示用于视频内容的概率状态的数目,所述视频内容具有比和所述HD视频内容相关的分辨率低的分辨率;以及将指示所确定概率状态的索引映射到多个六十四个分组索引中的一个,其中所述六十四个分组索引中的至少一个分组索引表示所述多个概率状态中的至少两个,且其中所述六十四个分组索引中的每一个在表格中识别概率状态的范围。17.根据权利要求16所述的设备,其中所述多个概率状态的所述数...

【专利技术属性】
技术研发人员:霍埃尔·索赖·罗哈斯马尔塔·卡切维奇
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1