提供一种用于在视频编码中对量化变换系数块进行熵编码时提高效率的系统和方法。在两个单独编码模式(即游程模式到级别模式编码模式)中对量化系数进行编码。提供用于在这两个模式之间进行切换的“规则”,并且通过允许熵编码器基于上下文信息、规则自适应地判定何时在两个编码模式之间进行切换和/或通过用信令显式发送切换位置(例如,它是否应当切换编码模式)来实现各种实施方式。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及数字视频和图像素材的编码和解码。更具体地,本专利技术涉及在视频和图像编码中的变换系数的高效编码和解码。
技术介绍
本部分旨在提供在权利要求书中记载的本专利技术的背景或者环境。这里的描述可以包括能够探求的概念,但是这些概念未必是先前已经设想或者探求的概念。因此除非这里另行指明,在本部分中描述的内容并非是对于在本申请中的说明书和权利要求书的现有技术、也并不因为被包含在本节中而被承认为现有技术。视频编码器将输入视频变换成适合于存储和/或传输的压缩表示。视频解码器将压缩的视频表示解压缩回可查看形式。通常,编码器丢弃原始视频序列中的某些信息以便用更紧凑形式(即,以更低比特率)表示视频。传统的混合视频编码解码器(例如ITU-T H. 263和H. 264)在两个阶段中对视频信息进行编码。在第一阶段中,预测像素的“块”或者某个画面区域中的像素值。例如可以通过运动补偿机制来预测这些像素值,这些机制涉及发现和指示在先前编码的视频帧之一中的与编码的块接近对应的区域。备选地,可以经由空间机制来预测像素值,这些机制涉及使用块周围的像素值以估计块内的像素值。第二阶段涉及对预测误差或者预测残差(即, 预测的像素块与原始像素块之间的差)进行编码。这通常通过使用指定变换(例如,离散余弦变换(DCT)或者其变体)对像素值中的差进行变换、量化变换系数以及对量化系数进行熵编码来实现。通过改变量化过程的保真度,编码器可以控制像素表示的精确度(即,画面质量)与所得的编码视频表示的大小(即,文件大小或者传输比特率)之间的平衡。应当注意,关于视频和/或图像压缩,有可能变换实际图像和/或视频帧的块而不应用预测。熵编码机制(诸如霍夫曼编码、算术编码)利用表示量化变换系数的符号值的统计概率以向概率更高的信号分配更短的码字。另外,为了利用变换系数之间的相关性,可以对成对变换系数进行熵编码。附加地,自适应熵编码机制通常在广泛的图像和视频内容范围内实现高效压缩。变换系数的高效编码是视频和图像编码的编码解码器实现更高压缩性能的重要部分。
技术实现思路
根据一个实施方式,对块的最后非零系数的位置和值进行编码,此后,对下一系数分组(例如,(游程(rim),级别)对)进行编码。如果大于1的幅值(不包括最后系数) 的累积和小于预定的定值,并且块内的最后非零系数的位置小于某个位置阈值,则对下一对进行编码。重复这些过程直到大于1的幅值(不包括最后系数)的累积和不再少于预定的定值和/或块内的最新非零系数的位置不再小于该某个位置阈值。当这发生时,在级别模式中对其余系数进行编码。根据另一实施方式,对块的最后非零系数的位置和值进行编码,此后,对下一系数分组(例如,(游程,级别)对)进行编码。如果当前级别的幅值大于1,则在比特流中表明代码是否应当在游程模式中继续编码或者编码器是否将向级别模式切换。如果表明游程模式,则该过程继续并且对下一对进行编码。否则,在级别模式中对其余系数进行编码。在此描述的各种实施方式通过更精确地限定从一个编码模式向另一编码模式的切换应当发生的位置,来改进用于对变换系数进行编码的先前解决方案。这继而提高编码效率。用信令显式发送切换位置通过向编码器直接通知在何处切换编码模式来进一步提高编码效率。本专利技术的这些和其它优点以及特征连同其组织和操作方式将根据在与附图结合时的以下详细描述而变得明显,其中,相同元件在以下描述的若干幅图中通篇具有相同标号。附图说明通过参照附图来描述各种实施方式中的实施方式,其中图1是传统视频编码器的框图;图2是传统视频解码器的框图;图3图示了示例性变换和系数编码顺序;图4是图示了根据一个实施方式的用于DCT系数的编码而执行的各种过程的流程图;图5是图示了根据另一实施方式的用于DCT系数的编码而执行的各种过程的流程图;图6是用于与本专利技术的各种实施方式一起使用的通用多媒体通信系统的表示;图7是可以与本专利技术的各种实施方式的实现结合使用的电子设备的透视图;以及图8是可以包括在图7的电子设备中的电路系统的示意图。具体实施例方式各种实施方式针对一种用于在视频和/或图像编码中对量化变换系数(例如,DCT 系数)块进行熵编码时提高效率的方法。以游程模式编码和级别模式编码这两个单独编码模式对量化系数进行编码。还提供了用于在这两个模式之间进行切换的“规则”,并且通过允许熵编码器基于上下文信息和规则自适应地判定何时在两个编码模式之间切换和/或通过用信令显式发送切换位置(例如,向熵编码器显式通知它是否应当切换编码模式)来实现各种实施方式。图1是传统视频编码器的框图。更具体地,图1示出了待编码的图像100如何经历像素预测102以及预测误差编码103。对于像素预测102,图像100经历帧间预测106过程、帧内预测108过程或者两者。模式选择110选择帧间预测和帧内预测之一以获得预测块112。然后从原始图像100减去预测块112从而获得也被称为预测残差120的预测误差。 在帧内预测108中,存储在帧存储器114中的相同图像100的先前重建部分被用来预测当前块。在帧间预测106中,存储在帧存储器114中的先前编码的图像被用来预测当前块。在预测误差编码103中,预测误差/残差120最初经历变换操作122。然后在IM量化所得变换系数。在1 对量化的变换系数IM进行熵编码。也就是说,向熵编码1 传递对图像块112的预测误差和预测表示进行描述的数据(例如,运动矢量、模式信息和量化的变换系数)。编码器通常包括逆变换130和逆量化128以在本地获得编码图像的重建版本。首先, 在1 逆量化所量化的系数,然后应用逆变换操作130以获得预测误差的编码版本、然后获得解码版本。然后,将结果与预测112相加以获得图像块的编码和解码版本。重建的图像块继而可以经历滤波操作116以创建向参考帧存储器114发送的最终重建图像140。一旦处理了所有图像块,就可以应用滤波。图2是传统视频解码器的框图。如图2中所示,在熵解码200之后是预测误差解码202和像素预测204两者。在预测误差解码202中使用逆量化206和逆变换208,从而最终获得重建的预测误差信号210。对于像素预测204,在212发生帧内预测或者帧间预测之一,以创建图像块214的预测表示。图像块214的预测表示与重建的预测误差信号210被结合用来创建初步重建图像216,初步重建图像216转而可以被用于在212的帧间预测或者帧内预测。可以在重建每个块之后或者一旦处理了所有图像块就应用滤波218。可以输出滤波图像作为最终重建图像220,或者可以在参考帧存储器222中存储滤波图像从而使其可用于预测212。解码器通过应用与由解码器使用的预测机制类似的预测机制来重建输出视频,以便形成像素块的预测表示(使用由编码器创建并且按压缩表示来存储的运动或者空间信息)。附加地,解码器利用预测误差解码(预测误差编码的逆操作,该操作在空间像素域中恢复量化的预测误差信号)。在应用预测和预测误差解码过程之后,解码器将预测和预测误差信号(即,像素值)求和,以形成输出视频帧。解码器(和编码器)也可以应用附加滤波过程以便在传递输出视频以供显示和/或存储输出视频作为用于视频序列中的即将来临的帧的预测参考之前提高输出视频的质量。在传统视频编码解码器中,与每个运动补偿图像块关本文档来自技高网...
【技术保护点】
1.一种方法,包括:对块的最后非零系数的位置和值进行编码;当至少一个系数的幅值小于或者等于阈值时,根据第一编码模式对所述至少一个系数进行编码;以及确定大于所述阈值的先前编码的非零系数的幅值的累积和;以及其中,当所述累积和小于累积阈值并且所述最后非零系数的所述位置小于位置阈值时:根据所述第一编码模式对后续系数进行编码;否则,根据第二编码模式对后续系数进行编码。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:A·阿拉皮罗,
申请(专利权)人:诺基亚公司,
类型:发明
国别省市:FI
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。