利用在块的行和列上操作的并具有一组变换跳过模式的空间变换来对视频进行的编码或解码,该组变换跳过模式包括:在行和列上进行变换;仅在行上进行变换;仅在列上进行变换;不进行变换。所选择的模式的指示被提供给解码器。系数通过因子进行缩放,该因子取决于被跳过变换的变换矢量的范数,以使得未经变换的图像值与经变换的系数具有相同的水平。
【技术实现步骤摘要】
【国外来华专利技术】使用变换的视频编码和解码
本专利技术涉及视频压缩和解压缩系统,特别涉及一种框架,其自适应地使用变换函数及相关工具对预测和熵编码之间的信号表示进行自适应地建模,包括缩放、量化、扫描和信令。
技术介绍
在类似于例如电视广播、互联网视频流服务和视频会议的若干应用中,采用视频序列的传输和存储。原始格式中的视频序列需要非常大量的数据来表示,由于序列的每一秒可以包括数十个单独帧,并且通常每个帧由每像素至少8位来表示,每个帧需要几百或几千个像素。为了尽量减小传输和存储成本,视频压缩被用在原始视频数据上。其目的是以尽可能小的容量来表示原始信息,即,以尽可能少的位来表示。表示视频序列的所需容量的减少将会影响压缩序列的视频质量,即其与原始的未压缩视频序列的相似度。现有的视频编码器,诸如AVC/H.264,在实现用于压缩视频序列的视频质量的所需水平的同时,利用以下预测、变换、量化和熵编码这四个主要的处理过程来实现最大水平的视频压缩。预测过程利用在视频序列中发现的时间和空间冗余来大大减少表示数据所需的容量。用于预测数据的机制对于编码器和解码器两者都是已知的,因此只有误差信号或残差必须被发送到解码器以重构原始信号。该过程通常在数据块(例如8×8像素)而不是整个帧中进行。预测通常针对于已重构的帧或属于同一帧的重构像素的块进行。变换过程的目的在于利用存在于残差信号中的相关性。它通过将信号的能量集中到几个系数来实现上述目的。因此,变换系数通常比残差的像素需要更少的位来表示。基于离散余弦变换(DCT),H.264使用4×4和8×8整数类型变换。表示变换过程的输出中的数据所需的容量对于许多应用可能还是太高。此外,修改变换过程以便达到所需的用于压缩信号的容量水平是不可能的。量化过程通过允许进一步降低表示该信号所需的容量考虑到了这一点。应当注意的是,这个过程是破坏性的,即该重构的序列看起来会不同于原始序列。熵编码过程需要所有的非-零量化变换系数并对它们进行处理以便有效地表示为位流。这需要以特定顺序读取或扫描变换系数,以尽量减小表示压缩视频序列所需的容量。上述描述适用于视频编码器;视频解码器将以大致相反的顺序进行所有上述过程。特别地,在解码器侧的变换过程将需要使用在编码器上使用的变换的反转。类似地,熵编码变成熵解码,量化过程变成逆缩放。预测过程通常以完全相同的方式在编码器和解码器两者上进行。这里给出了变换过程的更全面的回顾。残差的统计特性影响了变换(即,DCT)在少量系数中压缩输入信号的能量的能力。根据预测的质量和该预测是否利用了空间或时间冗余,残差显示了完全不同的统计特性。其它影响预测质量的因素是所使用的块的大小以及被处理的序列的空间/时间特征。众所周知,DCT对于高度相关的Markov-I信号达到了最大的能量集中(energycompaction)性能。随着信号相关性的变弱,DCT的能量集中性能开始下降。例如,可以显示,对于输入信号,离散正弦变换(DST)是怎样利用较低的相邻的相关特征而优于DCT的。在图像和视频编码中的DCT和DST通常在块上使用,即2D信号;这意味着,一维变换首先在一个方向上(例如,水平)进行,随后是在另一方向上进行的一维变换。如上文所述,变换的能量集中能力取决于输入信号的统计。在一些情况下,对于二维信号沿着两个垂直轴线和水平轴线输入变换以显示不同的统计是可能的并且实际上是常见的。在这种情况下,在每个轴上选择最佳执行变换是可行的。类似的方法已经在新的正在发展的ISO和ITU视频编码标准以及高效率视频编码(HEVC)内进行了尝试。特别地,如类似于DCT[2]和DST[3]的两个一维可分离的变换的组合已经在正在发展的HEVC标准中使用。虽然基于DCT的先前的编码标准使用了二维变换(2DDCT),但较新的解决方案将DCT和DST的组合应用到帧内预测块上,即,在空间预测的块上。已经表明,当方向预测是从更接近水平的方向然后是垂直的方向时,对于行变换,DST比DCT是更好的选择,并且类似地,当方向预测是从更接近垂直的方向开始时,对于列变换,DST比DCT是更好的选择。在其余方向上(例如,在行中,当DST应用到列上时)使用DCT。为了实现目的,在视频编码中,通常使用DCT和DST的整数近似值,其在本文以下部分中将被简称为DCT和DST。用于整数类似DCT变换的其中一个解决方案使用了16位中间数据表示,并被称为部分蝶形。其主要的特性与DCT的(抗)对称特性相同,几乎正交的基矢量、在每个变换级之前和之后的16位数据表示、用于所有内部乘法的16位乘法器、以及在(去)量化期间不需要对基向量的不同范数进行校正。
技术实现思路
本专利技术涉及编码的变换部分。在一个方面,本专利技术包括对视频进行编码的方法,其利用在图像值的块的行上操作的并具有行变换矢量的行变换和在图像值的块的列上操作的并具有列变换矢量的列变换,该方法包括以下步骤:建立一组变换模式,包括其中行变换和列变换之一或或两者被跳过的跳过模式;选择所述模式中的一个;对于变换被跳过的任何块,将缩放因子应用于该块的相应图像值上,其中缩放因子取决于被跳过的变换的变换矢量的范数,以使得未经变换的图像值与经变换的系数具有相同水平;以及为解码器提供所选择模式的指示。本专利技术还包括对已经被编码的视频进行解码的方法,所述编码利用在图像值的块的行上操作的并具有行变换矢量的行变换和在图像值的块的列上操作的并具有列变换矢量的列变换,该方法包括以下步骤:接收其中行变换和列变换之一或两者被跳过的变换跳过模式的指示;根据所述模式应用逆变换并将逆缩放应用到任何未经变换的图像值上,缩放因子取决于被跳过的变换的变换矢量的范数。相同的缩放因子可用于缩放的行或列中的所有系数。在另一个方面,本专利技术包括对视频进行编码的方法,其利用在图像值的块的行上操作的并具有行变换矢量的行变换和在图像值的块的列上操作的并具有列变换矢量的列变换,该方法包括以下步骤:建立一组变换模式,包括其中行变换和列变换之一或两者被跳过的跳过模式;选择所述模式中的一个;对于变换被跳过的任何块,根据被跳过的变换调整量化级,以及为解码器提供所选择模式的指示。在这个方面,本专利技术还包括对已经被编码的视频进行解码的方法,所述编码利用在图像值的块的行上操作的并具有行变换矢量的行变换和在图像值的块的列上操作的并具有列变换矢量的列变换,该方法包括以下步骤:接收其中行变换和列变换之一或两者被跳过的变换跳过模式的指示;根据所述模式应用逆变换,并且根据被跳过的变换应用调整的逆量化。优选地,当在列上操作的变换被跳过时,在每列中具有相同值的量化矩阵被应用,当在行上操作的变换被跳过时,在每行中具有相同值的量化矩阵被应用。在又一方面,本专利技术包括利用在块的行和列上操作的空间变换对视频进行编码的方法,该方法包括以下步骤:建立一组变换跳过模式;选择所述模式中的一个;以及为解码器提供所选择的模式的指示;其中,块内的要编码/解码的第一和最后系数的位置被用信号通知给解码器,并且系数的扫描在所述第一和最后系数之间进行。在该方面,本专利技术还包括对已经利用在块的行和列上操作的、具有一组变换跳过模式的空间变换编码的视频进行解码的方法;该方法包括以下步骤:接收变换跳过模式的指示;根据所述模式应用逆变换;接收块内的要解码的第本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】2011.06.27 GB 1110873.51.一种对视频进行编码的方法,所述编码利用在图像值的块的行上操作的并具有行变换矢量的行变换和在所述图像值的块的列上操作的并具有列变换矢量的列变换,该方法包括以下步骤:建立一组变换跳过模式,包括其中所述行变换和所述列变换之一或两者被跳过的变换跳过模式;选择所述一组变换跳过模式中的一个;对于变换被跳过的任何块,将缩放因子应用于该块的相应图像值,其中所述缩放因子取决于被跳过的变换的变换矢量的范数,以使得未经变换的图像值与经变换的系数具有相同水平;以及对于至少一些块或几组块为解码器提供所选择模式的指示。2.根据权利要求1所述的方法,其中相同的缩放因子被用于缩放的行或列中的所有系数。3.一种对已经被编码的视频进行解码的方法,所述编码利用在图像值的块的行上操作的并具有行变换矢量的行变换和在所述图像值的块的列上操作的并具有列变换矢量的列变换,该方法包括以下步骤:对于至少一些块或几组块接收对其中所述行变换和所述列变换之一或两者被跳过的变换跳过模式的指示;根据所述变换跳过模式应用逆变换并使用缩放因子将逆缩放应用到任何未经变换的图像值上,所述缩放因子取决于被跳过的变换的变换矢量的范数。4.根据权利要求3所述的方法,其中相同的缩放因子被用于缩放的行或列中的所有系数。5.一种对视频进行编码的方法,所述编码利用在图像值的块的行上操作的并具有行变换矢量的行变换和在所述图像值的块的列上操作的并具有列变换矢量的列变换,该方法包括以下步骤:建立一组变换跳过模式,包括其中所述行变换和所述列变换之一或两者被跳过的变换跳过模式;选择所述一组变换跳过模式中的一个;对于变换被跳过的任何块,根据被跳过的变换调整量化级,以及对于至少一些块或几组块为解码器提供所选择模式的指示。6.根据权利要求1或2或5所述的方法,其中所述一组变换跳过模式包括:在行和列上进行变换;不进行变换。7.根据权利要求1或2或5所述的方法,其中所述一组变换跳过模式包括:在行和列上进行变换;仅在行上进行变换;仅在列上进行变换;不进行变换。8.一种对已经被编码的视频进行解码的方法,所述编码利用在图像值的块的行上操作的并具有行变换矢量的行变换和...
【专利技术属性】
技术研发人员:玛塔·姆拉克,安德里亚·加布里埃利尼,尼古拉·斯普尔兰,大卫·弗林,
申请(专利权)人:英国广播公司,
类型:
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。