视频编码中的残差变换及逆向变换系统和方法技术方案

技术编号:18792873 阅读:52 留言:0更新日期:2018-08-29 10:41
变换块处理程序,其中未编码视频帧的最大代码块尺寸和最大代码块尺寸被确定。未编码视频帧被划分成包括第一代码块的多个代码块,并且第一代码块被划分成至少一个预测块和多个变换块。变换块的尺寸至少部分地取决于代码块和相应的预测块的尺寸。然后对变换块进行编码,从而生成经编码比特流的视频数据负载。生成包括最大代码块尺寸标志和最大变换块尺寸标志的、经编码比特流的帧头部。

Residual transform and reverse conversion system and method in video coding

A transform block processing program in which the maximum code block size and the maximum code block size of an uncoded video frame are determined. An uncoded video frame is divided into a plurality of code blocks including a first code block, and the first code block is divided into at least one prediction block and a plurality of transform blocks. The size of the transform block depends, at least in part, on the size of the code block and the corresponding prediction block. The transform block is then encoded to generate the video data load encoded by the bitstream. Generates a encoded bit stream frame header including a maximum code block size flag and a maximum transform block size flag.

【技术实现步骤摘要】
【国外来华专利技术】视频编码中的残差变换及逆向变换系统和方法相关申请的交叉引用本申请是先前提交的第PCT/CN2015/075599号PCT申请的部分延续,该申请于2015年3月31日提交,并且专利技术名称为“视频编码中的残差变换及逆向变换系统和方法(ResidualTransformationandInverseTransformationinVideoCodingSystemsandMethods)”(代理人文件号:REAL-2015697),该申请的整体公开出于所有目的通过引用并入本文。
技术介绍
诸如数字图像、语音/音频、图形和视频的数字多媒体的出现已显著改善了各种应用,并开启了全新的应用,因为其对容易地实现了对内容的可靠的存储、通信、传输和搜索和访问。总的来说,数字多媒体的应用已经很多,其包括娱乐、信息、医药和安全等的广泛领域,并且以多种方式使社会受益。由诸如摄像机和麦克风的传感器捕获的多媒体通常是模拟的,并且以脉冲编码调制(PCM)形式的数字化过程将其呈现为数字化的。然而,就在数字化之后,所产生的数据量可为非常显著的,因为这对重建扬声器和/或电视显示器所需的模拟表示所必需的。因此,大量数字多媒体内容的有效通信、存储或传输需要从原始PCM形式压缩成经压缩的表示。因此,用于多媒体压缩的许多技术已被专利技术。多年来,视频压缩技术的发展非常复杂,以至于它们通常可实现10至100之间的高压缩比,同时保持了高心里视觉品质,这通常与未经压缩的数字视频相似。尽管迄今为止在视频压缩的
和科学方面(如由诸如MPEG-1、MPEG-2、H.263、MPEG-4第2部分、MPEG-4AVC/H.264、MPEG-4SVC和MVC以及诸如Windows媒体视频、RealVideo、On2VP等行业驱动的专有标准)已取得了巨大进步,但消费者对更高品质、更高清晰度、以及现在的3D(立体声)视频的需求日益增加,随时随地的访问都需要经由各种方式(如DVD/BD、无线广播、有线/卫星、有线和移动网络)输送到一系列客户端设备(诸如PC/笔记本电脑、电视机、机顶盒、游戏机、便携式媒体播放器/设备、智能手机和可穿戴计算设备),而这激发了对更高级的视频压缩的需求。在标准体驱动标准中,ISOMPEG在高效视频编码(HEVC)方面最近开展的工作就证明了这一点,而其有望将新技术贡献与来自由ITU-T标准委员会在H.265视频压缩方面的多年探索性工作的技术结合起来。所有上述的标准采用通用帧间预测编码框架,其涉及通过补偿视频帧之间的运动来减少时间冗余。基本概念是通过使用块匹配方法去除相邻图片之间的时间依赖性。在编码处理开始时,未编码视频序列的每个帧被分为三类:I型帧、P型帧和B型帧。I型帧是帧内编码的。也就是说,只有来自帧本身的信息被用于对图片进行编码,并且没有帧间运动补偿技术被使用(尽管帧内运动补偿技术可被应用)。另外两种类型的帧(P型和B型)是使用帧间运动补偿技术和帧内预测技术这两者进行编码的。P图片与B图片之间的差异是用于运动补偿的基准图片的时间方向。P型图片(以显示顺序)利用来自先前图片的信息,而B型图片可以显示顺序利用来自先前图片和未来图片这两者的信息。对于P型帧和B型帧而言,每个帧然后被划分成由每个像素的亮度和色度分量的系数表示的像素块;如果块并不是帧内编码的,则针对每个块获得一个或多个运动矢量(因为B型图片可利用来自未来经编码的帧和过去经编码的帧这两者的信息,所以针对每个块,两个运动矢量可被编码)。运动矢量(MV)表示从当前块的位置到另一先前经编码的帧(其可为显示顺序中的过去或未来帧)中的相似块的位置的空间位移,而它们分别被称为基准块和基准帧。基准块与当前块之间的差值(如果有的话)被确定,并且残差(也称为“残差信号”)被获得。因此,对于帧间编码的帧的每个块,只需要对残差和运动矢量进行编码,而不是块的全部内容。通过消除视频序列的帧之间的这种时间冗余,可压缩视频序列。为了进一步压缩视频数据,在帧间或帧内预测技术已被应用之后,残差信号的系数通常从空间域变换到频域(例如,使用离散余弦变换(“DCT”)或离散正弦变换(“DST”))。对于自然出现的图像(如通常构成人类可感知视频序列的图像类型)而言,低频能量总是比高频能量强。频域中的残差信号因此比空间域中的残差信号得到更好的能量压缩。在正向变换之后,系数和运动矢量可在被分组化或以其它方式处理之前被量化和熵编码,例如,以用于通过如因特网的网络传输。熵编码是一种无损数据压缩方案,而其与介质的具体特性无关。熵编码的主要类型中的一种创建唯一无前缀代码,并将创建的唯一无前缀代码分配给在编码器的输入处出现的每个唯一符号。这些熵编码器然后通过用对应的长度可变的无前缀输出代码字替换每个固定长度的输入符号来对数据进行压缩。每个代码字的长度近似地与概率的负对数成正比。因此,最常用的符号使用最短的代码。霍夫曼编码是通常用于无损数据压缩的特定类型的最佳前缀代码。来自霍夫曼算法的输出可被看作是用于对源符号进行编码的长度可变的代码表。霍夫曼算法根据源符号的每个可能值发生的估计概率或频率(权重)来推导出该表。在解码器侧,逆量化和逆向变换被应用以恢复空间残差信号。这些是许多视频压缩标准中的典型变换/量化处理。反向预测处理然后可被执行以生成原始的未编码视频序列的重建版本。在过去的标准中,编码中使用的块一般为16×16像素(在许多视频编码标准中称为宏块)。然而,自这些标准的发展以来,帧尺寸已变得越来越大,并且许多设备已获得高于“高清晰度”(或“HD”)帧尺寸(如2048×1530像素)的显示能力。因此,可能期望具有较大的块来有效地对这些帧尺寸(例如,64×64像素)的运动矢量进行编码。由此可见,还期望增加从空间域变换到频域的残差信号的块的尺寸。
技术实现思路
本专利技术的一个方面为一种对未编码视频帧进行编码以生成代表所述未编码视频帧的经编码比特流的视频编码器设备实现的方法,其中,所述经编码比特流至少包括代码块头部和视频数据负载,所述视频编码器设备实现的方法包括以下步骤:获得表示所述未编码视频帧的一部分的图像数据的代码块,其中,所述代码块包括多个系数块,所述多个系数块中的每个系数块包含多个系数;获得与所述多个系数块对应的系数块模式代码字;生成所述经编码比特流的所述代码块头部,其中,所述代码块头部包括所述系数块模式代码字;以及生成所述经编码比特流的所述视频数据负载,其中,如果所述多个系数块中的第一系数块的第一系数具有非零值,则所述视频数据负载包括与所述第一系数块对应的描述符代码字和与所述第一系数块对应的级别代码字。本专利技术的另一个方面为一种对未编码视频帧进行编码以生成代表所述未编码视频帧的经编码比特流的视频编码器设备实现的方法,其中,所述经编码比特流至少包括代码块头部和视频数据负载,所述视频编码器设备实现的方法包括以下步骤:获得表示所述未编码视频帧的一部分的图像数据的代码块,其中,所述代码块包括多个系数块集合,每个系数块集合包括多个系数块,所述多个系数块中的每个包含多个系数;获得多个代码块模式代码字,其中,所述多个代码块模式代码字中的每个与所述多个系数块集中的一个对应;生成所述经编码比特流的所述代码块头部,其中,所述代码块头部包括所述多个代码块模式代码本文档来自技高网
...

【技术保护点】
1.一种视频编码器设备实现的方法,所述视频编码器设备实现的方法对未编码视频帧进行编码以生成代表所述未编码视频帧的经编码比特流,其中,所述经编码比特流至少包括代码块头部和视频数据负载,所述视频编码器设备实现的方法包括以下步骤:获得表示所述未编码视频帧的一部分的图像数据的代码块,其中,所述代码块包括多个系数块,所述多个系数块中的每个系数块包含多个系数;获得与所述多个系数块对应的系数块模式代码字;生成所述经编码比特流的所述代码块头部,其中,所述代码块头部包括所述系数块模式代码字;以及生成所述经编码比特流的所述视频数据负载,其中,如果所述多个系数块中的第一系数块的第一系数具有非零值,则所述视频数据负载包括与所述第一系数块对应的描述符代码字和与所述第一系数块对应的级别代码字。

【技术特征摘要】
【国外来华专利技术】1.一种视频编码器设备实现的方法,所述视频编码器设备实现的方法对未编码视频帧进行编码以生成代表所述未编码视频帧的经编码比特流,其中,所述经编码比特流至少包括代码块头部和视频数据负载,所述视频编码器设备实现的方法包括以下步骤:获得表示所述未编码视频帧的一部分的图像数据的代码块,其中,所述代码块包括多个系数块,所述多个系数块中的每个系数块包含多个系数;获得与所述多个系数块对应的系数块模式代码字;生成所述经编码比特流的所述代码块头部,其中,所述代码块头部包括所述系数块模式代码字;以及生成所述经编码比特流的所述视频数据负载,其中,如果所述多个系数块中的第一系数块的第一系数具有非零值,则所述视频数据负载包括与所述第一系数块对应的描述符代码字和与所述第一系数块对应的级别代码字。2.如权利要求1所述的视频编码器设备实现的方法,其中,获得与所述多个系数块对应的所述系数块模式代码字的步骤包括以下步骤:将所述多个系数块中的每个系数块与相应的多个系数块标志相关联;为所述多个系数块标志中的每个系数块模式标志分配值;将所述多个系数块模式标志分组成联合符号;以及将所述联合符号用作代码块模式代码字表中的索引,以获得与所述多个系数块对应的所述系数块模式代码字,其中,所述多个系数块中的第一系数块与第一系数块标志相关联,如果所述第一系数块包括至少一个非零系数,则所述第一系数块模式标志被分配第一值,以及如果所述第一系数块只包括零系数,则所述系数块模式标志被分配第二值。3.一种视频编码器设备实现的方法,所述视频编码器设备实现...

【专利技术属性】
技术研发人员:蔡家扬丁文鹏
申请(专利权)人:真实网络公司蔡家扬
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1