披露了对帧内各对象选择量化器级数使编码率最佳的方法和装置。对各帧内各区域或“对象”选择量化器级数,以实现该帧的目标比特率,同时在整个帧中保持均匀的可视图象质量。(*该技术在2018年保护过期,可自由使用*)
【技术实现步骤摘要】
本申请要求获得1997年7月10日申请的美国临时申请No.60/052134的利益,该申请在此引证作为参考。本专利技术涉及最佳化运动图象编码的装置及其方法。本专利技术特别涉及在帧内对各区域或“对象”适当地调整量化器级数以保持运动图象总体质量同时最佳化编码速率的装置和方法。专利技术的背景ISO/IEC国际标准11172和13818(一般分别称为MPEG-1和MPEG-2格式)建立的运动图象专家组(MPEG)对编码/解码策略建立了标准。尽管这些MPEG标准对产生MPEG允许的比特流规定了一般编码方法和语法,但允许许多变化以适应多种不同的应用,并用于例如台式图象印刷、电视会议、数字存储介质和电视广播。在速率控制领域中,MPEG对控制编码器比特率未限定特殊的方法。编码器设计者的任务是设计速率控制方法,用以控制比特率以便解码器输入缓冲器即不上溢也不下溢。目前,控制比特率的一种方式是变更量化处理,该处理将导致输入视频图象的失真。通过变更量化器级数(步长),可以改变和控制比特率。尽管改变量化器级数是实施编码器速率控制的有效方法,但已经发现,低劣的速率控制处理实际上将降低视频图象的可视质量,即不能按有效的方式变更量化器级数,以致接近图象结束时必须急剧地变更量化器级数,以避免上溢和下溢条件。由于变更量化器级数影响图象质量和压缩效率,所以关键在于速率控制处理,以在不损失图象质量的情况下控制比特率。在目前的MPEG编码策略(例如,各种MPEG测试模式)中,通过假设相同类型的所有图象在图象组内有相同的复杂性来选择各帧的量化器级数。但是,由于各图象的复杂性将随时间变化,所以按这种标准选择的量化器级数不能获得最佳的编码性能。因此,在技术上需要在帧内适当地调整各区域或“对象”的量化器级数,以保持运动图象的总体质量,同时使编码速率最佳。专利技术的概述本专利技术的实施例是在各帧内选择各区域或“对象”的量化器级数以保持视频图象的总体质量同时使编码速率最佳的方法和装置。就是说,在各帧(图象)内对各对象选择量化器级数,以便达到图象的目标比特率,同时在图象的整个序列上维持均匀的可视图象质量。附图的简要描述参照结合附图进行的下列详细说明,可以容易地理解本专利技术的技术,其中附图说明图1表示本专利技术装置的方框图;图2表示根据图象内的对象导出和分配目标比特率的方法流程图;图3表示确定目标帧比特率方法的流程图;图4表示对当前图象内的对象确定一个或多个目标对象比特率的方法流程图;图5表示本专利技术装置第二实施例的方框图;图6是小波树的图解表示;和图7表示本专利技术的编码系统。为了便于理解,在可能的地方使用相同的参考序号来表示附图中所共有的相同元件。详细描述图1表示本专利技术装置100的方框图,用于导出针对各帧内的各“对象”的量化器级数,以保持视频图象的总体质量,同时控制编码速率。尽管本专利技术在参照MPEG允许的编码器情况下进行了如下说明,但本领域技术人员会意识到本专利技术可用于其它编码/解码标准允许使用的其它编码器。在本专利技术的优选实施例中,装置100是编码器或更复杂的基于块的运动补偿编码系统的一部分。装置100包括运动评估模块140、运动补偿模块150、速率控制模块130、DCT模块160、量化(Q)模块170、变长编码(VLC)模块180、缓冲器190、反量化(Q-1)模块175、反DCT(DCT-1)变换模块165、减法器115和加法器155。尽管装置100包括多个模块,但本领域的技术人员会意识到由各个模块完成的功能不需要被隔离成图1所示的分离模块。例如,包括运动补偿模块150、反量化模块175和反DCT模块165的一组模块是众所周知的“嵌入式解码器”。图1表示根据MPEG标准数字化并表示为亮度和两个色差信号(Y、Cr、Ch)的位于信号通路110上的输入视频图象(图象序列)。这些信号还被分成多层(序列、图象组、图象、片、宏块和块),以致用多个宏块表示各图象(帧)。各宏块包括四(4)个亮度块、一个Cr块和一个Cb块,其中,块限定为八(8)乘八(8)的取样阵列。图象划分成块单元提高了区分两个连续图象之间的变化的能力并且通过消除低幅度变换系数(后面说明)改善了图象压缩。数字化的信号可以任意地进行预处理,例如选择适当窗口、清晰度和输入格式的格式转换。以下说明使用MPEG标准术语;但是,应该理解,术语宏块或块用于说明任何尺寸或形状的用作编码基础的象素块。一般来说,“宏块”可以象单个象素那样小,或象整个图象帧那样大。同样,应该理解,术语“对象”用于说明任何尺寸或形状的象素块。一般来说,“对象”可以象单个象素那样小,或象整个图象帧那样大。通路110上的输入视频图象被评估运动矢量的运动评估模块140接收。运动矢量是两维矢量,该矢量用作运动补偿,把来自当前图象中块的坐标位置的偏移设置在基准帧中的坐标上。基准帧可以是前一帧(P-帧),或前一帧和/或后面的帧(B-帧)。由于仅编码和传送当前帧和基准帧之间的改变,所以通过减少信道上传送的信息量,利用运动矢量可极大地增强图象压缩。运动补偿模块150接收来自运动评估模块140的运动矢量,以改善取样值预测效率。运动补偿包括利用运动矢量的预测,以把偏移量提供给过去的基准帧和/或后面的基准帧,其中基准帧包含用于形成预测误差的预先解码的取样值。就是说,运动补偿模块150使用预先解码的帧和运动矢量构成当前帧的评估。此外,本领域的技术人员会意识到由运动评估模块和运动补偿模块完成的功能可以用组合模块例如单块运动补偿器来完成。此外,在对指定的宏块完成运动补偿预测前,必须选择编码模式。在编码模式判定领域中,MPEG提供多个不同的宏块编码模式。MPEG-2特别提供宏块编码模式,该模式包括内部(intra)模式、非运动补偿模式(No MC)、帧/场/双起动运动补偿相互(inter)模式、正向/反向/平均相互(inter)模式和场/帧DCT模式。一旦选择了编码模式,运动补偿模块150根据过去的和/或后面的基准图象在路径152上产生块内容的运动补偿预测(预测图象)。通过减法器115从当前宏块中路径110上的视频图象中减去路径152上的该运动补偿预测,以在路径153上形成误差信号或预先剩余信号。预先剩余信号的形成有效地消除输入视频图象中的多余信息。应该指出,如果当前帧被编码为I-帧,那么路径153上的信号仅是原来的图象,而不是预先剩余信号。然后,DCT模块160把正向离散余弦变换处理施加给预先剩余信号的各块,产生DCT系数的一组八(8)乘八(8)的块。DCT基本功能或子波段(subband)分解允许对于量化的下一步骤来说很重要的视觉心理(psychovi sual)准则的有效使用。由量化DCT系数的量化模块170接收所获得的DCT系数的8×8块。通过把DCT系数除以一组量化值,并适当舍入形成整数值来表示DCT系数,由此量化处理降低了DCT系数的精度。使用基于基本功能可见度(称为视觉加权量化)的准则,对各DCT系数可以单独设定量化值。就是说,量化值对应于给定基本功能可见度的阈值,即由肉眼刚好可检测的系数幅度。通过用该值量化DCT系数,许多DCT系数被转换成“零”值,从而提高图象压缩效率。量化处理是关键操作,并且是获得可视质量和控制编码器使其输出与给定的比特率匹配(速率控制)的重要工具本文档来自技高网...
【技术保护点】
一种分配比特以编码图象序列的各帧的方法,各所述帧至少有一个对象,所述方法包括以下步骤: (a)对该帧确定目标帧比特率;和 (b)在至少一个对象中分配所述目标帧比特率。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:翰久李,蒂浩张,
申请(专利权)人:萨尔诺夫公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。