无漂移的视频编码和解码方法以及相应的设备技术

技术编号:3606495 阅读:164 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及用于压缩视频序列的视频编码方法,包括步骤:通过小波分解的方式从原始视频序列生成低分辨率序列,通过运动补偿空时分析的方式对所述低分辨率序列执行低分辨率分解,通过将由小波分解产生的高频空间子带锚定到所述低分辨率分解的方式从所述低分辨率分解生成全分辨率序列,并且编码所述全分辨率序列和在运动补偿空时分析期间所产生的运动矢量。本发明专利技术还涉及对应的解码方法,以及对应的编码和解码设备。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及用于压缩被分成连续帧群(GOF)的原始视频序列的编码方法,并涉及对应的解码方法。其还涉及对应的编码和解码设备。
技术介绍
互联网的发展和多媒体技术的进步使新的应用和服务成为可能。它们中的许多不仅要求编码效率,还要求增强的功能性和灵活性以适应变化的网络条件和终端性能。可扩展性满足了这些需求。当前视频压缩标准经常根据预测方案而使用所谓的混合解决方案,在该预测方案中,在时间上从参考帧预测出每个帧(该预测选项是用于帧内或I帧的0值预测,用于P帧的前向预测,或用于B帧的双向预测),并且获得的预测误差在空间上进行转换,以获得空间冗余的优点。于是从MPEG-2到MPEG-4,已经提出了基于标准的可缩放的解决方案。它们依靠一个基础层(base layer)以及一个或若干个增强层的生成,该基础层包括原始视频序列的最低的空间、时间和/或SNR分辨率版本,而该增强层允许(如果被发送或被解码)在空间上、时间上和/或SNR上的精细化的重构。但是,这些基于层的可缩放性方案的缺点在于它们缺乏编码效率。已经提出了使用诸如三维(3D)子带编码的技术的不同解决途径,这些技术能生成嵌入的比特流。由于它们的多分辨率分析结构,所以这些方案本身就具有可缩放性,并且不削弱它们固有的编码效率。在3D子带编解码器中,如在例子“A fully scalable 3D subbandvideo codec(完全可缩放的3D子带视频编解码器)”,“Proceedingsof International Conference on Image Processing(ICIP2001),VOL.2,2001,第1017-1020页”中描述的,该嵌入的比特流是完全可缩放的,并且能通过简单地在已知位置截断,便在任何空间和时间分辨率上被解码,且具有任何期望的SNR质量。在这样一个方案中,连续帧群(GOF)按3D结构处理并在空时上滤波,以压紧低频中的能量,还提供了运动补偿以改进整体的编码效率。该3D子带结构在附图说明图1中描述所显示的带有运动补偿的3D小波分解被应用到一个帧群(GOF),并且这个当前的GOF被首先进行运动补偿(MC),以便处理具有大的运动的序列,接着利用哈尔(Haar)小波在时间上滤波(TF)(虚线箭头对应高通时间滤波,而其它的箭头对应低通时间滤波)。在运动补偿操作和时间滤波操作后,每个时间子带在空间上被分解为空时子带,该空时子带最终导致一种原始GOF的3D小波表示,分解的三个阶段在图1的例子中示出(L和H=第一阶段;LL和LH=第二阶段;LLL和LLH=第三阶段)。选择从2D扩展到3D的周知的SPIHT算法,以便高效编码与空时分解结构相关的最终系数比特平面(bit-plane)。如现在所实现的,3D子带编解码器在编码器一方将运动补偿(MC)的空时分析应用于完全的原始分辨率。空间可缩放性通过除去该分解的最高空间子带实现。但是,当运动补偿用在3D分析方案中时,这个方法不允许在较低的分辨率下(甚至是在很高的比特率下)完美地重构该视频序列这一在后续的描述中被称作为漂移(drift)的现象与按标定的最终显示大小的直接编码相比较,降低了可缩放解决方案的视觉质量。如在文档“Multiscale videocompression using wavelet transform and motion compensation(利用小波变换和运动补偿的多比例视频压缩)”P.Y.Cheng等,Proceedings of the International Conference on ImageProcessing(ICIP95),VOL.2,1995,第606-609页中解释的,这个漂移起因于小波变换和运动补偿的不可互换的顺序。实际上,当帧(A)在低分辨率(a)下合成时,应用下面的运算a=DWTL(L)+MC=DWTL(A)+-DWTL(MC)](1)其中DWTL表示使用与在3D分析中相同的小波滤波器的分辨率下降抽样(downsample)。在完美的可缩放解决方案中,想要有a=DWTL(A) (2)因此表达式(1)的剩余部分就对应于该漂移。可以注意到,如果没有应用MC,该漂移就被去除了。如果一个独特的运动向量被应用到该帧上,就会发生相同的现象(除了在图象边界上)。然而,应该知道MC不可避免地会达到很好的编码效率,而一个独特的全局运动的概率小到足以在后续段落中排除这种特殊的情况。一些作者,比如J.W.Woods等人在文档“A resolution andframe-rate scalable subband/wavelet video coder(分辨率和帧率可缩放的子带/小波视频编码器)”,IEEE Transactions onCircuits and Systems for Video Technology,vol.1,n°9,2001年9月,第1035-1044页中,通过不同的手段除去这个漂移,以达到好的空间可缩放性。但是,在所述的文档中,所描述的方案除了异常复杂外、还暗示了在比特流中发送额外的信息(需要漂移校正以正确地合成较高的分辨率),这样就浪费了几个比特(在文档“Multiscale video compression…”中描述的解决方案避免了这个瓶颈,但该解决方案作用于预测方案上并且不可换位到3D子带编解码器)。专利技术概述因此,本专利技术的一个目的就是提出一个避免这些缺陷的解决方案。为此目的,本专利技术涉及用于压缩被分成连续帧群(GOF)的原始视频序列的视频编码方法,该方法包括步骤(1)通过小波分解的方式从原始视频序列生成低分辨率序列,该低分辨率序列包括连续的低分辨率GOF;(2)通过每个低分辨率GOF的运动补偿空时分析的方式对所述低分辨率序列执行低分辨率分解;(3)通过将由小波分解产生的高频空间子带锚定(anchor)到所述低分辨率分解的方式从所述低分辨率分解生成一个全分辨率序列;(4)编码所述全分辨率序列和在运动补偿的空时分析期间生成的运动矢量,用于生成一个输出的编码的比特流。所提出的解决方案在以下意义上是值得注意的,即3DS分析中的分解树的全局结构被保持,并且不发送额外信息以校正该漂移效应(只有分解/重构机制被改变)。如果没有以全分辨率来执行运动估计/补偿,那么它在复杂性方面是一个低成本的解决方案。如果在高空间子带中引入运动补偿,则提供一个更好的编码效率。本专利技术还涉及对应的解码方法,包括步骤(1)解码所述输入的编码的比特流,以便生成解码的全分辨率序列以及相关的解码的运动矢量;(2)在所述编码的全分辨率序列中,分离所述解码的高频空间子带以及解码的低分辨率分解;(3)通过运动补偿的空时合成的方式,从所述编码的低分辨率分解生成解码的低分辨率序列;(4)从所述解码的低分辨率序列和解码的高频空间子带重构对应于原始视频序列的输出的全分辨率序列。本专利技术还涉及被提供用于分别实现所述编码方法和所述解码方法的编码设备和解码设备。附图简述现在将参考附图,以更详细的方式来描述本专利技术,其中图1显示3D子带分解;图2表示在最低分辨率上的运动补偿空间分析;图3描述根据本专利技术的编码方案的实施例;图4描述对应于图3的编码方案的解码方案的实施例;图5表示高空间子带的本文档来自技高网...

【技术保护点】
一种视频编码方法,用于被分成连续帧群(GOF)的原始视频序列的压缩,所述方法包括步骤:(1)通过小波分解的方式从原始视频序列生成低分辨率序列,该低分辨率序列包括连续低分辨率GOF;(2)通过每个低分辨率GOF的运动补偿空时分 析的方式对所述低分辨率序列执行低分辨率分解;(3)通过将由小波分解产生的高频空间子带锚定到所述低分辨率分解的方式从所述低分辨率分解生成全分辨率序列;(4)编码所述全分辨率序列和在运动补偿的空时分析期间生成的运动矢量,以便生成 输出的编码的比特流。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:A布尔格E巴尔劳
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1