用于视频编码的预测图像生成方法技术

技术编号:2949298 阅读:144 留言:0更新日期:2012-04-11 18:40
一种用于视频编码的预测图像生成方法,其特征在于:采用非线性叠加方法,并利用当前被编码帧的参考帧对预测图像进行运动估计和边缘拼接,具体至少包括如下的步骤:    步骤1:在进行图像拼接之前,先获取当前被编码帧的前向参考帧和后向参考帧;    步骤2:在前向参考帧与后向参考帧的原始图像上进行全局运动估计;    步骤3:拼接参考帧的边缘;    步骤4:进行模式决策。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种,特别是指一种采用非线性叠加方法,并利用当前被编码帧的参考帧对预测图像进行运动估计和边缘拼接的方法,属于计算机视频编码技术。
技术介绍
数字电视、新一代移动通信、宽带网络通信、家庭消费电子这些蓬勃发展的高技术产业群,其共性技术集中在以视音频为主要内容的多媒体信息处理技术,特别是数据压缩技术上。高效的视频编解码技术是实现高质量、低成本多媒体数据存储与传输的关键。目前常用的编码方法有预测编码、正交变换编码、向量量化编码等等,这些方法都基于信号处理理论,通常也称为第一代编码技术。现在比较流行的图像编码国际标准都基于这种编码理论,采用的是基于块匹配的运动补偿、离散余弦变换和量化相结合的编码方法。典型的有国际标准化组织/国际电工技术委员会第一联合技术组(ISO/IECJTC1)推出的MPEG-1,MPEG-2和MPEG-4等国际标准,以及国际电信联盟(ITU-T)提出的H.26x系列推荐。这些视频编码标准在工业界得到了广泛应用。上述的这些视频编码标准都采用了混合视频编码(Hybrid VideoCoding)策略;通常包括预测、变换、量化和信息熵编码等四个主要模块。预测模块的主要功能是利用已经编码并重建的图像对当前要编码的图像进行预测(帧间预测),或者利用图像中已经编码并重建的图像块(或宏块)对当前要编码的图像块(或宏块)进行预测(帧内预测)。变换模块的主要功能是将输入的图像块变换到另外一个空间,使输入信号的能量尽可能地集中在低频变换系数上,进而降低图像块内元素之间的相关性,有利于压缩。量化模块的主要功能是将变换的系数映射到一个有利于编码的有限元素集上。信息熵编码模块的主要功能是根据统计规律,将量化后的变换系数用变长码表示。视频解码系统包含有与上述编码系统中四个模块相似的模块,主要是将输入到视频解码系统的码流通过熵解码、反量化、反变换等过程重建解码图像。除了上述模块,视频编解码系统中通常还包含一些辅助的编码工具,这些工具也会对整个系统的编码性能(压缩比)做出贡献。基于运动补偿预测的主要功能是消除视频序列在时间上的冗余。视频编码的大部分编码效率来自于预测模块。视频编码过程就是对视频序列的每一帧图像进行编码的过程。常用的视频编码系统对每一帧图像的编码是以宏块为基本单元进行的。在编码每一帧图像时,又可以分为帧内(I帧)编码、预测(P帧)编码和双向预测(B帧)编码等情况。一般来说,编码时,I帧、P帧和B帧编码是穿插进行的,比如按照IBBPBBP的顺序。B帧的引入可以有效地解决运动物体之间或物体与背景之间由于不同的运动方向或运动速率而引起的“遮挡问题”。B帧的编码可以使得编码压缩效率达到200∶1以上的码率。具体而言,对B帧中的宏块进行编码需要包括直接(Direct)、前向预测(Forward Prediction)、后向预测(BackwardPrediction)和双向预测(Bi-directional Prediction)四种模式。由于B帧技术需要同时进行前向与后向的运动估计,因此需要较高的运算复杂度,同时为了区分前后向运动矢量,还要引入额外的标识信息。基于全局运动补偿(Global Motion Compensation,简称GMC)的预测技术是一种新型的视频编码技术,它的主要优点是可以有效地补偿视频中由于摄像机运动而形成全局运动。该方法对全局运动矢量和全局运动补偿残差分别进行编码。和传统的运动估计算法相比,GMC在有较大背景运动的情况下可以大大降低运动矢量的编码,从而能够获得更低的码率。当然,正因为要进行全局运动估计,因此也需要比较大的计算量。传统的B帧编码虽然可以有效地解决运动物体之间或物体与背景之间由于不同的运动方向或运动速率而引起的“遮挡问题”,但是,在双向预测时需要分别编码前向和后向运动矢量,而且在单向预测时需要编码所用的参考帧的标识。这样则导致编码的运算具有较高的复杂度,同时编码的压缩率也相对较高。
技术实现思路
本专利技术的主要目的在于提供一种预测图像的非线性叠加方法,通过引入一种新的帧间预测方式,使其具有传统B帧编码的优点,同时减少编码运动矢量和参考帧标识的比特数,进而提高编码效率。本专利技术的目的是这样实现的一种用于视频编码的预测图像生成的方法,即采用非线性叠加方法,并利用当前被编码帧的参考帧对预测图像进行运动估计和边缘拼接;具体的预测图像生成的步骤如下步骤1在进行图像拼接之前,先获取当前被编码帧的前向参考帧和后向参考帧;步骤2在前向参考帧与后向参考帧的原始图像上进行全局运动估计;步骤3拼接参考帧的边缘;步骤4进行模式决策。本专利技术对于全局运动估计,具体是在设定全局运动矢量初值后,再进一步进行迭代计算,最后获得全局运动矢量的处理过程,具体参照如下的步骤步骤21设置全局运动矢量之中任意三个的初值;步骤22在一设定范围内,按照一设定的步长对该范围内的每一个不同的运动矢量进行搜索,并计算每一宏块的绝对误差总和(SAD);步骤23计算整个图像的平均误差总和(TSAD);获得步骤21中未设置的初值全局运动矢量;步骤24将新计算的全局运动矢量替代到尚未计算的任一全局运动矢量,再次执行步骤22,直到所有的全局运动矢量全部求出。上述的全局运动矢量满足如下的公式所确定的数值关系v‾(x,y)=r‾0+(xH-n)r‾x+(yV-n)r‾y+(xH-n)(yV-n)r‾xy]]>其中,v(x,y)为左上角位置为(x,y)的图像块的运动矢量,x,y分别是该位置的横、纵坐标值;r0,rx,ry和rxy为全局运动矢量的四个向量,并且,r0=v00;ry=v0V-v00;rx=vH0-v00;rxy=v00-vH0-v0V+vHV;其中,v00,vH0,v0V和vHV分别为宽为V,高为H的图像某一帧位于四角的四个nxn(n为不小于1的整数,优选取值为4)图像块的运动矢量(0,0),(H-n,0),(0,V-n)和(H-n,V-n)。需要说明的是上述计算的顺序可以改变,而且计算中,各个全局运动矢量的计算顺序同样可以改变,而所述的迭代的方法是相同的。为了更加真实地反映背景的运动情况;因此,在上述的计算中应当对SAD远远大于TSAD的宏块,根据规定的某一阈值进行舍弃;上述的拼接是根据获得的全局运动矢量,由上述的公式计算得到后向参考帧中每一个nxn块的运动矢量,并进一步计算得到后向参考帧相对于前向参考帧的整个图像偏移;该后向参考帧在前向参考帧的投影是一不规则的四边形;根据这个不规则四边形的边与前向参考帧的各边求出交点,然后通过交点求得相对于前向参考帧需要拼接的部分,将需要拼接的部分重新映射到后向帧中,得到要拼接的图像;最后,根据所述的要拼接的图像,把相应部分的图像截取后在前参考帧的相应边缘上进行拼接,从而使参考帧得到新的预测帧。对于模式选择,具体的处理过程是首先,利用全局运动矢量为每一宏块形成一新的运动矢量以及匹配误差;然后,利用所述运动矢量形成一种基于块的新的模式;最后,将该新的模式与其他通过传统块运动估计得到的宏块模式一起进行块模式选择。根据上述的技术方案,本专利技术具有如下的优点1、通过本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:高文季向阳吕岩
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利