使用压缩感测的视频编解码制造技术

技术编号:13390104 阅读:99 留言:0更新日期:2016-07-22 13:15
本发明专利技术提供了用于使用压缩感测的视频编码器和解码器的方法和装置。编码方法通过生成图像块的度量矢量,编码度量矢量,以及通过最小化响应于编码度量矢量的图像块的信号稀疏度重构图像块,来编码画面中的图像块,该度量矢量包括与图像块有关的变换系数(900)。相应解码方法通过接收图像块的度量矢量,解码度量矢量,以及通过最小化响应于解码度量矢量的图像块的信号稀疏度重构图像块,来解码画面的图像块,其中该度量矢量包括与图像块有关的变换系数。

【技术实现步骤摘要】
使用压缩感测的视频编解码本申请是申请日为2011年1月14日、申请号为201180006149.5、专利技术名称为“使用压缩感测的视频编解码”的专利技术专利申请的分案申请。相关申请的交叉引用本申请要求于2010年1月15日提交的美国临时申请序列号61/295,258的权益,其通过引用而被整体合并于此。
本原理总地涉及视频编码和解码,并且更具体地涉及用于使用压缩感测的视频编码器和解码器的方法和装置。
技术介绍
压缩感测(compressivesensing)(也称为压缩采样和压缩传感(compressedsensing))是考虑到信号稀疏或可压缩的现有知识获取和重构信号的一种技术。当使用压缩感测的理论时,可以以比奈奎斯特(Nyquist)采样低得多的速率采样信号。压缩感测用在包括数据压缩、磁共振成像(MRI)等的各种应用中。在文献中,将压缩感测合并到视频压缩框架中来改进残差编解码。由于残差往往并不是非常稀疏的,所以改进是有限的。压缩感测(CS)框架的概述假设x是长度为N的信号,如果在如下的某种线性变换Ψ(例如,离散余弦变换(DCT)或离散小波变换(DWT))下可以使用K<<N系数很好地近似x,则认为x是K稀疏的(或可压缩的):x=Ψα,(1)其中Ψ是稀疏化变换,α是变换系数矢量,并且在α中只有K系数是非零的。转到图1,用标号100总体指示稀疏信号的表示。表示100涉及长度为N的信号x、稀疏化变换Ψ、和变换系数矢量α。按照压缩感测理论,这样的信号可以通过如下的不相干线性投影来获取:y=Φx,(2)其中y是具有M项的度量矢量,并且Φ代表M×N不相干感测矩阵,其中M<<N。转到图2,用标号200总体指示压缩感测中的度量获取方法。方法200涉及长度为N的信号x、具有M项的度量矢量y、和M×N不相干感测矩阵Φ。压缩感测框架断言,通过求解如下优化问题,可以只从M≥cKlogN(c是小常数)个度量中忠实地恢复x:α*=argmin|α|1以便`y=Φx=ΦΨα,(3)其中输入信号可以用x*=Ψα*近似。在方程(3)中,度量矢量y、感测矩阵Φ、和稀疏化矩阵Ψ是已知的。但是,信号x和它的变换系数矢量α是未知的(要寻找的)。在这样的情况下,α是优化变量。注意,由于M<<N,所以方程(2)是未定型的,即,存在许多都满足方程(2)的候选信号x。因此,应用最小二乘解的传统途径,即,x′=ΦT(ΦΦT)-1y不能提供x的忠实近似。压缩感测理论提出了通过求解方程(3)识别正确解信号x的替代途径。直观地,方程(3)中的优化问题试图在变换域Ψ中找出具有最少非零项的候选者x。文献中的最流行不相干感测矩阵Φ之一是随机投影或随机矩阵,其中每项包括独立、相同分布随机变量(例如,每项具有高斯(Gaussian)或贝努利(Bernoulli)分布)。可以示出,这样的随机矩阵最佳地与稀疏化Ψ不相干,因此导致最佳性能。请注意,方程(3)中的目标函数可以用其它稀疏度量取代。例如,对于像图像(或图像块)那样的2维信号,将总变差(TotalVariation,TV)用作稀疏度量是常见的。总变差是相继像素之间的差值的函数。总变差(TV)的一个示例如下:这是每个像素上的水平离散梯度Dh和垂直离散梯度Dv的幅度的总和。纹理小的平滑图像块往往具有小总变差。换句话说,这样的图像块在梯度域中往往是稀疏的。相关工作在第一种现有技术途径中,提出了编码块残差的DCT变换系数的一个子集和应用稀疏信号恢复算法从编码系数中恢复块残差的视频编解码器。稀疏信号恢复通过TV最小化来实现。方程(3)中的优化问题变成如下:x*=argminTV(x)以便y=Φx,(5)其中x是残差数据,即,从原始数据中减去预测数据的结果。基本上,该途径试图在观察数据y的约束下使重构残差的梯度最小化。由于涉及量化过程,所以原则上完美的重构是不可能的(即,y=Φx的等式约束太苟刻),因此,该算法通过求解如下问题允许一定程度的误差(在方程(6)中用ε表示):x*=argminTV(x)以便||y-Φx||<ε。(6)在这种途径中存在几个严重缺点,说明如下。上述第一种现有技术途径中的解码器应用基于TV最小化的算法来重构块残差。这种途径在假设块残差在梯度域中是稀疏的情况下是行之有效的。但是,块残差在块预测之后在梯度域中往往不是稀疏的,并且这种假设与已经利用了空间冗余的定向帧内预测不兼容。在第一种现有技术途径中在截断这样的系数之前为块残差计算一维DCT系数。这种截断采样不能最佳地捕获块残差的能量,因此降低了编码器的编码效率。另外,应用在第一种现有技术途径中稀疏恢复算法未完全考虑到编码系数的量化影响,导致重构块质量下降。此外,第一种现有技术途径中的实现应用了次最佳11-最小化算法。因此,所得编码器太慢,难以用于实际应用。转到图3,用标号300总体指示编码一个画面的图像数据的方法。方法300包括将控制交给循环限制块320的开始块310。循环限制块320使用变量i开始循环,变量i具有1,...,画面中的块数(#)的范围,并将控制交给功能块330。功能块330进行帧内/帧间预测以获取当前块的预测量,并将控制交给功能块340。功能块340将DCT变换应用于残差(代表当前块的原始版本与当前块的预测量之间的差值)以获取其变换系数,并将控制交给功能块350。功能块350将变换系数量化以获取量化变换系数,并将控制交给功能块360。功能块360将熵编码量化变换系数,并将控制交给功能块370。功能块370将量化变换系数逆量化,并将控制交给功能块380。功能块380(例如,使用离散余弦变换(DCT))将逆量化变换系数逆变换以获得当前块的重构残差,并将控制交给功能块390。功能块390通过将当前块的重构残差加入当前块的预测量中重构当前块,并将控制交给循环限制块395。循环限制块395结束循环,并将控制交给结束块399。转到图4,用标号400总体指示解码一个画面的图像数据的方法。方法400包括将控制交给循环限制块420的开始块410。循环限制块420使用变量i开始循环,变量i具有1,...,画面中的块数(#)的范围,并将控制交给功能块430。功能块430进行熵解码以获取量化变换系数、帧内/帧间预测模式和其它信息,并将控制交给功能块440。功能块440将当前块的量化变换系数逆量化,并将控制交给功能块450。功能块450(例如,使用离散余弦变换(DCT))将逆量化变换系数逆变换以获得重构残差,并将控制交给功能块460。功能块460通过将当前块的重构残差加入当前块的预测量中重构当前块,并将控制交给循环限制块470。循环限制块470结束循环,并将控制交给结束块499。
技术实现思路
现有技术的这些和其它缺陷和缺点通过本原理来解决,本原理针对用于使用压缩感测的视频编码器和解码器的方法和装置。按照本原理的一个方面,提供了一种装置。所述装置包括视频编码器,用于通过生成图像块的度量矢量,编码度量矢量,以及通过最小化响应于编码度量矢量的图像块的信号稀疏度重构图像块,来编码画面中的图像块。该度量矢量包括与图像块有关的变换系数。按照本原理的另一个方面,提供了一种用在视频编码器中的方法。所述方法包括通过生成图像块的度量矢量,编码度量矢量,以及通过最小化响应于编码度量矢本文档来自技高网
...

【技术保护点】
一种用于视频编码的装置,其包含:视频编码器(500),通过以下方式来编码画面中的图像块:生成图像块的度量矢量,对度量矢量进行编码,以及响应于编码的度量矢量对图像块的信号稀疏度进行最小化来重构图像块,该度量矢量包括与图像块有关的变换系数;其中通过适配于量化参数的加权因子,使用公式化成信号稀疏度和度量误差的加权和的最小化函数使图像块的信号稀疏度最小化,该度量误差代表重构的图像块的度量与图像块的估计度量之间的差,信号稀疏度在图像域中确定;其中,响应为图像块确定的残差来确定度量矢量,该残差代表图像块的原始版本与图像块的预测量之间的差;其中,信号稀疏度通过总变差来量度,该总变差是图像块中的连续像素之间的差的函数。

【技术特征摘要】
2010.01.15 US 61/295,2581.一种用于视频编码的装置,其包含:视频编码器(500),通过以下方式来编码画面中的图像块:生成图像块的度量矢量,对度量矢量进行编码,以及响应于编码的度量矢量对图像块的信号稀疏度进行最小化来重构图像块,信号稀疏度在图像域中确定,该度量矢量包括与图像块有关的变换系数;其特征在于,通过适配于量化参数的加权因子,使用公式化成信号稀疏度和度量误差的加权和的最小化函数使图像块的信号稀疏度最小化,该度量误差代表重构的图像块的度量与图像块的估计度量之间的差。2.一种用于视频编码的方法,其包含:通过以下方式来编码画面中的图像块:生成图像块的度量矢量,对度量矢量进行编码,以及响应于编码的度量矢量对图像块的信号稀疏度进行最小化来重构图像块,信号稀疏度在图像域中确定,该度量矢量包括与图像块有关的变换系数(900);其特征在于,通过适配于量化参数的加权因子,使用公式化成信号稀疏度和度量误差的加权和的最小化函数使图像块的信号稀疏度最小化,该度量误差代表重构的图像块的度量与图像块的估计度量之间的差。3.如权利要求2所述的方法,其中,响应为图像块确定的残差来确定度量矢量,该残差代表图像块的原始版本与图像块的预测量之间的差(730)。4.如权利要求3所述的方法,其中度量矢量包括残差的变换系数的子集(730)。5.如权利要求2所述的方法,其中使用量化和熵编码来编码度量矢量(930,935)。6.如权利要求2所述的方法,信号稀疏度通过总变差来量度,该总变差是图像块中的相继像素之间的差的函数(950)。7.如权利要求2所述的方法,其中将所述方法实现成编码模式,以及使用标志...

【专利技术属性】
技术研发人员:T·多吕小安J·索尔
申请(专利权)人:汤姆森特许公司
类型:发明
国别省市:法国;FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1