本发明专利技术提出了一种对帧的像素的块的离散余弦系数进行近似的方法和设备。提出了用于对第一帧的像素的第一块的DC系数进行近似的方法和设备。所述方法包括:基于无近似误差的、第一帧的宏块的DC系数来计算亮度DC平均值;以及基于第二块的DC系数来确定第一块的DC系数,其中,第二块是第二帧的部分,该第二帧是第一帧的参考帧,第二块与第一块的参考块重叠并具有与亮度DC平均值最接近的DC系数。
【技术实现步骤摘要】
本专利技术的实施例涉及一种用于对第一帧的像素的第一块的DC系数进行近似的方法和设备。本专利技术的另外的实施例涉及一种用于检测视频流中的单色帧的方法和设备。
技术介绍
在视频流中,有时使用单色帧来用信号通知(signal)视频流的不同部分之间(例如,由例如摄像机或可携式摄像机拍摄的点之间,或者在广告短片之间等)的边界。 单色帧是包含在帧上的均匀一致的单一颜色分布的视频帧。单色帧习惯于出现在两段广告之间的界线中,但是它们也出现在画面渐变期间、紧接在电影的致谢名单之前或者甚至在强烈的闪光期间。在本说明书中,“帧”也被称作“画面”或“图像”。 标识(logo)在帧中的出现会使该帧不是单色的。但是,因为该标识是后来添加到帧上的,所以帧的其余部分可以是单色的。因此,必须考虑两种单色帧出现标识的单色帧和不出现标识的单色帧。 当今大多数视频数据都是以压缩形式传送的,比如以MPEG-2(运动画面专家组)形式传送。在MPEG-2中,在空间域内执行运动补偿,也就是说在对所需参考帧进行了解码之后执行运动补偿。为了能够对任意帧进行运动补偿,首先必须对作为重建该帧的基础的参考帧进行解码及缓冲。 随后利用当前帧的运动矢量,从相应的已解码的参考帧中取得所需的像素信息并且将该像素信息置于当前帧中。此外,对于利用了差分误差编码的预测帧,所传送的误差被解码并且被添加到运动估计中。 然而,在压缩域内,出于一个基本原因而无法应用这一运动补偿过程在空间域内,对应于参考帧的所有像素都是可用的(这是因为这些像素先前已经被解码),而在压缩域内,只可使用每个先前定界的宏块的DCT系数。在大多数情况下,运动矢量所指向的参考区域并不与唯一的宏块相匹配,而是与数个宏块重叠。 存在几种针对数字视频的MPEG标准MPEG-1、MPEG-2、MPEG-4。MPEG-2意图用于从视频会议到高清晰度电视的高数据速率视频应用。 与任何压缩算法一样,MPEG-2试图减少视频数据中的冗余。 一般来说,未压缩的视频数据包括在不同时刻(instant in time)取得的连续帧的序列。在MPEG-2中,每帧以分层的方式被分成切片(slice)、宏块(MB)、块和像素(像元)。所述像元(或像素)是最小的图像单元,并且其代表亮度和色度(其在RGB标准中等效于红色、绿色和蓝色的色彩强度)的各个样本值。块是8×8像元的集合,宏块包括4个块或者16×16个像元,而切片是1×n个宏块的水平阵列,其中n是从1到最大水平宏块数目(the maximum number ofmacro-blocks horizontally)的宏块数目。 与JPEG图像压缩算法一样,MPEG-2采用基于块的二维离散余弦变换(DCT)。8×8像元的块被变换成8×8的DCT系数块。 在具有均匀的亮度和颜色的像元块中,比如一片天空,少数几个DCT系数将集中所有的能量,而其余的DCT系数将为零或几乎为零。因此,经常出现的情况是对于每个64帧块只需要传送少数几个DCT系数,从而大大减少了信息量。因此,对于单色块来说,仅有左上角的系数(其也被称作DC系数)会是非零的,而对于具有很多纹理或噪声的块来说,右下角部分会包含一些非零值。在量化之后,从右上角系数开始按照Z字形方式扫描所得到的非零系数,并且利用可变长度编码(VLC)对其进行编码。 由于相邻帧之间的相似性而存在时间冗余。在MPEG-2中存在3种主要的帧类型I帧、P帧和B帧。在I帧中,所有宏块都被帧内编码(intra-code),这意味着所有宏块的经过量化的DCT系数都被传送。在P帧中,宏块可以被帧内编码、被前向预测或者被跳过,这取决于该宏块关于先前帧的改变程度。类似地,B帧宏块可以被帧内编码、被跳过、被前向预测、被后向预测或者被双向预测。 每个前向预测过的宏块都得自运动矢量(MV)所指向的先前参考帧(I或P帧)的宏块和估计误差。也就是说,取代传送所述宏块的DCT系数,指向该宏块的先前位置的运动矢量与这个预测的估计误差一起被提供。这样,先前参考帧的DCT系数信息被用来导出当前的宏块信息。按照相同的方式,后向预测过的宏块包括指向该宏块在下一参考帧中的位置的运动矢量。 双向预测过的宏块包含两个运动矢量,其中一个运动矢量来自先前参考帧,而另外一个运动矢量来自下一参考帧。 在所述压缩过程期间,通过把每个宏块与所述先前参考帧和/或下一参考帧中的一些或所有其它宏块进行比较来计算所述运动矢量。可以通过几种方式来获得运动矢量。 最常见的方法是帧间混合编码。利用这种方法,于空间域内在运动估计器中获得运动矢量,也就是说利用未压缩的视频信息来获得运动矢量。随后将对所述运动矢量进行差分编码每个所传送的运动矢量代表关于先前传送的运动矢量的差。最后,经过运动补偿的预测器获得基于运动矢量的重建与原始帧之间的差。为此目的,必须对所述已编码的DCT系数进行逆量化和逆变换。对差分误差进行VLC编码并且与所述运动矢量和标志一起发送,其中该标志表明是否存在这样的误差信息。MPEG-2既可以应对逐行视频(Progrssive video)也可以应对隔行视频。 画面或帧被组织成画面组(GOP)。GOP是一个I帧以及零个或更多个P和B帧的组合,其通常(但是也不一定)在整个视频序列期间周期性地重复。GOP至少包含一个也仅仅包含一个I帧,其位于该GOP的开头。 在US 2007-0256091 A1中公开了一种通过比较像素平均值来提取空间域中(即,在解压缩之后)的单色帧的方法。然而,视频流必须完全被解压缩,从而尤其是当应用于高质量视频流时招致高计算成本。 在US 2007-0206931中公开了一种用于通过使用统计数或帧内编码的宏块来提取压缩域中的单色帧的方法。帧内编码的宏块的平均数目用作出现单色帧的指示器。然而,由于I帧总是被帧内编码,所以该方法只能应用于P帧和B帧。 因此,需要用于对压缩帧的像素的第一块流(current)进行近似的改进的方法和设备,和需要用于检测压缩视频流中的帧或单色帧的改进的方法和设备,以及需要相应的计算机程序产品。
技术实现思路
通过以下方法和设备来解决该目的 一种用于对第一帧的像素的第一块的DC系数进行近似的方法,其包括 基于无近似误差的、第一帧的宏块的DC系数来计算亮度DC平均值;以及 基于第二块的DC系数来确定第一块的DC系数,其中,第二块是第二帧的部分,该第二帧是第一帧的参考帧,第二块与第一块的参考块重叠并具有与亮度DC平均值最接近的DC系数。 一种用于检测视频流中的单色帧的方法,其包括 上述的对DC系数进行近似; 确定第一帧中的DC系数的方差; 如果方差低于预定阈值,则将第一帧分类为单色。 一种用于对第一帧的像素的第一块的DC系数进行近似的设备,其包括 计算单元,其被配置成基于无近似误差的、第一帧的宏块的DC系数来计算亮度DC平均值;以及 确定单元,其被配置成基于第二块的DC系数来确定第一块的DC系数,其中第二块是第二帧的部分,该第二帧是第一帧的参考帧,第二块与第一块的参考块重叠并具有与亮度DC平均值最接近的DC系数。 一种用于检测视频流中的单色帧的设备,其包括 上述设备; 方差确定单元,其被配置成确定帧中的DC系数的方差;本文档来自技高网...
【技术保护点】
一种用于对第一帧的像素的第一块的DC系数进行近似的方法,其包括:基于无近似误差的、第一帧的宏块的DC系数来计算亮度DC平均值;以及基于第二块的DC系数来确定第一块的DC系数,其中,第二块是第二帧的部分,该第二帧是第一帧的参考帧,第二块与第一块的参考块重叠并具有与亮度DC平均值最接近的DC系数。
【技术特征摘要】
EP 2008-11-12 08019761.91.一种用于对第一帧的像素的第一块的DC系数进行近似的方法,其包括基于无近似误差的、第一帧的宏块的DC系数来计算亮度DC平均值;以及基于第二块的DC系数来确定第一块的DC系数,其中,第二块是第二帧的部分,该第二帧是第一帧的参考帧,第二块与第一块的参考块重叠并具有与亮度DC平均值最接近的DC系数。2.根据权利要求1所述的方法,其中,无近似误差的、第一帧的宏块是对于参考宏块具有零运动矢量的被预测的宏块,或者是对于参考宏块被跳过的宏块,或者是被帧内编码的第一帧的宏块。3.根据权利要求1所述的方法,其中,在确定第一块的DC系数期间,误差系数DCErr被添加到第二块的DC系数。4.根据权利要求1所述的方法,其还包括确定属于第三帧的第三块,该第三帧是第二帧的参考帧;第三块与第二块的参考块重叠得最多;以及基于第三块的DC系数来确定第二块的DC系数。5.根据权利要求1所述的方法,其还包括基于无近似误差的、第一帧的宏块的DCT系数,通过计算DCT系数平均值,确定第一块的另外的DCT系数;以及基于另外的第二块的DCT系数,确定第一块的另外的DCT系数,其中,另外的第二块是第二帧的部分,另外的第二块与第一块的参考块重叠并具有与DCT系数平均值最接近的另外的DCT系数。6.一种用于检测视频流中的单色帧的方法,其包括根据权利要求1所述的对DC系数进行近似;确定第一帧中的DC系数的方差;如果方差低于预定阈值,则将第一帧分类为单色。7.根据权利要求6所述的方法,其还包括将第一帧划分为至少两个部分;确定每个部分的DC系数的方差;如果至少一个部分的方差低于第一预定阈值,则将第一帧分类为单色。8.根据权利要求7所述的方法,其中,至少两个部分中的至少一个部分是第一帧的角落区域。9.根据权利要求8所述的方法,其中,第一帧被划分为五个部分,并且五个部分中的四个部分是帧的角落区域。10.根据权利...
【专利技术属性】
技术研发人员:FM弗南德茨,K齐默曼,M维尔特曼,
申请(专利权)人:索尼株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。