一种视频压缩方法及系统技术方案

技术编号:22105346 阅读:31 留言:0更新日期:2019-09-14 04:32
本发明专利技术公开了一种视频压缩方法及系统,其中,所述方法包括:确定目标视频中的待编码帧和参考帧,并计算所述待编码帧相对于所述参考帧的残差数据;分别提取所述残差数据的期望向量与方差向量;对所述期望向量和所述方差向量进行正态分布采样,以得到所述待编码帧的压缩数据,其中,所述压缩数据的维度低于所述残差数据的维度。本申请提供的技术方案,能够有效地对视频文件进行压缩。

A Video Compression Method and System

【技术实现步骤摘要】
一种视频压缩方法及系统
本专利技术涉及视频处理
,特别涉及一种视频压缩方法及系统。
技术介绍
随着视频清晰度的不断提升,视频文件的数据量也越来越大。为了节省传输视频文件的带宽,需要高效、稳定的视频压缩方案。目前主流的视频压缩方案中,可以先对视频数据进行量化,再针对量化结果进行扫描后,实现对视频文件的编码过程。具体地,可以通过量化表对视频数据进行量化,然后再通过ZigZag的方式对量化结果进行扫描。这样可以舍弃视频数据中的一些0值,从而压缩视频文件的数据量。然而,现有技术中的这种视频压缩方案,对于0值较多的视频文件会具备较好的压缩效果,而对于0值较少的视频文件,由于舍弃的数据量较少,因此压缩效果并不理想。而如果想要通过提高量化的步长来压缩数据,又会导致压缩后的视频文件失真率较高。因此,目前亟需一种更加有效的视频压缩方案。
技术实现思路
本申请的目的在于提供一种视频压缩方法及系统,能够有效地对视频文件进行压缩。为实现上述目的,本申请一方面提供一种视频压缩方法,所述方法包括:确定目标视频中的待编码帧和参考帧,并计算所述待编码帧相对于所述参考帧的残差数据;分别提取所述残差数据的期望向量与方差向量;对所述期望向量和所述方差向量进行正态分布采样,以得到所述待编码帧的压缩数据,其中,所述压缩数据的维度低于所述残差数据的维度。为实现上述目的,本申请另一方面还提供一种视频压缩系统,所述系统包括:残差数据计算单元,用于确定目标视频中的待编码帧和参考帧,并计算所述待编码帧相对于所述参考帧的残差数据;向量提取单元,用于分别提取所述残差数据的期望向量与方差向量;数据压缩单元,用于对所述期望向量和所述方差向量进行正态分布采样,以得到所述待编码帧的压缩数据,其中,所述压缩数据的维度低于所述残差数据的维度。为实现上述目的,本申请另一方面还提供一种视频压缩设备,所述视频压缩设备包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现上述的视频压缩方法。由上可见,本申请提供的技术方案,针对目标视频中的待编码帧,可以预先确定该待编码帧的参考帧。其中,该参考帧在压缩时,可以保留全帧的内容。而对于待编码帧而言,可以计算该待编码帧相对于所述参考帧的残差数据,后续在对该待编码帧进行编码时,可以仅针对残差数据进行编码,从而极大地减少了编码所需的数据量。为了进一步地减少编码所需的数据量,可以从该残差数据中提取能够表征该残差数据的特征参数。在本申请中,该特征参数可以是残差数据的期望向量和方差向量。提取出的期望向量和方差向量的维度会低于原始的残差数据的维度,从而可以实现数据降维。然后,针对期望向量和方差向量可以进行正态分布采样。这样处理的目的在于,一方面能够通过正态分布采样消除期望向量和方差向量中的噪声,从而提高数据压缩的准确度。另一方面,可以使得正态分布采样后的数据能够符合数据的自然分布规律,经过正态分布采样之后,相当于将期望向量和方差向量初步还原为了原来的残差数据,只不过正态分布采样后的数据维度,比原始的残差数据的维度低。这样,既能保证正态分布采样后的数据具备较高的保真度,又能保证正态分布采样后的数据具备较低的维度,从而在保证保真度的同时,提高了数据压缩的效率。这样,正态分布采样后的数据便可以作为待编码帧的压缩数据,该压缩数据可以用于后续的传输或者解码。由上可见,本申请提供的技术方案,可以通过残差数据来减少视频压缩所需的数据量,此外,通过提取期望向量和方差向量,并对期望向量和方差向量进行正态分布采样,从而能够有效地对视频进行压缩。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施方式中视频压缩方法的步骤示意图;图2是本专利技术实施方式中以宏块为单位进行图像处理的示意图;图3是本专利技术实施方式中压缩模型的结构示意图;图4是本专利技术实施方式中神经网络的示意图;图5是本专利技术实施方式中视频压缩系统的功能模块示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。本申请提供一种视频压缩方法,所述方法可以应用于具备数据处理功能的设备中。请参阅图1,所述方法可以包括以下步骤。S1:确定目标视频中的待编码帧和参考帧,并计算所述待编码帧相对于所述参考帧的残差数据。在本实施方式中,所述目标视频可以是待编码(待压缩)的视频,在所述目标视频中可以确定待编码帧和该待编码帧对应的参考帧。具体地,可以通过SATD(SumofAbsoluteTransformedDifference,绝对变换误差和算法)或者SAD(SumofAbsoluteDifferences,绝对误差和算法)等算法,计算待编码帧和参考帧之间的相似度,当计算得到的相似度达到指定的阈值时,便可以将该参考帧作为所述待编码帧对应的参考帧。当然,在实际应用中,参考帧和待编码帧的选择可以依据其它的标准,并不限定于上述按照场景确定的方案。因此,本申请对参考帧和待编码帧的确定方式不做限定。在本实施方式中,在确定出所述待编码帧和参考帧之后,为了减少待编码帧在编码过程中所需的数据,可以确定出待编码帧相对于参考帧的差量,并针对该差量进行编码,从而可以极大地减少待编码帧在编码过程中所需的数据量。具体地,可以计算所述待编码帧相对于所述参考帧的残差数据。在计算该残差数据时,首先可以计算所述待编码帧与参考帧之间的残差。该残差可以是待编码帧与参考帧之间对应像素点的像素差值。例如,参考帧和待编码帧均为28*28的视频帧,那么计算得到的残差就可以是元素个数为28*28=784的向量。只不过,由于参考帧与待编码帧之间比较较高的相似度,因此表征残差的向量中,包含较多的0值,这些0值在后续编码过程中会极大地减轻编码压力。在一个实施方式中,参考帧和待编码帧通常都会被划分为预设数量的宏块((MacroBlock),那么上述的计算残差的过程,可以以宏块为单位进行。具体地,可以将所述待编码帧划分为预设数量的目标宏块,并确定每个所述目标宏块在所述参考帧中对应的参考宏块。请参阅图2,虚线的两端分别指向的所述参考宏块与目标宏块所覆盖的像素点的数量以及覆盖的区域大小均可以一致。这样,待编码帧和参考帧便可以划分为成对的目标宏块和参考宏块。然后,可以分别计算每个所述目标宏块与对应的所述参考宏块之间的局部残差。具体地,可以将目标宏块与参考宏块之间对应像素点的像素值相减,从而得到每个像素点位置处的像素差值。一个目标宏块中各个像素差值的组合,便可以作为该目标宏块与对应的参考宏块之间的局部残差。在计算得到各个目标宏块的局部残差之后,可以将各个所述局部残差的组合,作为所述待编码帧与参考帧之间的残差。在本实施方式中,为了进一步增多0值的数量,从而减少编码所需的数据量,可以将计算得到的所述残差从时间域转换至频率域。具体地,在实际应用中,可以采用离散余弦变换(DiscreteCosineTransform,DCT)对计算得到的残差进行处理,DCT变换之后的数据,可以实现高频部分与低频部分分本文档来自技高网...

【技术保护点】
1.一种视频压缩方法,其特征在于,所述方法包括:确定目标视频中的待编码帧和参考帧,并计算所述待编码帧相对于所述参考帧的残差数据;分别提取所述残差数据的期望向量与方差向量;对所述期望向量和所述方差向量进行正态分布采样,以得到所述待编码帧的压缩数据,其中,所述压缩数据的维度低于所述残差数据的维度。

【技术特征摘要】
1.一种视频压缩方法,其特征在于,所述方法包括:确定目标视频中的待编码帧和参考帧,并计算所述待编码帧相对于所述参考帧的残差数据;分别提取所述残差数据的期望向量与方差向量;对所述期望向量和所述方差向量进行正态分布采样,以得到所述待编码帧的压缩数据,其中,所述压缩数据的维度低于所述残差数据的维度。2.根据权利要求1所述的方法,其特征在于,计算所述待编码帧相对于所述参考帧的残差数据包括:计算所述待编码帧与参考帧之间的残差,并将所述残差从时间域转换至频率域,并将转换得到的频率域的残差作为所述待编码帧相对于所述参考帧的残差数据。3.根据权利要求2所述的方法,其特征在于,计算所述待编码帧与参考帧之间的残差包括:将所述待编码帧划分为预设数量的目标宏块,并确定每个所述目标宏块在所述参考帧中对应的参考宏块;分别计算每个所述目标宏块与对应的所述参考宏块之间的局部残差,并将各个所述目标宏块对应的局部残差的组合,作为所述待编码帧与参考帧之间的残差;相应地,将各个所述局部残差从时间域转换至频率域,并将转换得到的频率域的局部残差的组合,作为所述待编码帧相对于所述参考帧的残差数据。4.根据权利要求1所述的方法,其特征在于,在计算所述待编码帧相对于所述参考帧的残差数据之后,所述方法还包括:将所述残差数据输入完成训练的深度神经网络,所述深度神经网络中包括多个全连接层;通过所述深度神经网络中的第一全连接层,将所述残差数据从第一维度降低至第二维度;相应地,分别通过所述深度神经网络中的第二全连接层和第三全连接层,提取所述第二维度的残差数据的期望向量与方差向量;其中,所述期望向量和所述方差向量的维度低于所述第二维度。5.根据权利要求4所述的方法,其特征在于,所述深度神经网络中还包括用于执行正态分布采样的正态采样层;相应地,所述第二维度的残差数据的期望向量与方差向量被输入所述正态采样层进行正态分布采样,得到第三维度的压缩数据;其中,所述第三维度低于所述第二维度。6.根据权利要求4所述的方法,其特征在于,在得到所述待编码帧的压缩数据之后,所述方法还包括:对所述待编码帧的压缩数据进行反向重构,以将所述压缩数据还原为与所述残差数据的维度相匹配的解码数据。7.根据权利要求6所述的方法,其特征在于,对所述待编码帧的压缩数据进行反向重构包括:将所述待编码帧的压缩数据输入解码神经网络中的第一个全连接层,以将所述压缩数据还原至所述第二维度;将还原至所述第二维度的数据输入所述解码神经网络的第二个全连接层,以将所述第二维度的数据还原至所述第一维度,并将还原至所述第一维度的数据作为与所述残差数据的维度相匹配的解码数据。8.根据权利要求6所述的方法,其特征在于,在对所述期望向量和所述方差向量进行正态分布采样之后,所述方法还包括:根据所述期望向量和所述方差向量,计算所述残差数据的相对熵...

【专利技术属性】
技术研发人员:林鹏程
申请(专利权)人:网宿科技股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1