一种基于AVC标准的视频转换装置制造方法及图纸

技术编号:6953132 阅读:263 留言:0更新日期:2012-04-11 18:40
公开了一种宏块预测模式选择正确性高、提取特征耗时较少、无任何漂移效应的基于AVC编码格式的视频转换装置,利用模式识别技术来进行宏块预测模式的选择。宏块预测模式选择的过程就是模式识别中类别决策的过程。将提取的特征输入到分类器中,得到分类结果,即宏块的预测模式。分类器是通过训练得到的,因此,本发明专利技术设计的视频转换装置分为训练模块和转换模块,用来完成分类器的设计,并使用该分类器完成对宏块预测模式的选择。

【技术实现步骤摘要】

本专利技术涉及视频处理的
,尤其涉及一种基于AVC标准的视频转换装置
技术介绍
目前,视频的各种应用越来越广泛进入人们的日常生活中,而实际上,视频的应用环境非常复杂,从传输的信道、存储介质,到播放终端等都各不相同。在这些应用中,常常需要对视频流中的图像大小、帧率、图像质量等各参数进行调整,从而符合接入网络和播放终端的要求。在视频格式的转换中,其输入是一种比特流格式(空间分辨率Si,时间分辨率 Tl,码率R1,标准Cl等),经过转换装置之后,就可以得到另一个输出比特流格式(空间分辨率S2,时间分辨率T2,码率R2,标准C2等)。根据输入和输出比特流格式,视频格式转换通常分为标准间转换和标准内转换两种。标准间转换是指输入比特流和输出比特流属于不同的标准。标准内转换指输入和输出比特流属于同一标准,这时转换的目的主要是降低输出码率,从而适应不同的带宽,又常分为空间分辨率转换(图像尺寸),时间分辨率转换(帧率),比特率转换(图像质量)三个方面。现有的视频转换装置有重解重编码装置、像素域闭环装置、开环装置、频域闭环装置等。其中,重解重编装置结构简单,计算复杂度高;像素域闭环方案,开环装置及频域闭环装置引入了漂移误差,且不能同时适用于空间分辨率、时间分辨及码率发生变化的转码。上述转码方法的复杂度及时间都存在于转码实施过程中,没有在转码之前生成可用样本,造成实时性较低。AVC标准是一种最新且技术含量最高的视频编码格式,在低码率下提供很好的视频质量,同时,并不增加很多复杂的编码工具,而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。其具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。能适应于不同网络中的视频传输,网络亲和性好。
技术实现思路
本专利技术的技术解决问题是克服现有技术的不足,提供一种宏块预测模式选择正确性高、提取特征耗时较少、无任何漂移效应的基于AVC标准的视频转换装置。本专利技术的技术解决方案是这种基于AVC标准的视频转换装置包括训练模块和转换模块;所述的训练模块包含第一模块,用于挑选出常用的具备各种典型特征的视频序列作为样本视频序列, 并将这些视频序列使用AVC标准进行编码;第二模块,使用AVC解码器,将压缩好的样本视频序列进行完全解码,得到像素域数据;第三模块,用于从像素域数据中提取出预测模式、残差数据、量化参数三个特征, 同时使用全模式搜索法获取当前三个特征决定的最优模式作为目标类别;第四模块,通过前述的三个特征和目标类别,使用模式识别方法设计出分类器;所述的转换模块包含第五模块,使用AVC解码器,完全解码在线的实时视频流,得到在线像素域数据;第六模块,用于从在线像素域数据中提取出预测模式、残差数据和量化参数三个特征;第七模块,用于将前述的三个特征输入到离线建立的分类器中,得到分类结果,即预测模式,从而完成宏块预测模式的选择;第八模块,用于针对选择的宏块预测模式,重新计算运动矢量;第九模块,利用选择的宏块预测模式和重新计算的运动矢量,重新对视频进行编码并输出。本装置充分利用了原始码流的丰富信息,通过在平时训练得到的分类器快速进行宏块预测模式选择,其中采用成熟的分类器设计方法,能尽可能保证选择的正确性,大大提高了转码的实时性;从解码信息中提取了残差数据,宏块类型,量化参数等作为特征,这些特征都与编码端的块类型息息相关。没有提取比较耗时的运动矢量特征,这样保证了提取特征耗时较少,速度较快。此外,本方法采用了基于像素域的视频转码,无任何漂移效应。具体实施例方式本专利技术是利用模式识别技术来进行宏块预测模式的选择。宏块预测模式选择的过程就是模式识别中类别决策的过程。将提取的特征输入到分类器中,得到分类结果,也就是宏块预测模式。分类器是通过训练得到的,因此,本专利技术的视频转换装置分为训练模块和转换模块,用来完成分类器的设计,并使用该分类器完成对宏块预测模式的选择。所述的训练模块包含第一模块,用于挑选出常用的具备各种典型特征的视频序列作为样本视频序列, 并将这些视频序列使用AVC标准进行编码;第二模块,使用AVC解码器,将压缩好的样本视频序列进行完全解码,得到像素域数据;第三模块,用于从像素域数据中提取出预测模式、残差数据、量化参数三个特征, 同时使用全模式搜索法获取当前三个特征决定的最优模式作为目标类别;第四模块,通过前述的三个特征和目标类别,使用模式识别方法设计出分类器;所述的转换模块包含第五模块,使用AVC解码器,完全解码在线的实时视频流,得到在线像素域数据;第六模块,用于从在线像素域数据中提取出预测模式、残差数据和量化参数三个特征;第七模块,用于将前述的三个特征输入到离线建立的分类器中,得到分类结果,即预测模式,从而完成宏块预测模式的选择;第八模块,用于针对选择的宏块预测模式,重新计算运动矢量;第九模块,利用选择的宏块预测模式和重新计算的运动矢量,重新对视频进行编码并输出。训练和转换都需要从解码信息中提取三个特征预测模式,残差数据,量化参数。 优选地,本专利技术中所述三个特征提取步骤如下( 1)预测模式本专利技术支持的空间分辨率转码中的图像缩放因子为2,因此待编码的宏块对应着已编码图像中的4个宏块,每个宏块都有一个预测模式,为了能尽量降低特征向量的维数,提高转码速度,本专利技术中预测模式特征的计算值是这4个宏块的预测模式之和;(2)残差数据AVC中采用的是4x4的整数变换,也就是一个宏块包含了 16个4x4 子块,每个4x4子块都有各自的非零系数,该数据描述了当前4x4子块的性质,这些性质包括纹理是否丰富,运动是否剧烈;本专利技术中该特征的计算值是原始图像中4个宏块所包含的所有4x4子块中的非零系数的比例;(3)量化参数在本专利技术中比特率转换利用重新量化实现;量化参数特征的计算值是输出量化参数减去输入量化参数。优选地,在第八模块中,在空间分辨率转码部分,采用取中间值方法来重新计算宏块的运动矢量。优选地,在第四模块中,成熟的模式识别方法包括支持向量机、遗传算法、人工神经网络。本专利技术充分利用了原始码流的丰富信息,快速进行宏块预测模式选择,并尽可能保证选择的正确性;从解码信息中提取了残差数据,宏块类型,量化参数等作为特征,这些特征都与编码端的块类型息息相关。没有提取比较耗时的运动矢量特征,这样保证了提取特征耗时较少,速度较快。此外,本方法采用了基于像素域的视频转码,无任何漂移效应。 本专利技术采用了像素域的视频转码,不会出现漂移误差,也就不会导致漂移效应,从而保证了重新编码后的图像质量。另外值得强调的是,可以同时满足空间分辨率转码,时间分辨率转码,和比特率转码三种类型的转码。并可以根据用户设置,选择哪种转码,或者任意两种转码都可以任意组合。为了便于理解和实施本专利技术,下面结合无线视频点播实例来对本专利技术作进一步详细描述。在无线视频点播中,已编码的视频流存放在视频服务器上,这些视频流都是在高比特率的前提下压缩的,即图像尺寸大,帧率高,图像质量较好。当有无线终端用户进行点播某个视频段,会将相应所要求的参数同时发送到视频服务器,这些参数包括图像尺寸, 帧率,比特率等。视频服务器根据这些参数的要求本文档来自技高网
...

【技术保护点】
1.一种基于AVC标准的视频转换装置,其特征在于,包括训练模块和转换模块;所述的训练模块包含:第一模块,用于挑选出常用的具备各种典型特征的视频序列作为样本视频序列,并将这些视频序列使用AVC标准进行编码;第二模块,使用AVC解码器,将压缩好的样本视频序列进行完全解码,得到像素域数据;第三模块,用于从像素域数据中提取出预测模式、残差数据、量化参数三个特征,同时使用全模式搜索法获取当前三个特征决定的最优模式作为目标类别;第四模块,通过前述的三个特征和目标类别,使用模式识别方法设计出分类器;所述的转换模块包含:第五模块,使用AVC解码器,完全解码在线的实时视频流,得到在线像素域数据;第六模块,用于从在线像素域数据中提取出预测模式、残差数据和量化参数三个特征;第七模块,用于将前述的三个特征输入到离线建立的分类器中,得到分类结果,即预测模式,从而完成宏块预测模式的选择;第八模块,用于针对选择的宏块预测模式,重新计算运动矢量;第九模块,利用选择的宏块预测模式和重新计算的运动矢量,重新对视频进行编码并输出。

【技术特征摘要】
1.一种基于AVC标准的视频转换装置,其特征在于,包括训练模块和转换模块; 所述的训练模块包含第一模块,用于挑选出常用的具备各种典型特征的视频序列作为样本视频序列,并将这些视频序列使用AVC标准进行编码;第二模块,使用AVC解码器,将压缩好的样本视频序列进行完全解码,得到像素域数据;第三模块,用于从像素域数据中提取出预测模式、残差数据、量化参数三个特征,同时使用全模式搜索法获取当前三个特征决定的最优模式作为目标类别;第四模块,通过前述的三个特征和目标类别,使用模式识别方法设计出分类器; 所述的转换模块包含第五模块,使用AVC解码器,完全解码在线的实时视频流,得到在线像素域数据; 第六模块,用于从在线像素域数据中提取出预测模式、残差数据和量化参数三个特征;第七模块,用于将前述的三个特征输入到离线建立的分类器中,得到分类结果,即预测模式,从而完成宏块预测模式的选择;第八模块,用于...

【专利技术属性】
技术研发人员:张佳明
申请(专利权)人:北京汉邦高科数字技术有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1