基于结构相似度的高效视频编码感知码率控制优化方法技术

技术编号:9768598 阅读:164 留言:0更新日期:2014-03-16 00:48
一种基于结构相似度的高效视频编码感知码率控制优化方法,包括以下步骤:在进行最大编码单元级的码率分配时,利用结构相似度作为图像失真的评价标准计算图像最大编码单元的失真,并利用其代替高效视频编码器编码端码率分配中的图像失真来计算码率控制R-λ模型中最大编码单元级码率分配的权重;在进行模式判决前,利用结构相似度作为图像失真的评价标准计算图像失真,并用其替代高效视频编码器编码端率失真判决中的编码图像的失真。本发明专利技术设计合理,使码率分配更加高效、准确,同时在相同码率情况下提高了编码图像的感知视觉质量;在目标码率相同的情况下能提高视频主观质量,或在相同的结构相似度情况下平均能实现12%的码率减少。

【技术实现步骤摘要】
基于结构相似度的高效视频编码感知码率控制优化方法
本专利技术属于视频编解码
,尤其是一种基于结构相似度的高效视频编码感知码率控制优化方法。
技术介绍
近年来,高清/超高清视频编码技术作为未来家庭影院、数字广播电视、网络视频、高清电影等业务的基础核心技术成为业界关注的焦点。针对高清/超高清视频通信,现有的视频编码标准在压缩比和实际的应用需求相比还有一定的差距。为此,国际标准化组织ISO/IEC(MPEG)和ITU-T启动了下一代数字视频压缩标准的规划——高效视频编码(HighEfficiencyVideoCoding,HEVC),目标是在H.264/AVC高档次的基础上,压缩效率提高一倍以上。HEVC依然沿用H.264的混合编码框架,采用帧间和帧内预测编码消除时间域和空间域的相关性,变换编码对残差进行变换编码以消除空间相关性,熵编码消除统计上的冗余度。在HEVC现有的码率控制方法中,是通过以下流程完成码率控制的:1、比特分配假设目标码率为Rtar,帧率为f,则每帧图像的平均目标码率为RPicAvg=Rtar/f用Ncoded表示已经编码的帧数,Rcoded表示这些已编码帧所消耗的比特数。(1)图像组(GroupofPicture,GOP)级的码率分配假设在当前GOP中有NGOP幅图像,SW是一个平滑窗的窗口大小,用来使得码率变化更加平滑。在本方法中,SW的大小设为40,一个GOP的目标码率由下式决定:TGOP=TAvgPiciNGOP如果这SW个图像每幅图像实际分配了TAvgPic比特,平滑窗口的目标则是在SW个图像后实现目标码率。同时,当前的缓冲器状态和目标码率被联合考虑进来,式(*)也可以写成另外一种形式:第一项RPicAvg表示目标码率,第二项RPicAvg·Ncoded-Rcoded表示缓冲器状态,从此式可以直观的看到缓冲器状态和目标码率。(2)帧级比特分配设TGOP是当前GOP的目标码率,CodedGOP是当前GOP已编码比特数。ω是每一幅图像在当前GOP中比特分配中的权重。因此,当前帧的目标码率由下式决定:上式是根据不同图像的权重分配剩下的比特数。ω值是由表1和表2来决定的,其中bpp表示每个像素所分配到的的比特数。表1低延迟配置编码中的ω表2随机接入配置编码中的ω(3)最大编码单元(LargestCodingUnit,LCU)级目标码率的分配ωCurrLCU=(1-SSIMLCU)2其中TCurrPic表示该编码帧所分配的目标码率,Bitheader表示该帧中头信息所占用的比特数,CodedPic表示已经编码的LCU所用的比特数,ω表示每个LCU码率分配的权重。2、获得所分配的比特数(1)根据目标码率TCurrPic以及公式λ=α·bppβ可求得参数λ;由于在率失真框架中用1-SSIM来表征图像失真,因此需要对λ=α·bppβ模型的参数α和β重新进行拟合。(2)根据对不同序列进行拟合得到的如下QP-λ关系计算编码所需的QP值:QP=7.783lnλ+36.132(3)更新模型参数。当编码完一个LCU,利用编码后的真实的bpp和λ值来更新模型λ=α·bppβ中的α和β值。在HEVC现有的率失真方法中,是通下式完成计算率失真的:J=D+λR其中λ表示拉格朗日乘数,用来控制码率和失真的平衡。应用在RDO过程中的失真度量对视频编码有深远的影响。视频编码的主要目的是在保证高质量视觉效果的前提下最大限度地降低码率,即实现压缩。传统的图像/视频编码技术主要针对空间域冗余、时间域冗余以及统计冗余进行压缩编码,这一类编码技术以增加编码端计算复杂度为代价来获取编码性能的提高,如HEVC、H.264/AVC等,其性能提升速度已日趋饱和。近年来,研究人员开始尝试将人体感知、图形学和视觉系统特性应用到视频编码框架,利用人类视觉系统(HumanVisualSystem,HVS)的视觉特征、非线性特性和心理效应来进行提高压缩效率的视频编码技术定义为感知视频编码(PerceptualVideoCoding,PVC)。传统的率失真优化通常采用客观的失真描述方式,如SAD(SumofAbsoluteDifference,绝对误差和)、MSE(MeanofSquaredError,平均平方误差)和SSE(SumofSquaredError,误差平方和)。这种描述方式具有计算简单容易实现的优点,但并不能很好的体现人眼的主观视觉特性。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于结构相似度的高效视频编码感知码率控制优化方法,通过修改HEVC编码器端的LCU级的码率控制权重和率失真求解过程,使得在相同的码率下提高视频的主观视觉质量。本专利技术解决其技术问题是采取以下技术方案实现的:一种基于结构相似度的高效视频编码感知码率控制优化方法,包括以下步骤:步骤1、在高效视频编码器编码端进行最大编码单元级的码率分配时,利用结构相似度作为图像失真的评价标准计算图像最大编码单元的失真,并利用其代替高效视频编码器编码端码率分配中的图像失真来计算码率控制R-λ模型中最大编码单元级码率分配的权重;步骤2、在高效视频编码器编码端进行模式判决前,利用结构相似度作为图像失真的评价标准计算图像失真,并用其替代高效视频编码器编码端率失真判决中的编码图像的失真。而且,所述步骤1的具体步骤包括:步骤1.1、根据码率控制R-λ模型中图像组级码率控制、帧级码率控制得到当前编码帧所分配的目标码率TCurrPic;步骤1.2、计算当前编码帧中头信息所占用的比特数Bitheader和已经编码的最大编码单元所用的比特数CodedPic;步骤1.3、计算该最大编码单元的分配权重ωCurrLCU=(1-SSIMLCU)2,其中SSIMLCU表示该最大编码单元的结构相似度;步骤1.4、计算该最大编码单元的目标码率根据公式:其中TCurrCU表示该最大编码单元的目标码率,TCurrPic表示该编码帧所分配的目标码率,Bitheader表示该帧中头信息所占用的比特数,CodedPic表示已经编码的最大编码单元所用的比特数,ω表示每个最大编码单元码率分配的权重;步骤1.5、根据最大编码单元的目标码率TCurrCU以及公式λ=α·bppβ求得参数λ,其中bpp表示每个本文档来自技高网
...
基于结构相似度的高效视频编码感知码率控制优化方法

【技术保护点】
一种基于结构相似度的高效视频编码感知码率控制优化方法,其特征在于,包括以下步骤:步骤1、在高效视频编码器编码端进行最大编码单元级的码率分配时,利用结构相似度作为图像失真的评价标准计算图像最大编码单元的失真,并利用其代替高效视频编码器编码端码率分配中的图像失真来计算码率控制R?λ模型中最大编码单元级码率分配的权重;步骤2、在高效视频编码器编码端进行模式判决前,利用结构相似度作为图像失真的评价标准计算图像失真,并用其替代高效视频编码器编码端率失真判决中的编码图像的失真。

【技术特征摘要】
1.一种基于结构相似度的高效视频编码感知码率控制优化方法,其特征在于,包括以下步骤:步骤1、在高效视频编码器编码端进行最大编码单元级的码率分配时,利用结构相似度作为图像失真的评价标准计算图像最大编码单元的失真,并利用其代替高效视频编码(HEVC)器编码端码率分配中的图像失真来计算码率控制R-λ模型中最大编码单元级码率分配的权重,R-λ模型为:J=D+λR其中,D为选择编码组合时的总失真,R为选择编码组合时的总速率,λ为引入的拉格朗日参数,J为代价函数;步骤2、在高效视频编码器编码端进行模式判决前,利用结构相似度作为图像失真的评价标准计算图像失真,并用其替代高效视频编码器编码端率失真判决中的编码图像的失真。2.根据权利要求1所述基于结构相似度的高效视频编码感知码率控制优化方法,其特征在于:所述步骤1的具体步骤包括:步骤1.1、根据码率控制R-λ模型中图像组级码率控制、帧级码率控制得到当前编码帧所分配的目标码率TCurrPic;步骤1.2、计算当前编码帧中头信息所占用的比特数Bitheader和已经编码的最大编码单元所用的比特数CodedPic;步骤1.3、计算该最大编码单元的分配权重ωCurrLCU=(1-SSIMLCU)2,其中SSIMLCU表示该最大编码单元的结构相似度;步骤1.4、计算该最大编码单元的目标码率根据公式:其中TCurrCU表示该最大编码单元的目标码率,TCurrPic表示该编码帧所分配的目标码率,Bitheader表示该帧中头信息所占用的比特数,CodedPic表示已经编码的最大编码单元所用的比特数,ω表示每个最大编码单元码率分配的权重,NotCodedLCUs表示没有编码的最大编码单元;步骤1.5、根据最大编码单元的目标码率TCurrCU以及公式λ=α·bppβ求得参数λ,其中bpp表示每个像素编码所需的比特数;步骤1.6、根据对不同序列进行拟合得到的如下QP-λ关系,计算编码所需的量化参数QP值:QP=7.783lnλ+36.132步骤1.7、采用如下方法更新模型参数:当编码完一个最大编码单元,利用编码后的真实的bpp和λ值来更新模型λ=α·bppβ中的α和β值,其中bpp表示每个像素编码所需的比特数。3.根据权利要求2所述基于结构相似度的高效视频编码感知码率控制优化方法,其特征在于:所述步骤1.1中的目标码率TCurrPic采用下式计算:其中TGOP表示当前图像组的目标码率,CodedGOP表示当前图像组中已编码帧所用的比特数,ω是每一幅图像在当前图像组中比特分配的权重,NotCodedPictures表示当前图像组中没有编码的图像。4.根据权利要求2所述基于结构相似度的高效视频编码感知码率控制优化方法,...

【专利技术属性】
技术研发人员:解伟赵会玲王琳李小雨张若璠王宇鹏黄承恺王雪旸
申请(专利权)人:国家广播电影电视总局广播科学研究院北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1