一种基于集成学习的帧间图像编码方法技术

技术编号:36405790 阅读:31 留言:0更新日期:2023-01-18 10:14
本发明专利技术公开了一种基于集成学习的帧间图像编码方法,涉及图像处理技术领域,包括步骤:提取图像组中帧内编码帧在编码划分后各编码块的特征向量以及对应的编码划分模式作为特征训练集;基于特征训练集和初始样本权值对弱分类器进行训练,并获取当前迭代次数的弱分类器系数;根据各迭代次数下的弱分类器和弱分类系数合成强分类器;通过强分类器对目标帧间图像进行各编码深度下对应编码块的编码划分模式预测。本发明专利技术通过将各迭代下的弱分类器进行融合获得强分类器,通过这种强化融合的方式提高分类精度,在保证编码质量的同时大大降低编码计算复杂度。码计算复杂度。码计算复杂度。

【技术实现步骤摘要】
一种基于集成学习的帧间图像编码方法


[0001]本专利技术涉及图像处理
,具体涉及一种基于集成学习的帧间图像编码方法。

技术介绍

[0002]在视频编码标准中,帧是块划分的基本单位,在对一个双向预测内插编码帧(B帧)进行编码时,每一帧图像首先会被分为若干个编码树单元(Coding Tree Unit,CTU)再基于CTU进行下一步划分,视频编码标准将CTU划分为编码单元(Coding Unit,CU)之后可以直接进行预测和变换。其中,VVC编码标准使用嵌套多叉树的四叉树(Quad

Tree with nested MultiType

Tree,QTMTT)结构对CTU进行划分。由于VVC采用了更加灵活的划分方式,随着划分层数的加深,率失真优化(Rate Distortion Optimization,RDO)需要遍历树的分支急剧增多,而每个分支的节点都要被计算,因此编码运算量大幅度增加。
[0003]在保证视频质量基本不变,编码性能损失较小的情况下,如何大幅度减少VVC的运算复杂度成了当前视频编码研究者的重点研究方向。

技术实现思路

[0004]为了在高质量编码的前提下进一步提高视频编码的效率,本专利技术提出了一种基于集成学习的帧间图像编码方法,包括步骤:S1:提取图像组中帧内编码帧在编码划分后各编码块的特征向量以及对应的编码划分模式作为特征训练集;S2:基于特征训练集和初始样本权值对弱分类器进行训练,并获取当前迭代次数的弱分类器系数;S3:判断迭代次数是否达到最大迭代次数,若是,进入下一步骤,若否,更新样本权值进入下一次迭代并放回S2步骤;S4:根据各迭代次数下的弱分类器和弱分类系数合成强分类器;S5:提取图像组中目标帧间图像当前编码深度下各编码块的特征训练集;S6:通过强分类器对特征训练集进行分析,获取当前编码深度对应编码块的编码划分模式分类结果,并在达到最大编码深度前进入下一编码深度并返回S5步骤;S7:根据各编码深度下的各编码块的编码划分模式分类结果进行帧间图像编码。
[0005]进一步地,所述S1步骤中,特征向量由同一编码块的率失真代价、纹理复杂度、预测残差共同组成。
[0006]进一步地,所述S2步骤中,弱分类器为分类与回归树分类器。
[0007]进一步地,所述S2步骤中,弱分类器以达到预设分类误差率区间为训练指标进行训练。
[0008]进一步地,所述S2步骤中,弱分类器的公式表达为,其训练表示为如下公式:
式中,i为取值范围为1至n的帧内编码帧中各编码块的编号,n为帧内编码帧中编码块的总数,为编号为i的编码块的编码划分模式,为最大编号n的编码块的编码划分模式,Y为以编号1至k代表的k种编码划分模式的集合,S为特征训练集,为编号为i的编码块的特征向量,为最大编号n的编码块的特征向量,为通过对所有编码块的弱分类分类结果进行以预设分类误差率区间为目标训练后的弱分类器,t为取值范围为1至m的迭代次数,m为最大迭代次数,为第t次迭代的分类误差率,为编号为i的编码块的样本权值,为指示符函数。
[0009]进一步地,所述S2步骤中,弱分类器系数通过如下公式获取:式中,为第t次迭代的弱分类器系数,为第t次迭代的分类误差率,k为当前编码标准中编码划分模式的种类数。
[0010]进一步地,所述S3步骤中,样本权值的更新表示为如下公式:式中,公式左边的为更新后编号为i的编码块下一迭代的样本权值,公式右边的为更新前编号为i的编码块当前迭代的样本权值,为第t次迭代的弱分类器系数。
[0011]进一步地,所述S4步骤中,强分类器的合成表示为如下公式:式中,为强分类器。
[0012]与现有技术相比,本专利技术至少含有以下有益效果:本专利技术所述的一种基于集成学习的帧间图像编码方法,通过对帧内编码帧自身携带的不同编码深度下的编码划分信息,进行编码划分与编码划分相关特征的弱分类训练,并通过多次迭代,将各迭代下的弱分类器进行融合获得强分类器,通过这种强化融合的方式提高分类精度。这样一来,通过强分类器对同一图像组中的其它帧间图像进行编码换分,无需通过计算目标编码块不同划分模式下的率失真代价并进行比较,只需计算当前编码块的特征向量带入强分类器即可得到准确的编码划分判定,在保证编码质量的同时大大降低编码计算复杂度。
附图说明
[0013]图1为一种基于集成学习的帧间图像编码方法的步骤图;图2为VVC编码标准下的编码划分示意图。
具体实施方式
[0014]以下是本专利技术的具体实施例并结合附图,对本专利技术的技术方案作进一步的描述,但本专利技术并不限于这些实施例。
[0015]实施例一多叉树划分技术应用于视频编码中的帧内预测编码过程,是对CTU进行划分时采用的树形结构遍历技术。此处以VVC视频编码标准为例对多叉树进行说明,CTU的默认尺寸为128
×
128像素,多叉树划分就是对每个CTU按照“Z”字形顺序进行划分,划分为多个CU。在传统的编码划分判定方式中,在每一次划分时,编码器都会尝试当前编码块所有可能的划分方式,并根据率失真代价进行最佳编码划分模式的选择。可以看出,传统的编码划分判定方式,需要耗费大量的时间进行试错下的率失真代价计算,因此整体的编码效率仍旧不算高,为此,如图1所示,本专利技术提出了一种基于集成学习的帧间图像编码方法,其主要由以下一个步骤组成:S1:提取图像组中帧内编码帧在编码划分后各编码块的特征向量以及对应的编码划分模式作为特征训练集;S2:基于特征训练集和初始样本权值对弱分类器进行训练,并获取当前迭代次数的弱分类器系数;S3:判断迭代次数是否达到最大迭代次数,若是,进入下一步骤,若否,更新样本权值进入下一次迭代并放回S2步骤;S4:根据各迭代次数下的弱分类器和弱分类系数合成强分类器;S5:提取图像组中目标帧间图像当前编码深度下各编码块的特征训练集;S6:通过强分类器对特征训练集进行分析,获取当前编码深度对应编码块的编码划分模式分类结果,并在达到最大编码深度前进入下一编码深度并返回S5步骤;S7:根据各编码深度下的各编码块的编码划分模式分类结果进行帧间图像编码。
[0016]首先,为了能够顺利将编码划分模式与分类问题联系起来,本专利技术先是选用弱分类器(本实施例中选用Classification and regression tree,CART分类与回归树)为分类任务提供一个训练方向,同时降低运行以及计算成本。而为了训练弱分类器,本专利技术则是充分利用图像组(GOP)中帧内编码帧(I帧)含有全部编码信息的特点,对其进行编码划分特征信息的提取。在这里,主要选择由率失真代价、纹理复杂度、预测残差组成的特征向量以及相对应编码块的编码划分模式。其中i为取值范围为1至n的帧内编码帧中各编码块的编号,n为帧内编码帧中编码块的总数,即为编号为i的编码块的特征向量。
[0017]如图2所示,本专利技术以VVC编码标准为例,在该编码标准下,一共含有6种编码划分模式,它们分别为:不划分(NS)、四叉树划分(Q本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于集成学习的帧间图像编码方法,其特征在于,包括步骤:S1:提取图像组中帧内编码帧在编码划分后各编码块的特征向量以及对应的编码划分模式作为特征训练集;S2:基于特征训练集和初始样本权值对弱分类器进行训练,并获取当前迭代次数的弱分类器系数;S3:判断迭代次数是否达到最大迭代次数,若是,进入下一步骤,若否,更新样本权值进入下一次迭代并放回S2步骤;S4:根据各迭代次数下的弱分类器和弱分类系数合成强分类器;S5:提取图像组中目标帧间图像当前编码深度下各编码块的特征训练集;S6:通过强分类器对特征训练集进行分析,获取当前编码深度对应编码块的编码划分模式分类结果,并在达到最大编码深度前进入下一编码深度并返回S5步骤;S7:根据各编码深度下的各编码块的编码划分模式分类结果进行帧间图像编码。2.如权利要求1所述的一种基于集成学习的帧间图像编码方法,其特征在于,所述S1步骤中,所述特征向量由同一编码块的率失真代价、纹理复杂度、预测残差共同组成。3.如权利要求1所述的一种基于集成学习的帧间图像编码方法,其特征在于,所述S2步骤中,所述弱分类器为分类与回归树分类器。4.如权利要求1所述的一种基于集成学习的帧间图像编码方法,其特征在于,所述S2步骤中,所述弱分类器以达到预设分类误差率区间为训练指标进行训练。5.如权利要求4所述的一种基于集成学习的帧间图像编码方法,其特征在于,所述S2步骤中,所述弱分类器的公式表达为,...

【专利技术属性】
技术研发人员:蒋先涛柳云夏郭咏梅郭咏阳
申请(专利权)人:宁波康达凯能医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1