一种用于加快视频编码的编码单元划分方法及装置制造方法及图纸

技术编号:36606982 阅读:24 留言:0更新日期:2023-02-04 18:30
本发明专利技术公开了一种用于加快视频编码的编码单元划分方法及装置。所述装置包括编码模块、存储模块、运算模块和逻辑控制模块。所述方法利用该装置,通过对编码图像的每个CTU,H.266/VVC使用四叉树、三叉树和二叉树等多类型树,从而递归地划分为不同大小的编码单元。在进行RDO过程前,为了减少编码复杂度,使用SVM模型对编码块的二叉、三叉划分方向进行预测并跳过划分,对于处于分类边界的样本,使用完整的RDO过程以提高编码效率。本发明专利技术所提出的方法能够在保证编码效率的情况下,有效降低编码时间复杂度。编码时间复杂度。编码时间复杂度。

【技术实现步骤摘要】
一种用于加快视频编码的编码单元划分方法及装置


[0001]本专利技术涉及视频编码
,具体涉及一种用于加快视频编码的编码单元划分方法及装置。

技术介绍

[0002]近年来,随着高清和超高清视频技术逐渐进入人们的视野,各式各样的视频应用不断涌现,视频应用的多样化和高清化趋势对视频编码性能提出了更高的要求。与现有的视频编码标准相比,H.266/VVC标准考虑了更多的视频格式和内容,具有更好的编码性能。与H.265/HEVC标准相比,同样编码质量下H.266/VVC平均可以节省50%左右的码率。H.266/VVC标准能变现出优秀的性能,原因是采用了一系列新技术,其中最有效但同时也最耗时的过程是具有嵌套多类型树(MTT)编码结构的四叉树。为了更加灵活高效地表示视频内容,H.266/VVC通过率失真优化(RDO),选择四叉树(QT)、三叉树(TT)和二叉树(BT)等多类型树中的一种,将CTU递归地划分为编码单元(CU)的方式。在RDO过程中,需要计算每种划分模式下的率失真代价,再根据率失真代价选择最优划分结果,因此虽然这种编码结构提高了编码的压缩性能,但由于遍历率失真优化过程,使得编码复杂度大大增加。如何在维持编码性能的同时减少编码的时间复杂度,成为视频压缩领域的一个研究方向。

技术实现思路

[0003]针对现有技术的不足,本专利技术提出了一种用于加快视频编码的编码单元划分方法及装置,对于指定大小的编码块,根据其纹理特征,利用支持向量机预测较优的划分方向,以减少RDO过程的计算次数,从而降低编码复杂度,节约编码时间。
[0004]一种用于加快视频编码的编码单元划分方法,具体包括以下步骤:
[0005]步骤一、在进行RDO过程前,首先根据编码块的大小,计算不同划分方式下子编码单元的特征值。具体地,对于32x32、32x16、16x32大小的编码块,计算二叉、三叉划分下子CU的特征值;对于8x16、16x8大小的编码块,计算二叉划分下子CU的特征值;对16x16大小的编码块,在RDO过程中跳过四叉划分;对其它大小的编码块,直接进行完整的RDO过程。
[0006]步骤二、根据步骤一得到的特征值,进行特征距离的计算,然后将特征距离作为样本,对应的编码块划分方式作为标签,建立训练数据集对支持向量机进行训练,获取支持向量机输出的垂直划分概率P
v
和水平划分概率P
h
。具体地,二叉划分下的特征距离

F
b
为:
[0007]ΔF
b
=|F
bth_0

F
bth_1
|

|F
btv_0

F
btv_1
[0008]其中,F
bth_0
、F
bth_1
表示二叉水平划分上方子CU、下方子CU特征值,F
btb_0
、F
btv_1
表示二叉垂直划分左方子CU、右方子CU特征值。
[0009]三叉划分下的特征距离

F
t
为:
[0010]ΔF
t
=|F
thh_0

F
tth_1
|+|F
tth_1

F
tth_2
|

|F
ttv_0

F
ttv_1
|

|F
ttv_1

F
ttv_2
|
[0011]其中,F
tth_0
、F
tth_1
、F
tth_2
分别表示三叉水平划分上方、中间和下方子CU特征值,F
ttv_0
、F
ttv_1
、F
ttv_2
分别表示三叉垂直划分左方、中间和右方子CU特征值。
[0012]步骤三、设置判断阈值T,计算垂直划分概率p
v
和水平划分概率P
h
的差值,并与判断阈值T进行比较:
[0013]①
当|P
v

P
h
|≤T时,不跳过划分方式;
[0014]②
当|P
v

P
h
|>T,且P
v
>P
h
时,跳过水平划分方式;
[0015]③
当|P
v

P
h
|>T,且P
v
<P
h
时,跳过垂直划分方式。
[0016]步骤四、根据步骤三的判断结果,决定相应编码块在进行RDO过程需要跳过多类型树划分方式。
[0017]进一步的,步骤一中子CU的特征值包括方差、熵和纹理对比度。
[0018]方差Var的计算公式为:
[0019][0020][0021]其中是一个子CU中所有像素值的平均值,H和W分别代表子CU的高度和宽度,x
ij
表示第i行第j个位置的像素灰度值。
[0022]熵E的计算公式为:
[0023][0024]其中p(x)表示属于第x个灰度的可能性。
[0025]纹理对比度C的计算公式为:
[0026][0027]其中δ(i,j)=|i

j|表示相邻像素之间的差异度,P
δ
(i,j)表示度差为δ的像素的分布概率。
[0028]进一步的,根据输入样本的标签,支持向量机的输出包括P
bv
和P
bh
、P
tv
和P
th
,分别表示二叉划分下进行垂直划分和水平划分的概率,以及三叉划分下进行垂直划分和水平划分的概率。
[0029]进一步的,当P
bv

P
bh
>T时,跳过二叉水平划分;当P
bh

P
bv
>T时,跳过二叉垂直划分;当P
tv

P
th
>T时,跳过三叉水平划分;当P
th

P
tv
>T时,跳过三叉垂直划分。
[0030]一种用于加快视频编码的编码单元划分装置,包括编码模块、存储模块、运算模块和逻辑控制模块,模块间直接或间接地电性连接,以实现数据的传输或交互。
[0031]所述编码模块用于针对待编码图像生成对应的编码块。
[0032]所述存储模块用于存储待编码图像和预测编码块划分方向的SVM模型。
[0033]所述运算模块用于计算编码模块生成的编码块的特征值与特征距离,并输入SVM模型预测划分方式。
[0034]所述逻辑本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于加快视频编码的编码单元划分方法,其特征在于:具体包括以下步骤:步骤一、在进行RDO过程前,首先根据编码块的大小,计算不同划分方式下子编码单元的特征值;具体地,对于32x32、32x16、16x32大小的编码块,计算二叉、三叉划分下子CU的特征值;对于8x16、16x8大小的编码块,计算二叉划分下子CU的特征值;对16x16大小的编码块,在RDO过程中跳过四叉划分;对其它大小的编码块,直接进行完整的RDO过程;步骤二、根据步骤一得到的特征值,进行特征距离的计算,然后将特征距离作为样本,对应的编码块划分方式作为标签,建立训练数据集对支持向量机进行训练,获取支持向量机输出的垂直划分概率P
υ
和水平划分概率P
h
;具体地,二叉划分下的特征距离ΔF
b
为:ΔF
b
=|F
bth_0

F
bth_1
|

|F
btυ_0

F
btυ_1
其中,F
bth_0
、F
bth_1
表示二叉水平划分上方子CU、下方子CU特征值,F
btυ_0
、F
btυ_1
表示二叉垂直划分左方子CU、右方子CU特征值;三叉划分下的特征距离ΔF
t
为:ΔF
t
=|F
thh_0

F
tth_1
|+|F
tth_1

F
tth_2
|

|F
ttυ_0

F
ttυ_1
|

|F
ttυ_1

F
ttυ_2
|其中,F
tth_0
、F
tth_1
、F
tth_2
分别表示三叉水平划分上方、中间和下方子CU特征值,F
ttυ_0
、F
ttυ_1
、F
ttυ_2
分别表示三叉垂直划分左方、中间和右方子CU特征值;步骤三、设置判断阈值T,计算垂直划分概率P
υ
和水平划分概率P
h
的差值,并与判断阈值T进行比较:

当|P
v

P
h
|≤T时,不跳过划分方式;

当|P
v

P
h
|>T,且P
v
>P
h
时,...

【专利技术属性】
技术研发人员:丁丹丹丁功春林秀均
申请(专利权)人:杭州师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1