确定图片预测模式的方法、装置、电子设备和介质制造方法及图纸

技术编号:33460386 阅读:22 留言:0更新日期:2022-05-19 00:41
本公开提供了一种确定图片预测模式的方法、装置、电子设备和介质,具体涉及云计算技术领域,尤其涉及视频云处理技术领域。确定图片预测模式的方法包括:针对图片中的当前编码单元,确定与当前编码单元相对应的预取块;基于预取块的预取数据,获取当前编码单元的第一数据和第二数据;以及根据第一数据、第二数据和指示信息,确定用于当前编码单元的预测模式,其中,指示信息指示了当前编码单元的相邻块。指示信息指示了当前编码单元的相邻块。指示信息指示了当前编码单元的相邻块。

【技术实现步骤摘要】
确定图片预测模式的方法、装置、电子设备和介质


[0001]本公开涉及云计算
,尤其涉及视频云处理
,具体涉及一种确定图片预测模式的方法、装置、电子设备和介质。

技术介绍

[0002]在视频编码中,为了消除图片中样本之间的相关性,应用预测编码。预测编码包括帧内预测(intra)和帧间预测(inter)。视频编码标准通常以块为基础进行预测编码。例如,在高效率视频编码HEVC(High Efficiency Video Coding)中,以编码单元(coding unit,CU)为单位决定预测模式,即,决定应用帧内预测还是帧间预测。因此,编码器需要计算每种预测模式下的成本(例如,率失真成本),并选择与最小成本相对应的预测模式作为当前CU的预测模式。该过程会产生大量计算,严重降低了编码速度。

技术实现思路

[0003]本公开提供了一种确定图片预测模式的方法、装置、电子设备和介质。
[0004]根据本公开的一方面,提供了一种确定图片预测模式的方法,包括:
[0005]针对图片中的当前编码单元,确定与当前编码单元相对应的预取块;
[0006]基于预取块的预取数据,获取当前编码单元的第一数据和第二数据;以及
[0007]根据第一数据、第二数据和指示信息,确定用于当前编码单元的预测模式,其中,指示信息指示了当前编码单元的相邻块。
[0008]根据本公开的另一方面,提供了一种确定图片预测模式的装置,包括:
[0009]第一确定模块,针对图片中的当前编码单元,确定与当前编码单元相对应的预取块;
[0010]获取模块,基于预取块的预取数据,获取当前编码单元的第一数据和第二数据;以及
[0011]第二确定模块,根据第一数据、第二数据和指示信息,确定用于当前编码单元的预测模式,其中,指示信息指示了当前编码单元的相邻块。
[0012]根据本公开的另一方面,提供了一种电子设备,包括:
[0013]至少一个处理器;以及
[0014]与所述至少一个处理器通信连接的存储器;其中,
[0015]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行根据本公开的一方面的方法。
[0016]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开的一方面的方法。
[0017]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开的一方面的方法。
[0018]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特
征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0019]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0020]图1是将CTU递归地划分为CU的四叉树结构和将CU划分为PU的候选划分方式的示意图;
[0021]图2是根据本公开实施例的确定图片预测模式的方法的流程图;
[0022]图3是根据本公开实施例的根据第一数据、第二数据和指示信息,确定用于当前编码单元的预测模式的过程的示意性框图;
[0023]图4是根据本公开实施例的确定图片预测模式的装置的示意图;以及
[0024]图5示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
[0025]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0026]在HEVC中,首先将输入视频序列中的每个图片划分为编码树单元(coding tree unit,CTU),然后根据四叉树结构将CTU递归地划分为编码单元(coding unit,CU)。此后,将每个CU进一步划分为预测单元(prediction unit,PU),并以PU为单位应用预测。生成预测残差之后,根据进一步的残差四叉树将每个CU细分为变换单元(transform unit,TU),并以TU为单位应用变换。在HEVC中,以CU为单位决定预测模式,即,决定应用帧内预测还是帧间预测,并决定将每个CU划分为PU的划分模式。因此,编码器需要计算每种预测模式及划分模式下的成本(例如,率失真成本),并选择与最小成本相对应的预测模式和划分模式作为当前CU的预测模式。该过程产生大量计算,严重降低了编码速度。
[0027]图1是将CTU递归地划分为CU的四叉树结构和将CU划分为PU的候选划分方式的示意图。
[0028]在视频编码中,输入视频序列由一系列图片(或者称为帧,以下二者可互换使用)组成。图片可以包含若干颜色分量,例如对于彩色图片,包含亮度分量Y和色度分量Cb、Cr,而对于单色图片,则仅包含亮度分量Y。
[0029]在基于块的编码方案(例如,HEVC)中,首先将每个图片划分为大小相同的CTU,然后利用四叉树结构将每个CTU递归地划分为一个或多个CU。CTU的大小例如可以为8
×
8、16
×
16、32
×
32和64
×
64。在四叉树结构中,以CTU为根节点,其初始深度为0。随着划分的进行,深度增加,块大小在水平和垂直方向上分别减少为父节点的一半,四叉树划分直到到达作为叶节点的CU时结束,如图1右侧所示。相应地,CU的大小例如可以为8
×
8、16
×
16、32
×
32和64
×
64。
[0030]编码器以CU为单位决定预测模式,即,当前CU使用帧内预测还是帧间预测,并进一步将CU划分为PU,以PU为单位执行预测,从而得到当前CU的预测残差。
[0031]在当前CU采用帧内模式的情况下,可用的候选划分方式包括PART_2N
×
2N和PART_
N
×
N。PART_2N
×
2N是指将当前CU划分为一个PU来执行预测,或者换言之,将当前CU作为PU执行预测。PART_N
×
N是指将当前CU均匀地划分为四个PU,并以每个PU为单位执行预测,其中,每个PU在水平和垂直方向上的大小分别为当前CU的一半,如图1左侧所示。在当前CU采用帧内模式的情况下,仅在当前CU大小为预设的最小CU大小时,需要确定将CU划分为PU的划分方式,否则将CU划分为PU的划分方式默认地设置为PART_2N
×
2N。
[0032]在当前CU未采用帧内模式的情况下,可能对当前CU应用跳过(skip)帧间模式、合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种确定图片预测模式的方法,包括:针对所述图片中的当前编码单元,确定与所述当前编码单元相对应的预取块;基于所述预取块的预取数据,获取所述当前编码单元的第一数据和第二数据;以及根据所述第一数据、所述第二数据和指示信息,确定用于所述当前编码单元的预测模式,其中,所述指示信息指示了所述当前编码单元的相邻块。2.根据权利要求1所述的方法,还包括:确定所述相邻块的数量;确定所述相邻块中采用帧内预测模式的相邻块的数量;以及基于所述相邻块的数量和所述相邻块中采用帧内预测模式的相邻块的数量,确定所述指示信息。3.根据权利要求1或2所述的方法,其中,所述根据所述第一数据、所述第二数据和指示信息,确定用于所述当前编码单元的预测模式包括:基于所述第一数据、所述第二数据和所述指示信息,在确定所述当前编码单元满足第一预设条件的情况下,确定帧内预测模式作为用于所述当前编码单元的预测模式。4.根据权利要求3所述的方法,还包括:在所述第一数据大于所述第二数据与第一权重的加权值、所述第一数据大于第一阈值且所述指示信息为第一值的情况下,确定所述当前编码单元满足所述第一预设条件。5.根据权利要求4所述的方法,还包括:基于所述第一数据、所述第二数据和所述指示信息,在确定所述当前编码单元不满足所述第一预设条件的情况下,确定所述当前编码单元在第一类型帧间预测模式下的第一帧间率失真成本及在第二类型帧间预测模式下的第二帧间率失真成本;确定所述第一帧间率失真成本和所述第二帧间率失真成本中较小的帧间率失真成本,作为第一预帧间率失真成本;以及将所述第一类型帧间预测模式和所述第二类型帧间预测模式中与所述第一预帧间率失真成本相对应的帧间预测模式作为第一预帧间预测模式。6.根据权利要求5所述的方法,还包括:基于所述第一数据、所述第二数据和所述第一预帧间率失真成本,在确定所述当前编码单元满足第二预设条件的情况下,将所述第一预帧间率失真成本作为最优帧间率失真成本。7.根据权利要求6所述的方法,还包括:在所述第一数据大于所述第二数据与第二权重的加权值、所述第一数据大于第二阈值且所述第一数据大于所述第一预帧间率失真成本与第三权重的加权值的情况下,确定所述当前编码单元满足所述第二预设条件。8.根据权利要求7所述的方法,其中,所述第二权重小于所述第一权重,并且所述第二阈值小于所述第一阈值。9.根据权利要求6所述的方法,其中,在确定所述当前编码单元满足第二预设条件的情况下,还包括:基于所述第一数据、所述第二数据和所述最优帧间率失真成本,在确定所述当前编码单元满足第三预设条件的情况下,选择第一预帧间预测模式,作为用于所述当前编码单元
的预测模式。10...

【专利技术属性】
技术研发人员:张旭
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1