一种用于机器视频编码的快速VVC帧内编码方法技术

技术编号：37845257 阅读：10 留言：0更新日期：2023-06-14 22:29

本发明专利技术属于视频压缩编解码技术领域，具体为一种用于机器视频编码的快速VVC帧内编码方法。本发明专利技术首先使用神经网络提取具有不同形状的编码块(CU)的特征，然后设计基于方向梯度直方图(HOG)的快速算法，包括：计算编码块的梯度直方图值：计算每个像素点的梯度幅值、梯度角度，建立角度模式和HOG区间之间的关系；对区域进行区间划分，计算最大区间占所有区间的比值Q；设置阈值W，通过比较比值Q与阈值W的关系，选择最佳模式；本发明专利技术用于新一代通用视频编码标准(VVC)帧内机器的视频编码，以克服耗时问题，同时保持编解码器视觉任务的性能。同时保持编解码器视觉任务的性能。同时保持编解码器视觉任务的性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于机器视频编码的快速VVC帧内编码方法

[0001]本专利技术属于视频压缩编解码
，具体涉及机器视频编码的快速VVC帧内编码方法。

技术介绍

[0002]诸如高效视频编码(HEVC)和通用视频编码(VVC)的视频编码方法已经出现，以满足对具有高分辨率和高帧率的视频的需求。然而，编解码器中的视频流是为了满足人类的感知需求而提出的，不适用于图像分类、对象检测和语义分割等视觉任务。最近的许多工作都使用编码块CU进行机器视频编码的特征提取。2022年Mack等人提出用SIFT特征算子来从原始视频中提取，以将残余特征数据与机器视频编码(VCM)的压缩视频一起传输，从而提升机器视频编码性能。2022年，卢方等人使用图像预处理方法来最小化机器视觉任务(如图像分类和对象检测)的失真，进一步提升机器视频编码性能。但是，神经网络通常需要很多时间来完成正向过程，这对于机器视频编码来说非常耗时。
[0003]最近的许多工作集中于VVC的快速帧内编码，它使用快速模式和分区决策。杨浩等人提出将梯度下降研究用于快速模式决策。分析了相邻块的最佳模式与在粗略模式决策(RMD)过程中选择的模式之间的相关性，这是为了终止预测模式决策过程而提出的。对于占用基本时间比的快速分割，研究了许多加快VVC帧内编码的工作。范益波等人通过方差和梯度降低了VVC帧内编码中快速分割的复杂性。因此，VCM中的快速算法仍然需要研究以加快编码过程。为了解决视觉任务中传统编解码器的失配问题以及神经网络正向过程的耗时操作，本文提出了一种基于HOG的VCM快速VV...

【技术保护点】

【技术特征摘要】
1.一种适应于机器视频编码的快速VVC帧内编码方法，是基于梯度直方图(HOG)算子的，其特征在于，具体步骤如下：(一)计算编码块(CU)的梯度直方图(HOG)值；包括计算每个像素点的梯度幅值、梯度角度，来建立角度模式和HOG区间之间的关系；计算编码块(CU)中每一个像素点I(x,y)的梯度的幅值G(x,y)，由横向梯度G
x
(x,y)和纵向梯度G
y
(x,y)两部分构成：G
x
(x,y)＝I(x+1,y)
‑
I(x
‑
1,y)，
ꢀꢀꢀꢀ
(1)G
y
(x,y)＝I(x,y+1)
‑
I(x,y
‑
1)，
ꢀꢀꢀꢀ
(2)G(x,y)＝G
x
(x,y)2+G
y
(x,y)2，
ꢀꢀꢀꢀꢀꢀꢀꢀ
(3)梯度的角度θ(x,y)公式为：(二)划分区间利用梯度直方图(HOG)区间与编码标准VVC在帧内预测编码模块中65个角度模式建立对应的关系，具体将弧度平均分成16个区间，每个区间的角度都是按照其角度分到对应的区间内，具体的对应表如表1：表1弧度和角度模式对应关系表(三)计算最大区间占所有区间的比值Q；对于65个角度模式按照其角度值对应16个区间中的某一个区间，即弧度平均分成16个区间，每个区间的角度都是先计算每个区间内所有梯度幅值和，再计算所有区间的梯度幅值之和SUM；设区间P拥有最大的梯度值T:T＝max(x
i
(i＝1,2,
…
,16))，
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)Q＝T/SUM，
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)x
i
表示16个区间梯度的幅值，Q代表最大区间所拥有的幅值与16个区间梯度幅值和的比值；(四)进行模式选择设置阈值W，作为调控最大梯度幅值所占的比例，也就是判断当前编码块CU是否平滑，最大梯度幅值所占比例越大，则表明当前编码块CU的纹理不平滑而且朝向最大幅值所对应的梯度方向；
如果Q的值小于W，使用空间域信息作为参考信息；由于待编码块上、下、左、右各有一个编码块，待编码的左块和上块作为编码块参考块；利用空间相关性来进行模式选择：如果左面的编码块CU和上面的编码块CU模式相同，则最终的模式为左、上面编码块CU的模式；反之，对最大区间内的角度模式、编码块DC和平面模式进行率失真(RDO)优化运算，拥有最小RDO值的模式为最佳模式，结束模式选择的过程；如果左侧和上部CU模式为DC，将DC设置为最终模式。2.根据权利要求1所述的快速VVC帧内编码方法，其特征在于，所述对于65个角度模式按照其角度值对应16个区间中的某一个区间，即弧度平均分成16个区间，每个区间的角度都是具体地，65个角度模式按照其角度分到对应的区间内，具体对应关系为：a.区间...

【专利技术属性】
技术研发人员：范益波，苟傲睿，殷海兵，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人