SVC的错误隐藏方法、模型训练方法、系统及设备技术方案

技术编号：35043570 阅读：27 留言：0更新日期：2022-09-24 23:23

本申请实施例涉及技术领域，特别涉及一种SVC的错误隐藏方法、模型训练方法、系统及设备，本申请利用卷积神经网络充分提取前一帧基础层和增强层图像对中的偏移量参数，进而利用这个参数来修正当前帧的基础层图像的上采样图像，从而提升增强层错误隐藏的效果；本申请还计算前一帧的增强层图像和前一帧的基础层图像之间的残差图像，然后通过卷积神经网络融合残差图像和修正后的上采样图像，充分利用时域和空域的相关性对修正后的上采样图像进行后处理，提升了增强层错误隐藏的效果。提升了增强层错误隐藏的效果。提升了增强层错误隐藏的效果。

全部详细技术资料下载

【技术实现步骤摘要】
SVC的错误隐藏方法、模型训练方法、系统及设备

[0001]本申请实施例涉及视频编码
，尤其涉及一种SVC的错误隐藏方法、模型训练方法、系统及设备。

技术介绍

[0002]SVC（Scalable Video Coding，可伸缩编码）是视频编码的一种，该技术把视频信号编码成分层的形式，当带宽不足时只对基础层的码流进行传输和解码，但这时解码的视频质量不高。当带宽慢慢变大时，可以传输和解码增强层的码流来提升视频的解码质量。
[0003]SVC的技术应用可以分为两点，第一点是，SVC由于其特点可以适应与客户端性能受限和网络环境受限的场景。比如有些客户端会限制解码的计算复杂度，这个时候在只解码基础层也能获得一定质量的图像，也就是说客户端可以根据自己的情况来对解码复杂度和质量之间做选择，而单一流的解码就做不到这一点。另外有些网络环境会限制带宽，在使用MANE(Media
‑
aware Network element)的网络中，可以选择丢弃增强层的数据包来限制带宽和流量。总结来说，这一特点给予了终端一定选择的空间。第二点是，SVC相比于单一流传输来说有更好的抗丢包性能。一般SVC的基础层会给予更多的错码保护，所以一般假设丢包概率会比较小。由于增强层的编码参考了基础层，所以即使发生丢包也能从基础层有限的恢复，保证一定的质量。
[0004]现阶段的SVC的错误隐藏方案还存在如下技术缺陷：1)构建主要来自于经验，利用的主要是编码时的一些信息，导致错误隐藏的效果较差：2)由于使用了如运动矢量、残...

【技术保护点】

【技术特征摘要】
1.一种SVC的错误隐藏方法，其特征在于，所述错误隐藏方法包括：当目标视频的可伸缩视频编码的增强层发生丢包，获取当前帧的基础层图像、前一帧的基础层图像以及前一帧的增强层图像；根据第一卷积神经网络计算所述前一帧的基础层图像和所述前一帧的增强层图像之间的偏移量参数；对所述当前帧的基础层图像进行双线性插值上采样，得到当前帧的基础层图像的上采样图像，并根据第二卷积神经网络利用所述偏移量参数对所述当前帧的基础层图像的上采样图像进行修正，得到修正后的上采样图像；计算前一帧的增强层图像和前一帧的基础层图像之间的残差图像，并根据第三卷积神经网络利用所述残差图像和所述修正后的上采样图像，计算出当前帧的增强层图像。2.根据权利要求1所述的SVC的错误隐藏方法，其特征在于，所述根据第一卷积神经网络计算所述前一帧的基础层图像和所述前一帧的增强层图像之间的偏移量参数，包括：对所述前一帧的基础层图像进行双线性插值上采样，得到前一帧的基础层图像的上采样图像；将所述前一帧的基础层图像的上采样图像和所述前一帧的增强层图像拼接融合，得到融合图像；将所述融合图像输入至所述第一卷积神经网络中，得到所述第一卷积神经网络输出的偏移量参数；其中，所述第一卷积神经网络由线性的卷积层和PReLU激活层组成。3.根据权利要求2所述的SVC的错误隐藏方法，其特征在于，所述第二卷积神经网络为可变形卷积神经网络。4.根据权利要求1至3任一项所述的SVC的错误隐藏方法，其特征在于，所述计算前一帧的增强层图像和前一帧的基础层图像之间的残差图像，包括：将所述前一帧的增强层图像进行双线性插值上采样，得到前一帧的增强层图像的上采样图像；计算所述前一帧的增强层图像的上采样图像和所述前一帧的基础层图像之间的残差图像。5.根据权利要求4所述的SVC的错误隐藏方法，其特征在于，所述第三卷积神经网络包括第一卷积神经子网络、第二卷积神经子网络和第三卷积神经子网络，所述第一卷积神经子网络、所述第二卷积神经子网络和所述第三卷积神经子网络的网络结构相同，且所述第一卷积神经子网络由线性的卷积层和PReLU激活层组成；所述根据第三卷积神经网络利用所述残差图像和所述修正后的上采样图像，计算出当前帧的增强层图像，包括：将所述残差图像输入至所述第一卷积神经子网络，得到所述第一卷积神经子网络输出的第一子图像；将所述修正后的上采样图像输入至所述第二卷积神经子网络，得到所述第二卷积神经子网络输出的第二子图像；将所述第一子图像和所述第二子图像拼接融合，得到第三子图像；...

【专利技术属性】
技术研发人员：张昊，王照，彭春华，黄兴军，孙意翔，肖婴然，
申请(专利权)人：中南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人