一种基于GAN的HEVC压缩视频视觉感知提升方法技术

技术编号：32651501 阅读：13 留言：0更新日期：2022-03-17 10:57

本发明专利技术提出了一种基于GAN的HEVC压缩视频视觉感知提升方法。GAN提供了一种接近感知

全部详细技术资料下载

【技术实现步骤摘要】
一种基于GAN的HEVC压缩视频视觉感知提升方法

[0001]本专利技术涉及视频编码领域中的视频质量提升方法的研究，尤其是涉及一种基于GAN的HEVC压缩视频视觉感知提升方法的方法。

技术介绍

[0002]HEVC作为主流视频编码标准，虽然能取得很好的压缩效率，但在压缩和传输过程中不可避免会造成视频质量损失，这种损失既指客观质量上的失真，也包含主观视觉效果的模糊。图像恢复算法通常通过一些失真来度量，例如：PSNR、SSIM、IFC、VIF，这些失真度量因为要使用原图进行评估称为全参考指标。但在实际传输任务中，原图像并不一定可获得，只能通过需要处理的降质图像进行重建效果评估，这种评估失真的方式称为无参考指标，例如量化视觉感知质量的人类意见评分。实际客观失真度量和视觉感知质量并不是一一对应的，具体来说，随着平均失真的减少，能正确区分是图像恢复算法的输出或者真实图像输出的最佳概率反而会增加(表明是为更差的视觉感知质量)，这个结果对于任何失真度量都是满足的，不仅仅是常用压缩性能评价标准指标PSNR和SSIM，GAN网络还提供了一种接近感知质量和失真度量平衡的原则。
[0003]GAN网络的对抗性损失能很好地学习图像分布间的映射，提高视觉效果，基于GAN网络进行的图像超分辨率重建工作取得了较好的视觉效果。同时在压缩伪影去除的工作中，GAN被证明具有减少伪影的强大能力。现今有学者提出了使用生成对抗框架训练的前馈全卷积残差网络模型，并可以通过优化结构相似度来进行训练，所提GAN能够生成具有更多真实感细节的图像。还有通过GA...

【技术保护点】

【技术特征摘要】
1.一种基于GAN的HEVC压缩视频视觉感知提升方法，其特征在于：(1)生成图像残差网络；(2)将残差块个数n分别设置为5、7、9、11、13，其中9个残差块为生成器所选残差结构；(3)判别器不变并且生成器中其余层结构不变，分别将生成器中残差块设置为以上5个深度并训练，用5个残差深度下GAN的最佳模型重建压缩视频序列foreman_352
×
288并计算感知指数PI值(在本发明基于GAN的HEVC压缩视频视觉感知提升方法研究中，所提GAN框架生成器中的残差块设置为9层时，网络能获得更加丰富的纹理信息，能较好地去除视觉感知上的压缩伪影)；(4)本改进GAN框架中生成器G采用9层残差网络，能提取更能表达重建视频帧信息的特征并加快网络收敛；在残差网络前进行下采，Convolution-BatchNorm-Relu结构的下采层可以表示为公式(1)，
↓2表示该层卷积步长为2，旨在实现空间分辨率的下采，减少网络参数，并结合在残差网络中使用dropout层按照概率丢掉部分神经元，避免网络参数过多造成过拟合；最后为保证输入视频帧和重建帧尺寸一致，采用逆卷积层恢复到原始尺寸；同理，Convolution-BatchNorm-Relu结构的逆卷积层可以表示为(2)式，其中
↑2表示该层逆卷积步长为2；步长为2；本发明所提生成器G的配置如表1所列，结构层公式表示为：F0(Y)＝Y
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)(3)(3)(3)F
15
＝W
15
·
F
14
(Y)+B
15
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)F
16
＝Tanh(F
15
(Y))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)其中，Y为已编码视频帧，W
i
和B
i
分别为第i层的权重和偏置；本发明所提判别器D的配置如表2所列，结构层公式表示为：F0(Y)＝Y
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)F1(Y)＝LeakyRelu(W1·
F0(Y)+B1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)F
i
(Y)＝F
NormLeaky
(Y),i＝{2,3,4}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)F5＝W5·
F4(Y)+B5ꢀꢀꢀꢀꢀꢀꢀ...

【专利技术属性】
技术研发人员：何小海，王婷，汤博文，吴晓红，熊淑华，陈洪刚，滕奇志，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人