基于非配对学习的提升视频清晰度的方法及装置制造方法及图纸

技术编号：30964395 阅读：9 留言：0更新日期：2021-11-25 20:31

本发明专利技术提供一种基于非配对学习的提升视频清晰度的方法及装置，包括：对于给定的低清晰度视频，选择内容相似的非配对高清晰度视频作为参考并进行降采样使其相似度相近，取高低清晰度视频关键帧中的亮度分量进行量化并随机裁切图像块，形成低清晰度

全部详细技术资料下载

【技术实现步骤摘要】
基于非配对学习的提升视频清晰度的方法及装置

[0001]本专利技术涉及一种图像处理
的方法，具体是一种基于非配对学习的提升视频清晰度的方法及装置。

技术介绍

[0002]清晰度是指在图像分辨率相同的情况下，人眼感知的物体边界轮廓、细节纹理的显著程度。一般来说，更多的局部细节纹理与更高局部对比度能够让人眼感知到更高的清晰度。现存的大量旧影视片的摄影装置质量低于当前的主流摄影装置，因此老片与现在的摄像机拍摄的视频相比，往往存在清晰度低的问题。有的老片使用胶片相机拍摄，使用扫描仪将胶片数字化的过程也可能导致清晰度降低；许多视频由于采用较低码率编码或者传播中经过多次降采样和上采样操作也导致了清晰度的降低。与当前主流的高清晰度影视剧相比，低清晰度视频会让人看不清楚物体的边缘轮廓和纹理细节，从而严重影响人眼的主观视觉体验。
[0003]以往的大多数深度学习方法基于配对学习训练神经网络进行视频增强，依靠真实高质量图像与对其施加了某种图像退化模型得到的低质量图像配对进行学习，因此基于配对学习训练的网络往往只针对某个图像退化模型造成的损伤进行修复。基于配对学习的神经网络提高真实低质量视频清晰度存在两个问题：第一个问题为真实低清晰度视频可能存在多种退化原因，如果根据每一种退化原因训练一个增强网络会造成较高的方法复杂度，但多个增强网络可能会相互影响导致增强后的视频出现伪影；第二个问题为难以判断真实低清晰度视频的退化原因，因此只能多次尝试使用不同的网络进行增强并人工判断增强结果的好坏，需要消耗大量人力和时间且不一定能够获得较好...

【技术保护点】

【技术特征摘要】
1.一种基于非配对学习的提升视频清晰度的方法，其特征在于，包括：S1：构建非配对数据集：对于给定的低清晰度视频，选择内容相似的非配对高清晰度视频作为参考并进行降采样使其相似度相近，取低清晰度视频以及降采样后的高清晰度视频关键帧中的亮度分量进行量化并随机裁切图像块，形成低清晰度
‑
非配对高清晰度图像数据集作为训练数据集；对于给定的低清晰度视频，再选择其中连续的一段视频帧图像，取其亮度分量进行量化后作为测试数据集；S2：建立基于卷积神经网络的低清晰度图像生成器、低清晰度图像判别器和高清晰度图像生成器，构成生成对抗网络，其中，所述低清晰度图像生成器用于将高清晰度图像转换为低清晰度图像；将高清晰度图像输入所述低清晰度图像生成器，输出假的低清晰度图像；所述低清晰度图像判别器用于区分输入图像是真实的低清晰度图像还是低清晰度图像生成器输出的假的低清晰度图像；所述高清晰度图像生成器用于将转换后的低清晰度图像再转换为高清晰度图像；将假的低清晰度图像输入所述高清晰度图像生成器，重建出高清晰度图像；S3：建立由对抗损失、高清晰度图像重建损失以及同一性损失构成的综合损失函数，以最小化损失函数为目标，使用所述训练数据集优化更新所述生成对抗网络，训练该生成对抗网络，使得低清晰度图像生成器、高清晰度图像生成器都能实现更好的低高清晰度图像域之间的相互映射；S4：训练完成后，将所述测试数据集输入到所述高清晰度图像生成器中，并与原图像色度信号结合，重建出高清晰度图像。2.根据权利要求1所述的基于非配对学习的提升视频清晰度的方法，其特征在于：所述构建非配对数据集，其中：建立数据集时，对低清晰度视频选择对应的主体内容相似的非配对高清晰度视频，并通过双三次插值将高清晰度视频降采样使其分辨率与低清晰度视频分辨率高度相同；从低高清晰度视频的关键帧中选取包含相关主体内容的视频帧图像，选取视频图像的数字亮度信号并将其归一化为亮度信号，形成单通道的亮度视频帧图像组成非配对的低高清晰度图像数据集；在训练过程中将图像裁切为图像块并随机水平翻转后再用于训练，非配对的低高清晰度图像数据集中低清晰度图像与高清晰度图像的数量可以不同。3.根据权利要求2所述的基于非配对学习的提升视频清晰度的方法，其特征在于：所述数字亮度信号d
′
Y
通过以下公式归一化为亮度信号化为亮度信号而后，再将亮度信号截断为[0,1]范围内的亮度信号e
′
Y
：e
′
Y
即为数据集中用于训练与测试的亮度信号。4.根据权利要求1所述的基于非配对学习的提升视频清晰度的方法，其特征在于：所述低清晰度图像生成器与所述高清晰度图像生成器具有相同的结构，其中：生成器先通过一个7
×
7的卷积层提取特征，然后经过两个步长为2的卷积层降采样，再
通过9个残差块，然后通过两个转置卷积上采样为原始分辨率，最后经过一个7
×
7的卷积层输出最后的结果；生成器使用实例归一化，同时，生成器中除最后一层输出层使用双曲正切函...

【专利技术属性】
技术研发人员：宋利，陈晋进，解蓉，甘文耀，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人