一种基于深度学习的视频超分辨率重建方法技术

技术编号：19936020 阅读：43 留言：0更新日期：2018-12-29 05:12

本发明专利技术公开了一种基于深度学习的视频超分辨率重建方法，其技术关键在于（1）给定同一镜头下连续图像，网络预测更清晰的视频帧图像；（2）采用双向循环神经网络和深度3D反向投影网络；（3）本发明专利技术将两个网络合并成一个网络，此网络作为本发明专利技术的深度学习的视频超分辨率重建的网络（4）训练数据为有标签，将处理的数据视频帧通过此网络得到损失函数。本发明专利技术最终目标是输入低分辨率视频帧经过双向循环网络预测视频帧的时间和空间上的信息，经过3D投影网络再预测视频帧的细节信息，经过反复训练得到一个最优模型，这个模型应用于去除相机的抖动、物体快速运动的模糊、失焦模糊、镜头光学模糊、景深变化、压缩失真和噪声等降质因素的影响。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的视频超分辨率重建方法
本专利技术属于视频处理领域，尤其涉及一种基于深度学习的视频超分辨率重建方法。
技术介绍
视频超分辨率(superresolution,SR)是从一个低分辨率视频得到高分辨率视频的过程，该技术主要被用于对视频空间分辨率的增强，其可以突破原有的系统成像硬件条件的限制，重新获得的高分辨率视频具有更高的分辨率，更多的细节信息，更高质量的画质的特点，是目前获取高精度视频的最有效、最低成本的途径之一。视频获取过程中，受成像条件和成像方式等因素的限制，成像系统通常并不能获取原始场景中的所有信息，在成像过程中会受到震动、变形、模糊、下采样和噪声等诸多因素的影响，从而造成获取的视频质量下降。因此，在不改变成像系统硬件设备的前提下，有效提高所获取的视频质量，一直以来都是成像
所致力解决的核心问题。该项技术的研究具有重要的意义。实际生活中对模糊视频的处理已经迫在眉睫，不管是相机抖动，雾霭，噪声，本身分辨率不够等多种原因，都需要一种有效的方法将不清晰的模糊的视频变为清晰的视频。一种方法是提高视频帧的分辨率，另一种就是提高视频帧的质量(类似photoshop中图像的品质)。由此也产生2个不同的研究方向：一个是超分辨率方向，一个是解模糊方向。超分辨率实现技术的方法有多种，这里我们阐述几个目前最常使用的方法：1)基于插值。该方法是目前超分辨率研究中最直观的方法。通过对该视频的多帧进行比较估计，得到它们之间的相对关系信息，以此获得高分辨率视频帧在非均匀间距采样点上的像素值。然后通过非均匀插值的方法，经过一定的插值，就可以得到一幅高分辨率的视频...

【技术保护点】
1.一种基于深度学习的视频超分辨率重建方法，其特征在于包括如下步骤：步骤1：训练与测试数据准备：(1)公开数据集采集：采集两组内容相同的公开视频M对，一组为低分辨率视频，另一组为相应的高清视频；(2)私有数据集采集：用不同的手机和不同的摄像机拍摄高清视频，总共采集N组高清视频，高清视频用Hi(i＝1、2、…N)表示；将采集的高清视频Hi使用对抗网络生成具有多种相机运动、多种场景深度以及多种运动模糊低分辨率视频，其中生成相机运动Via(a＝1、2、…na)组，生成不同场景深度Vib(b＝1、2、…nb)组，生成运动模糊Vic(c＝1、2、…nc)组，总共采集P(P＝a+b+c)组低分辨率视频；然后将内容相同的低分辨率视频与高清视频对应组对，集合成P组视频对；步骤2：视频对数据增强：将采集的M对公开视频和用对抗网络生成的P对视频生成视频帧，把这些视频帧通过平移、旋转图像(0°，90°，180°，270°)和缩放图像(1/4,1/3,1/2)来增加数据；总共收集7×(M+P)组视频对，其中0.9×7×(M+P)组视频对作为训练数据，0.1×7×(M+P)组视频对作为测试数据，且训练数据和测试...

【技术特征摘要】
1.一种基于深度学习的视频超分辨率重建方法，其特征在于包括如下步骤：步骤1：训练与测试数据准备：(1)公开数据集采集：采集两组内容相同的公开视频M对，一组为低分辨率视频，另一组为相应的高清视频；(2)私有数据集采集：用不同的手机和不同的摄像机拍摄高清视频，总共采集N组高清视频，高清视频用Hi(i＝1、2、…N)表示；将采集的高清视频Hi使用对抗网络生成具有多种相机运动、多种场景深度以及多种运动模糊低分辨率视频，其中生成相机运动Via(a＝1、2、…na)组，生成不同场景深度Vib(b＝1、2、…nb)组，生成运动模糊Vic(c＝1、2、…nc)组，总共采集P(P＝a+b+c)组低分辨率视频；然后将内容相同的低分辨率视频与高清视频对应组对，集合成P组视频对；步骤2：视频对数据增强：将采集的M对公开视频和用对抗网络生成的P对视频生成视频帧，把这些视频帧通过平移、旋转图像(0°，90°，180°，270°)和缩放图像(1/4,1/3,1/2)来增加数据；总共收集7×(M+P)组视频对，其中0.9×7×(M+P)组视频对作为训练数据，0.1×7×(M+P)组视频对作为测试数据，且训练数据和测试数据不交叉；步骤3：视频对数据处理：将7×(M+P)对视频转化成连续的图像，用Vit(i＝1、2、3…N，t＝1、2、…7×(M+P))表示视频的每一帧，把处理的视频图像数据存为HDF5(HierarchicalDataFormat)文件；步骤4：设计网络结构：本发明所提出的网络模型的体系结构将连续的3帧作为输入，前向循环子网络输入正向低分辨率视频帧Vit，所述正向视频帧从V1t帧到VNt帧；反向循环子网络输入反向低分辨率视频帧Vit，所述反向视频帧从VNt帧到V1t帧；选定前向子网络和反向子网络隐藏层深度为n，双向循环神经网络后连接一个3D卷积层，每个卷积块的深度代表卷积后的特征数量；紧接着是放大投影卷积单元和缩小投影卷积单元，选定放大投影单元深度为f，选定缩小投影单元深度为f，所述放大投影单元依次是将缩小投影单元...

【专利技术属性】
技术研发人员：章东平，张香伟，倪佩青，
申请(专利权)人：中国计量大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人