【技术实现步骤摘要】
一种基于卷积神经网络的极端条件下的图像修复方法
本专利技术涉及图像修复领域,尤其涉及基于卷积神经网络在极端条件下对图像的修复方法。
技术介绍
在低照度环境下,成像系统采集到的视频图像由于环境照度较低,使得视频图像中有用信息和噪声混合在一起,导致目标特征不明显,清晰度不高,难于辨别,需要使用数字图像处理技术来降低噪声对人眼识别景物的影响。与此同时,在夜间城镇环境中,由于城市照明光的覆盖面较小,城市道路存在较多的光覆盖盲点。因此,给夜间视频检测带来了严重挑战。其主要表现为:一是图像呈现大量暗区,暗区内容模糊不清、细节丢失;二是在人工光源下,图像又出现部分高光区,使得图像整体亮度严重不均,图像质量严重下降。虽然高照度和长曝光时间可以提高成像质量,但其存在不可避免的缺陷。例如,在提高照度的同时也会放大噪声。在延长曝光时间的同时,也会由于相机抖动或物体运动而导致成像模糊。目前,许多关于图像去噪、去模糊和低光图像增强等技术相继提出,但这些技术通常的操作目标为较暗条件下捕获到的图像,即图像只携带有中等程度的噪声。相反,我们更感兴趣的是在极端低光条件下,如严重受限的光照和极短时间的曝光。在这种情况下,传统相机的处理方式已不再适用。得益于最近几年神经网络的兴起,许多研究人员将神经网络应用于图像去噪领域,而且取得了不错的效果,但大多数方法只针对于合成模糊图像或者是只适用于特定的噪声图像,并不能得到广泛的推广。
技术实现思路
:本专利技术提出了一种基于卷积神经网络的在极端条件下的图像修复方法。该方法能够直接建立模糊图像与清晰图像间的联系,可以快速的产生清晰图像,从而获取所需信息。具 ...
【技术保护点】
1.一种基于卷积神经网络的极端条件下的图像修复方法,其特征在于包括如下步骤:步骤1:对获取到的短曝光图像进行预处理;1‑1.对于获取到的.RAW图像阵列,先按R、G、B三色素对像素进行分类;由于.RAW图像阵列中R、G、B的数量比为1:2:1,因此,将像素阵列分为4个通道;此时每个通道的空间分辨率为原始图像的一半;1‑2.对像素灰度值进行“归零”处理,可使图像中像素的灰度值与光照强度呈线性关系;其具体过程为:首先,将拍摄得到的图像进行检测,检测到该“归零”阈值为“512”;其次,将图像中所有像素的灰度值减去该阈值;最后,将图像中低于零的灰度值设置为零,高于零的灰度值保持不变;步骤2:将预处理后的图像输入U‑Net卷积神经网络进行训练;2‑1.通过端对端的方式对U‑Net网络进行训练,以避免图像中噪声的放大和误差的累计;2‑2.在训练中,随机裁剪一个512×512的补丁用于训练,同时对裁剪的补丁随机进行翻转、旋转操作来增强训练数据;步骤3:计算误差并进行迭代训练;3‑1.U‑Net网络的输出为12通道,并且每个通道的空间分辨率为原始输入图像的一半;3‑2.对U‑Net网络的输出进行亚像素 ...
【技术特征摘要】
1.一种基于卷积神经网络的极端条件下的图像修复方法,其特征在于包括如下步骤:步骤1:对获取到的短曝光图像进行预处理;1-1.对于获取到的.RAW图像阵列,先按R、G、B三色素对像素进行分类;由于.RAW图像阵列中R、G、B的数量比为1:2:1,因此,将像素阵列分为4个通道;此时每个通道的空间分辨率为原始图像的一半;1-2.对像素灰度值进行“归零”处理,可使图像中像素的灰度值与光照强度呈线性关系;其具体过程为:首先,将拍摄得到的图像进行检测,检测到该“归零”阈值为“512”;其次,将图像中所有像素的灰度值减去该阈值;最后,将图像中低于零的灰度值设置为零,高于零的灰度值保持不变;步骤2:将预处理后的图像输入U-Net卷积神经网络进行训练;2-1.通过端对端的方式对U-Net网络进行训练,以避免图像中噪声的放大和误差的累计;2-2.在训练中,随机裁剪一个512×512的补丁用于训练,同时对裁剪的补丁随机进行翻转、旋转操作来增强训练数据;步骤3:计算误差并进行迭代训练;3-1.U-Net网络的输出为12通道,并且每个通道的空间分辨率为原始输入图像的一半;3-2.对U-Net网络的输出进行亚像素卷积处理,以生成一幅与输入大小相同的图像;3-3.以输入图像对应的长曝光图像作为参考图像,计算二者的L1范数损失函数;选择Adam算法作为网络的优化器;步骤4:对训练模型进行评估,以图像的峰值信噪比和结构相似性作为最终结果的评判标准。2.根据权利要求1所述的一种基于卷积神经网络的极端条件下的图像修复方法,其特征在于所述的以.RAW数据作为输入,其形状为H×W×1,对输入数据进行打包,分为四个通道,打包后的形状为H/2×W/2×4;所述的图像阵列中的R、G、B像素等间隔均匀分布。3.根据权利要求1所述的一种基于卷积神经网络的极端条件下的图像修复方法,其特征在于所述的U-Net卷积神经网络由10个卷积层、4个池化层和4个上采样层组成;其输入的图像为选取的512×512的补丁,并且经过了随机翻转和旋转变换;即输入网络的图像形状为:512×512×4,其卷积实现过程如下:①第一层卷积:对输入图像使用32个大小为3×3×4的卷积核进行卷积,输出为512×512×32;第一层池化:对卷积层的输出使用大小为2×2的模板进行maxpooling,其输出为256×256×32;②第二层卷积:对输入图像使用64个大小为...
【专利技术属性】
技术研发人员:颜成钢,王瑞海,杨洪楠,王兴政,孙垚棋,张继勇,张勇东,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。