一种基于深度技术的水下风格化图像生成方法技术

技术编号：36607965 阅读：16 留言：0更新日期：2023-02-04 18:33

本发明专利技术涉及一种基于深度技术的水下风格化图像生成方法，包括以下步骤：S1、利用图像处理技术对原始水下数据集进行数据扩充，扩大其数量规模，得到扩充后数据集；S2、预估扩充后数据集中水下图像所对应的深度图；S3、采用高斯低通滤波器对扩充后数据集中水下图像进行平滑处理，生成相应的光场图并获得水下场景中各像素点处的光强度信息；S4、在U

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度技术的水下风格化图像生成方法

[0001]本专利技术属于图像处理
，具体涉及一种基于深度技术的水下风格化图像生成方法。

技术介绍

[0002]受限于水下复杂的成像环境以及拍摄手段的限制，所能获取的水下图像资源及其匮乏，且人工成本过高，故水下图像生成技术的研究成为目前的研究热点。水下图像的生成方法主要分为两类：基于传统物理成像模型的生成方法和基于深度模型的生成方法。基于传统物理模型的生成方法主要是依靠特定水域的先验知识(如：特定水深处光的衰减系数等)以及深度信息来模拟水下图像的质量退化过程。深度学习技术在2012年左右被提出，鉴于其强大的非线性建模能力和数据特征学习能力，深度模型在水下图像生成领域有着广阔的应用前景。
[0003]专利CN202210418314.8公开了一种基于改进Cycle GAN的图像生成方法，包括从X域图像数据库中获取输入图像；将所述输入图像输入至编码器并输出特征图像；将所述特征图像输入至特征权重自适应模块，对所述特征图像提取背景信息和目标特征信息，并针对提取的背景信息和目标特征信息进行不同权重的特征融合；将处理后的特征图像依次输入至转换器和解码器中还原生成输出图像。
[0004]专利CN202210536540.6公开了一种场景图像生成方法，应用于客户端，方法包括：获取第一相机参数、第一场景图像及多个第一像素点的第一空间信息，第一场景图像为虚拟相机根据第一相机参数拍摄获得；向服务器输出交互指令以使服务器生成第二相机参数，并控制虚拟相机根据第二相机参数拍摄目标场

【技术保护点】

【技术特征摘要】
1.一种基于深度技术的水下风格化图像生成方法，其特征在于，包括以下步骤：S1、利用图像处理技术对原始水下数据集进行数据扩充，扩大其数量规模，得到扩充后数据集；S2、预估扩充后数据集中水下图像所对应的深度图；S3、采用高斯低通滤波器对扩充后数据集中水下图像进行平滑处理，生成相应的光场图并获得水下场景中各像素点处的光强度信息；S4、在U
‑
net模型的基础上增加基于注意力机制的特征融合操作和批量归一化操作，构建改进后的U
‑
net模型；将原始水下图像和深度图输入改进后的U
‑
net模型，结合模型输出和光场图，得到水下风格化图像。2.根据权利要求1所述的一种基于深度技术的水下风格化图像生成方法，其特征在于，所述步骤S1中，利用图像处理技术对原始水下数据集进行数据扩充，具体实现方法为：在符合实际和人类认知，以及不改变样本场景分布特性的前提下，通过对UIEB数据集中原始图像分别进行包括顺时针或逆时针旋转设定角度、水平翻转以及注入噪声的物理变换的方式得到扩充图像，进而得到扩充后数据集，为后续的生成模型训练以及深度估计工作做准备。3.根据权利要求1所述的一种基于深度技术的水下风格化图像生成方法，其特征在于，所述步骤S2中，预估扩充后数据集中水下图像所对应的深度图，具体实现方法为：利用预训练的hourglass网络来预估深度图，并根据预估的深度信息和地面真实的深度信息之间的差异具有放缩不变性，通过放缩不变的损失函数L
si
来对hourglass网络进行联合优化，L
si
的计算式如下式所示：L
si
＝L
data
+αL
gra
+βL
ord
ꢀꢀꢀꢀ
(1)其中，L
data
，L
gra
和L
ord
分别为深度数据损失项、多尺度的梯度匹配损失项和鲁棒的有序深度损失项，α和β为模型可自动学习的参数；设预测的深度图为L，地面真实深度图为L
*
，则定义像素点i处的预估差值为故深度数据损失项L
data
如下式所示：其中，n表示深度图中像素点的个数；为了让预测的深度图梯度变化更加平滑，减少尖锐梯度值的出现频率，对于不同尺度下的深度图计算梯度匹配损失项L
gra
如下式所示：其中，k为尺度变换因子，x、y分别表示在像素点i处的横轴方向和纵轴方向；有序深度损失项的表达式如下式所示：其中，P
i,j
为自动标记的有序深度关系变量，c为常量，(i,j)为图像中的一组像素点对，τ＝0.25。
4.根据权利要求1所述的一种基于深度技术的水下风格化图像生成方法，其特征在于，所述步骤S3中，采用高斯低通滤波器对扩充后数据集中水下图像进行平滑处理，生成相应的光场图并获得水下场景中各像素点处的光强度信息，具体实现方法为：利用一个卷积模板来扫描图像中的每一个像素，并使用模板内所有像素点加权平均的结果代替模板中心像素点处的值，从而消除高频信号的...

【专利技术属性】
技术研发人员：兰诚栋，王智超，
申请(专利权)人：福州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人