【技术实现步骤摘要】
一种基于图像视觉增强和半监督学习的水下目标检测方法
[0001]本专利技术属于计算机视觉
,具体涉及一种基于图像视觉增强和半监督学习的水下目标检测方法
。
技术介绍
[0002]随着经济的发展和资源的日益缺乏,水下环境探索和水下科学研究近年来备受关注
。
基于深度学习的水下光学目标检测在水下探索和研究中具有重要的意义
。
由于水下环境复杂多样,将通用目标检测模型直接用于通用目标检测相比,水下目标检测面临更多的困难和挑战
。
[0003]一方面,水下成像环境复杂,通过光学成像设备获得的光学图像往往存在低对比度
、
模糊
、
低亮度等问题,上述问题会限制目标检测模型的性能,一种容易想到的解决方法是利用视觉增强或恢复算法对水下图像进行预处理,并且大多数水下图像恢复工作提出“恢复图像可以提高其视觉质量并提高计算机视觉任务的性能”。
例如,
Jingchun Zhou
等人提出“退化的水下图像严重限制了特征提取
、
目标检测和特征匹配等实际应用,因此从模糊的视频和图像中恢复真实的场景具有重要的意义”。
[0004]但最近的研究中发现,利用现有的视觉增强或恢复算法对水下图像进行预处理不能提高目标检测的性能,甚至会导致目标检测性能下降
。
例如,
Jiashuo Zhang
等人选择了3种具有代表性的图像视觉增强算法处理水下数据集,分别为传统方法
、U ...
【技术保护点】
【技术特征摘要】
1.
一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:包括下列步骤:
S1、
建立水下目标检测模型;
S2、
利用所有的标注数据训练
S1
中建立的水下目标检测模型得到教师模型,该训练过程中通过最小化监督损失进行模型参数优化;
S3、
利用
S2
中得到的教师模型推理无标注数据,得到无标注数据的伪标注,伪标注包括位置坐标和类标签,其格式与人工标注的格式保持一致;
S4、
利用标注数据和无标注数据从头开始训练
S1
中建立的水下目标检测模型,训练过程中,标注数据使用
Mosaic
和随机仿射变换进行数据增强;对无标注数据使用全局颜色变换
、CoarseDropout、Mosaic
和随机仿射变换进行数据增强;通过最小化无监督损失和监督损失的加权和来优化模型参数
。2.
根据权利要求1所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述
S1
中建立的水下目标检测模型包括三个部分:视觉增强参数预测模块
VE
‑
PP、
视觉增强模块
VE
和目标检测器
。3.
根据权利要求2所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述视觉增强参数预测模块采用轻量级卷积神经网络
Peleenet
,其作用是预测
VE
模块中的可调节参数,针对不同水下图像生成不同的视觉增强参数,实现水下图像自适应增强
。4.
根据权利要求2所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述视觉增强模块包括四个图像滤波器:
White Balance
图像滤波器
、Gamma
图像滤波器
、Contrast
图像滤波器和
Sharpen
图像滤波器;以上四个滤波器均可微,以保证
VE
‑
PP
模块可以通过反向传播进行网络训练;以上四个滤波器中参数都与待处理图像的分辨率无关,使得
VE
‑
PP
模块的输入图像可以将分辨率缩小到
304
×
304
,以节省计算资源;
VE
‑
PP
模块实际处理的图像分辨率为
416
×
416
,与目标检测网络输入图像的分辨率保持一致
。5.
根据权利要求4所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述
White Balance
图像滤波器的映射函数为:
P
o
=
(W
r
r
i
,W
g
g
i
,W
b
b
i
)
所述
P
i
=
(r
i
,g
i
,b
i
)
为输入像素值,
P
o
=
(r
o
,g
o
,b
o
)
为输出像素值,所述
(r,g,b)
分别代表红
、
绿
、
蓝颜色通道的值,所述
W
r
、W
g
、W
b
分别为红
、
绿
、
蓝颜色通道的系数,与
r
i
、g
i
、b
i
是对应相乘的关系,该映射为一个乘法变换;所述
Gamma
图像滤波器的映射函数为:
P
o
=
P
iG
所述
P
i
为输入像素值,所述
P
o
为输出像素值,所述
G
为
gamma
值,该映射为一个幂变换;所述
Contrast
图像滤波器的映射函数为:
P
o
=
α
·
En(P
i
)+(1
‑
α
)
·
P
i
所述
P
i
为输入像素值,所述
P
o
为输出像素值,所述
α
为原始图像与完全增强图像之间的线性插值;所述
En(P
i
)
定义为:
其中:
Lum(P
i
)
=
0.27r
i
+0.67g
i
+0.06b
i
所述
Sharpen
图像滤波器的映射函数为:
F(x,
λ
)
=
I(x)+
λ
(I(x)
‑
Gau(I(x)))
所述
I(x)
为输入图像,所述
Gau(I(x))
为高斯滤波器,所述
λ
为一个正的比例因子,通过改变
λ
值来调整锐化程度
。6.
根据权利要求2所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述目标检测器使用
YOLOX
‑
Nano
,
YOLOX
‑
Nano
中引入了深度可分离卷积,只有
0.91M
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。