基于生成对抗网络的小样本声呐图像分类识别优化方法技术

技术编号:30972499 阅读:37 留言:0更新日期:2021-11-25 20:54
本发明专利技术涉及一种基于生成对抗网络的小样本声呐图像分类识别优化方法,利用真实声呐图像样本通过生成对抗网络进行数据合成,合成数据作为真实训练样本的扩充数据用于深层卷积神经网络训练,完成对水下目标声呐图像更加准确的分类与识别。使用合成图像数据对原有小样本情况下的数据集互补增强后进行网络训练,能够避免深层卷积神经网络过拟合问题,获得86.85%的识别准确率,识别精度有明显提升,有效解决了水下目标识别研究中声呐图像样本不足的问题,具有广泛的应用前景,可进一步应用于实测水下目标声呐图像的分类识别。于实测水下目标声呐图像的分类识别。于实测水下目标声呐图像的分类识别。

【技术实现步骤摘要】
基于生成对抗网络的小样本声呐图像分类识别优化方法


[0001]本专利技术属于水下目标声呐图像分类与识别领域,,涉及一种基于生成对抗网络的小样本声呐图像分类识别优化方法,具体涉及一种通过对声呐图像数据集进行互补增强,从而提高深层卷积神经网络对小样本声呐图像分类识别准确率的方法。

技术介绍

[0002]目前大部分对于水下目标识别的研究是直接应用经由光学图像更改优化的网络,这些网络模型在光学图像数据集上极高的识别率,是基于数以百万记的光学图片的积累,搭配越来越深层的网络才取得的。而水下目标识别研究所用的声呐图像数量往往远少于光学图像,在深层卷积神经网络的训练中会发生过拟合问题,水下目标的分类识别准确率较低。为了解决小样本情况下深层卷积神经网络在声呐图像数据集上识别率较低的问题,采用生成对抗网络(Generative Adversarial Networks,GAN)对声呐图像进行数据扩充,能够有效解决小样本情况下深层卷积神经网络模型的训练和识别问题。
[0003]对于生成对抗网络,Martin Arjovsky等人于2017年提出的WGAN,其网络使用Wassertein距离作为度量,解决了GAN训练不稳定的问题,确保了生成样本的多样性;Guo

Jun Qi等人于2017年提出的LSGAN,使用最小二乘函数作为GAN的损失函数,构建了一个稳定且收敛快的GAN。然而这些基于GAN的改进和应用目前主要在光学图像上,对于水下目标声呐图像的合成效果较差,在样本数较少时生成的图片中目标主体结构特征保留较少,并伴随有大量噪点。为了使得生成对抗网络合成的图像数据与真实的水下目标声呐图像更加相似,本方法在深层卷积神经网络基础上搭建了一个适用于声呐图像的生成对抗网络,通过合成大量更加清晰相似的水下目标声呐图像用于网络训练,达到提升识别精度的目的,且国内专利技术专利中并未涉及到利用生成对抗网络针对小样本情况下声呐图像识别的优化,故该专利技术是十分有必要的。
[0004]我国是一个海洋大国,海洋资源丰富,但仅有一小部分被人类探测和熟知,仍有极大的未知区域等待着开发。由于人类的力量有限,因此需要进行水下无人探测,而水下目标识别就是核心技术之一。由于光波在水下传播距离短、衰减快,而低频声波在水下传播距离远、衰减小,可以实现各种复杂水域环境的远距离成像,因此水下目标识别主要依赖声呐成像。然而声呐成像的成像效果远不如光学图像,并且水下声呐图像采集通常需要耗费大量人力物力,很难获得足够的水下图像数据用于卷积神经网络的训练,因此需要对声呐图像数据进行增广,用于提升水下目标识别的精度。针对上述状况,本专利技术提出一种基于生成对抗网络进行数据增广扩充的小样本声呐图像分类识别优化算法。

技术实现思路

[0005]要解决的技术问题
[0006]为了避免现有技术的不足之处,本专利技术提出一种基于生成对抗网络的小样本声呐图像分类识别优化方法,可以针对声呐图像特点,利用现有真实图像样本进行数据合成,生
成与真实声呐图像相似且清晰度较高的图片,从而实现声呐图像数据集的扩充,获取大量训练样本,利用更多声呐图像样本进行深层卷积神经网络的训练,减小过拟合问题,达到更高的识别精度。
[0007]技术方案
[0008]一种基于生成对抗网络的小样本声呐图像分类识别优化方法,其特征在于步骤如下:
[0009]步骤1:搜集水下目标声呐图像,建立水下目标声呐图像数据集;对声呐图像采用3
×
3中值滤波处理,去除声呐图像中的椒盐噪声图像;
[0010]对滤波后数据集进行规范化操作:
[0011]1、使用Lanczos插值法将搜集到的尺寸不一的声呐图片进行重置,统一数据集中声呐图像的输入大小;
[0012]2、通过公式Gray=0.299R+0.587G+0.114B将RGB图像转化为灰度图像,对声呐图片进行灰度化处理;
[0013]3、将像素值右[0,255]归一化为[0,1],进行像素值归一化预处理;
[0014]将处理后的数据分为训练集、验证集和测试集;
[0015]步骤2、搭建生成对抗网络模型:
[0016]模型包含生成器和判别器D;
[0017]所述生成器G的结构为一个全连接层连接五个串联的反卷积层,用来捕获数据特点分布细节的模型,最终输出为图像的像素值,将像素值归一化在[

1,1]区间内,最后一层输出的激活函数使用tanh函数,其表达式为:
[0018][0019]生成器G使用反卷积操作对输入矩阵的长和宽进行拓展,反卷积作为卷积的逆操作,其输入输出尺寸变换原则为:
[0020]若(o+2p

k)%s=0,则反卷积后输出图像尺寸o=s(i

1)

2p+k;
[0021]若(o+2p

k)%s≠0,则反卷积后输出图像尺寸o=s(i

1)

2p+k+1;
[0022]其中,i表示输入矩阵尺寸,o表示输出矩阵尺寸,k表示卷积核大小,d表示卷积核数量,s表示步长,p表示反卷积过程中的填充参数;
[0023]所述判别器D的结构为四个串联的卷积层连接一个全连接层,用来估计样本数据来自真实训练数据还是生成器的模型,即进行二分类任务,最后一层输出为一个元素,输出结果为0到1之间的数值,其中0表示数据来源于生成器的生成图像,1表示数据来源于真实图像样本;判别器的最后一层使用Sigmoid函数作为分类函数,其表达式为:
[0024][0025]所述各层之间的激活函数使用PReLU函数,表达式为:
[0026]f
PReLU
(x)=max(αx,x)
[0027]其一阶导函数的表达式为:
[0028][0029]其中参数α随着网络的训练而改变能够更好地适应网络,加速网络收敛;
[0030]步骤3、训练及生成声呐图像:将训练集数据输入生成对抗网络训练,训练结束后生成与真实图像结构相似的声呐图像为合成数据;
[0031]步骤4:将合成数据加入原训练集中对原来小样本情况下的声呐图像训练集样本进行扩充增加得到样本扩充后的声呐图像数据集;
[0032]步骤5:以样本扩充后的声呐图像数据集对经典网络结构进行训练,并观测训练过程中训练集的损失变化曲线以及验证集的识别准确率变化曲线,若训练集损失逐渐减小,网络对验证集的分类准确率不断上升,最终趋于稳定,表明训练完成后的网络结构能够对声呐图像数据进行正确分类;若曲线变化未达到预期,需重新训练网络;
[0033]步骤6:以步骤5训练后的经典网络结构对原声呐图像数据集中的测试集样本进行分类与识别;完成对小样本声呐图像分类识别的优化后,根据真实样本生成更多声呐图像作为训练集,使网络结构能够得到充分训练,从而在真实测试集样本上识别更加准确。
[0034]所述步骤3的训练过程为:
[0035]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生成对抗网络的小样本声呐图像分类识别优化方法,其特征在于步骤如下:步骤1:搜集水下目标声呐图像,建立水下目标声呐图像数据集;对声呐图像采用3
×
3中值滤波处理,去除声呐图像中的椒盐噪声图像;对滤波后数据集进行规范化操作:1、使用Lanczos插值法将搜集到的尺寸不一的声呐图片进行重置,统一数据集中声呐图像的输入大小;2、通过公式Gray=0.299R+0.587G+0.114B将RGB图像转化为灰度图像,对声呐图片进行灰度化处理;3、将像素值右[0,255]归一化为[0,1],进行像素值归一化预处理;将处理后的数据分为训练集、验证集和测试集;步骤2、搭建生成对抗网络模型:模型包含生成器和判别器D;所述生成器G的结构为一个全连接层连接五个串联的反卷积层,用来捕获数据特点分布细节的模型,最终输出为图像的像素值,将像素值归一化在[

1,1]区间内,最后一层输出的激活函数使用tanh函数,其表达式为:生成器G使用反卷积操作对输入矩阵的长和宽进行拓展,反卷积作为卷积的逆操作,其输入输出尺寸变换原则为:若(o+2p

k)%s=0,则反卷积后输出图像尺寸o=s(i

1)

2p+k;若(o+2p

k)%s≠0,则反卷积后输出图像尺寸o=s(i

1)

2p+k+1;其中,i表示输入矩阵尺寸,o表示输出矩阵尺寸,k表示卷积核大小,d表示卷积核数量,s表示步长,p表示反卷积过程中的填充参数;所述判别器D的结构为四个串联的卷积层连接一个全连接层,用来估计样本数据来自真实训练数据还是生成器的模型,即进行二分类任务,最后一层输出为一个元素,输出结果为0到1之间的数值,其中0表示数据来源于生成器的生成图像,1表示数据来源于真实图像样本;判别器的最后一层使用Sigmoid函数作为分类函数,其表达式为:所述各层之间的激活函数使用PReLU函数,表达式为:f
PReLU
(x)=max(αx,x)其一阶导函数的表达式为:其中参数α随着网络的训练而改变能够更好地适应网络,加速网络收敛;步骤3、训练及生成声呐图像:将训练集数据输入生成对抗网络训练,训练结束后生成与真实图像结构相似的声呐图像为合成数据;
步骤4:将合成数据加入原训练集中对原来小样本...

【专利技术属性】
技术研发人员:梁红徐微雨杨长生
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1