System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及小目标检测,具体涉及一种基于无监督对抗学习的无人机小目标检测方法。
技术介绍
1、无人机目标检测是计算机视觉目标检测领域的重要分支,随着无人机技术的不断进步,无人机的使用范围不断扩大,涉及军事、民用、商业等多个领域。无人机目标检测的目的是要从待检图像或视频中对无人机进行定位、检测及分类,然而,无人机的潜在威胁也逐渐凸显,如无人机的非法入侵、无人机的恶意攻击等。现如今,基于机器视觉的无人机目标检测已经广泛地应用于日常生活当中,如机场、涉密场所、视频监控等领域。
2、早期的目标检测主要依赖于手工设计的特征和基于机器学习的分类器,典型的方法包括haar特征和级联分类器(如viola-jones算法),以及基于hog(histogram oforiented gradients)特征的方法,但这些方法在复杂背景、多目标和尺度变化等情况下表现较差。随着计算机视觉领域的不断发展,多种检测算法的出现改变了以上情况。r-cnn(region with cnn feature)是使用深度学习方法的开创性工作之一,提出通过区域提案(region proposals)来定位图像中的对象,然后对每个提案使用卷积神经网络(cnn)提取特征,最后分类。随后fast r-cnn对r-cnn进行了改进,通过整合整个检测流程到一个单一的网络中来提高速度和效率,使用roi(region of interest)池化层来从共享的特征图中提取特征。如今yolo(you only look once)和ssd(single shot multi
3、目前大量的无人机目标检测算法,如yolo-v5、efficientdet等改进算法对无人机目标的检测已经取得了不错的效果。其算法本质都是有监督学习,有监督学习目标检测算法现在依然存在着一些不足,例如有监督学习算法通常需要大量标注的数据来进行训练,特别是在深度学习领域,有监督目标检测算法对于目标的遮挡和不同姿态的适应性有限,有监督目标检测算法在训练时通常只能学习到已标注数据中的模式,对于新领域或不同环境中的目标,泛化能力可能较差。
技术实现思路
1、本专利技术的目的在于克服现有技术的不足,提供一种基于无监督对抗学习的无人机小目标检测方法,提高无人机目标检测精度。
2、本专利技术的目的是通过以下技术方案来实现的:
3、一种基于无监督对抗学习的无人机小目标检测方法,包括:
4、获取训练集中包含无人机小目标的原始图像,提取原始图像中包含检测目标的矩形区域,得到检测目标图像和不含检测目标的纯净背景图像;
5、将检测目标图像进行图像退化和增强操作,包括:将检测目标图像分别进行最近邻插值、双线性插值和双三次插值,再对得到的三组不同退化程度的图像随机选择一种插值方法进行二次退化,得到另外三组不同退化程度的图像,共计六组不同的退化图像;对获得的退化图像进行多种模式的增强处理,得到多组检测目标的退化增强图像;
6、构建小目标检测模型,包括特征提取网络和无监督目标判别网络;所述特征提取网络作为生成器,包括由yolo-v5 backbone骨干网络构成的特征提取器、多个全连接层和/或多层感知器mlp构成的特征适配器;所述无监督目标判别网络作为判别器,包括二分类鉴别器;
7、训练所述小目标检测模型,即进行对抗学习,包括:将检测目标的退化增强图像与纯净背景图像融合得到合成图像,将合成图像以及纯净背景图像分别输入到特征提取网络中,分别生成异常特征图和正常特征图;将获得的异常特征图和正常特征图输入判别器,判别器鉴别区分两种特征图的不同之处,将异常特征图判别为假,正常特征图判别为真;
8、选取测试集中的待检测目标图像输入到训练好的小目标检测模型,输出无人机小目标检测结果。
9、进一步地,所述增强处理包括随机缩放和平移变换操作、调整图像的色度饱和度和亮度操作以及将两张图像用一定的透明度融合在一起的操作。
10、进一步地,所述特征提取器包括:两个focus结构和两个csp结构,focus结构用于将图像在进行语义特征提取前进行图片切片操作,对获取到四张相似互补图像,将宽度w、高度h信息集中到通道空间,输入通道扩充4倍,即拼接起来的图像相对于原先的rgb三通道变成了12个通道,最后将得到的新图像经过卷积操作,最终得到没有信息丢失情况下的二倍下采样特征图;
11、csp 结构用于将特征图拆成两个部分,一部分进行卷积操作,另一部分和上一部分卷积操作的结果进行concate拼接操作,再进行多次卷积操作,提取处理后特征图的多层语义特征。
12、进一步地,所述二分类鉴别器具体为双层mlp结构,用于作为一个正态性记分器直接估计每个位置的正态性,其中h为图像块所在位置高度参数,w为图像块所在位置宽度参数;
13、所述正态性的估计过程表示为:,其中,为正态性记分器,直接估计每个位置的正态性,为变换后的自适应特征。
14、进一步地,所述判别器的损失函数采用二进制交叉熵损失函数,用于量化判别器识别映射图像特征和合成图像特征的准确性,其值越低表示性能越好,判别器损失函数计算公式如下所示:
15、
16、其中,g为生成器,d为判别器,x表示真实的数据,y表示合成数据,g(x)表示正常特征图,g(y)表示异常特征图,d[g(x)]表示判别器对正常特征图的判别结果,d[g(y)]表示判别器对于异常特征图的判别结果。
17、本专利技术的有益效果是:
18、(1)本专利技术在目标检测算法中引入图像多尺度退化和增强,使得模型能够更好地学习数据中的多元结构和模式,使得检测算法能够更好的对小目标进行识别。通过这种方式,模型能够辅助目标检测框架学习更加具有辨识度和普适性的语义特征用于小目标识别。此外,对退化后的目标进行多种模式的增强,不仅可以使得训练数据尽可能接近真实分布的数据,还可以避免样本不均衡等问题,迫使模型学习更多鲁棒性特征,从而有效提高模型的泛化能力。
19、(2)本专利技术将生成对抗网络引入目标检测任务中,使用特征提取器代替生成器,分别将图像背景与合成图像通过特征提取器生成对应的特征图,将两种不同的特征图同时传入判别器,判别器即会鉴别区分上述两种特征图的不同之处,而特征提取器亦会不断学习加强对图像特征的提取。判别器在不断的对抗学习中能够专注于学习两特征图不同之处,用于对合成图像特征图中的小目标对象进行定位检测。
本文档来自技高网...【技术保护点】
1.一种基于无监督对抗学习的无人机小目标检测方法,其特征在于:包括:
2.根据权利要求1所述的一种基于无监督对抗学习的无人机小目标检测方法,其特征在于:所述增强处理包括随机缩放和平移变换操作、调整图像的色度饱和度和亮度操作以及将两张图像用一定的透明度融合在一起的操作。
3.根据权利要求1所述的一种基于无监督对抗学习的无人机小目标检测方法,其特征在于:所述特征提取器包括:两个Focus结构和两个CSP结构,Focus结构用于将图像在进行语义特征提取前进行图片切片操作,对获取到四张相似互补图像,将宽度W、高度H信息集中到通道空间,输入通道扩充4倍,即拼接起来的图像相对于原先的RGB三通道变成了12个通道,最后将得到的新图像经过卷积操作,最终得到没有信息丢失情况下的二倍下采样特征图;
4.根据权利要求1所述的一种基于无监督对抗学习的无人机小目标检测方法,其特征在于:所述二分类鉴别器具体为双层MLP结构,用于作为一个正态性记分器直接估计每个位置的正态性,其中h为图像块所在位置高度参数,w为图像块所在位置宽度参数;
5.根据权利要求1所述的一
...【技术特征摘要】
1.一种基于无监督对抗学习的无人机小目标检测方法,其特征在于:包括:
2.根据权利要求1所述的一种基于无监督对抗学习的无人机小目标检测方法,其特征在于:所述增强处理包括随机缩放和平移变换操作、调整图像的色度饱和度和亮度操作以及将两张图像用一定的透明度融合在一起的操作。
3.根据权利要求1所述的一种基于无监督对抗学习的无人机小目标检测方法,其特征在于:所述特征提取器包括:两个focus结构和两个csp结构,focus结构用于将图像在进行语义特征提取前进行图片切片操作,对获取到四张相似互补图像,将宽度w、高度h信息集中到通道空间,输入通道扩充4倍,即拼接起来的图像相对于原先的...
【专利技术属性】
技术研发人员:涂晓光,何志,康朋新,李卓骏,张艳艳,杨明,刘建华,殷举航,王宇,周超,崔雨勇,
申请(专利权)人:中国民用航空飞行学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。