当前位置: 首页 > 专利查询>深圳大学专利>正文

一种无人机航拍目标检测方法和装置制造方法及图纸

技术编号:31081752 阅读:15 留言:0更新日期:2021-12-01 12:27
本发明专利技术实施例公开了一种无人机航拍目标检测方法和装置,包括:获取待输入的无人机航拍图像;利用预设的CSPdarknet53提取模型对所述无人机航拍图像进行特征提取,并利用预设的IncreasedFFM特征融合模型对提取的特征进行特征融合;通过预设的YOLOv3Head网络模型对融合后的特征进行定位及分类,以及经非最大值抑制计算后得到所述无人机航拍图像的检测结果。本实施例在原有网络的基础上增加一个分支,用于浓缩各特征层的信息,然后将浓缩的信息分配给不同的特征层,达到充分融合特征的目的。此外,针对数据集样本不平衡问题,对损失函数进行改进。行改进。行改进。

【技术实现步骤摘要】
一种无人机航拍目标检测方法和装置


[0001]本专利技术实施例涉及电学领域,尤其是一种无人机航拍目标检测方法和装置。

技术介绍

[0002]随着无人机技术的快速发展,无人机被广泛应用于军事侦察、交通管制、地质检测、公路管理等领域,在现代社会中发挥着日益重要的作用。无人机航拍目标检测作为其中的关键技术,检测效果决定着无人机的智能化水平。因此,无人机目标检测技术具有重要的研究意义。
[0003]目标检测技术旨在对图像中的目标进行定位和分类。传统的目标检测方法一般分为三个步骤:图像预处理、特征提取和目标分类检测。图像预处理方法大多依赖像素差异和纹理信息,通过像素变化趋势筛选和分离区域,实现前后景分离;特征提取方法包括方向梯度直方图(HOG)、尺度不变特征变换(SIFT)、局部二值模式等。这些方法在某些场景下具有良好的表现和可解释性,但不适用于复杂场景下的检测任务,泛化能力较弱。随着人工智能的发展,学者将深度学习应用到目标检测任务,检测效果大幅超过传统方法的检测效果,基于深度学习的目标检测成为新的研究热点。
[0004]基于深度学习的目标检测技术主要分为两类,一类是两阶段检测,代表算法有R

CNN、Faster R

CNN、Mask R

CNN、Cascade R

CNN;另一类是单阶段检测,代表算法有YOLO、SSD、RetinaNet、EfficientDet。两阶段检测算法检测精度高,但检测速度较慢,难以应用于实时检测场景;单阶段检测算法检测速度快,但检测精度有所降低。当前的研究方向是结合两阶段的精度优势和单阶段的速度优势,设计推出高性能目标检测算法,已在自然场景的目标检测任务中取得良好的效果。然而,无人机航拍图像具有背景复杂、目标繁多、目标小、视场大等特点,对地面目标多为俯视视角,直接将自然场景的目标检测算法迁移到航拍图像中不能满足实际需求。
[0005]现有技术中,YOLOv4

CSP是Scaled

YOLOv4中的一个模型,适用于普通GPU,是典型的单阶段目标检测器。YOLOv4

CSP引入CSPNet设计思想,巧妙运用Mosaic数据增强、PANet特征融合、学习率余弦退火衰减、CIoU

loss等策略,获得了优越的目标检测性能。然而,观察YOLOv4

CSP模型,发现存在以下问题。
[0006]1)在特征融合部分,信息传递是通过自顶向下和自底向上两条通路实现的。在上层信息传递到下层的过程中会经过中间层,特征被稀释了;下层信息传递到上层也经过中间层,特征同样被稀释了。无人机航拍目标多为小目标,稀释的特征严重影响航拍小目标的检测效果。
[0007]2)在损失函数部分,YOLOv4

CSP没有考虑类别样本不平衡问题,它对每个类别赋予相同权重,每个类别对损失函数有同等的贡献。无人机航拍数据集多为长尾分布,样本分布不均匀,若大小类别对损失函数有同等的贡献率,则不利于检测器对小类目标的检出。

技术实现思路

[0008]为解决上述技术问题,本专利技术创造的实施例提供一种无人机航拍目标检测方法,包括:
[0009]获取待输入的无人机航拍图像;
[0010]利用预设的CSPdarknet53提取模型对所述无人机航拍图像进行特征提取,并利用预设的IncreasedFFM特征融合模型对提取的特征进行特征融合;
[0011]通过预设的YOLOv3 Head网络模型对融合后的特征进行定位及分类,以及经非最大值抑制计算后得到所述无人机航拍图像的检测结果。
[0012]进一步地,所述利用预设的IncreasedFFM特征融合模型对提取的特征进行特征融合,包括:
[0013]将提取的所述无人机航拍图像的特征图按照所述IncreasedFFM特征融合模型中的通道自上而下将顶层信息传递至底层以及自下而上将底层信息传递至顶层完成特征融合;
[0014]将所述无人机航拍图像的特征图进行特征浓缩,并将浓缩的特征图进行网络自适应通道选择获取通道权重,分别进行上采样、普通卷积和下采样,得到不同尺寸的特征图;
[0015]将融合后的特征图与浓缩后的特征图相加得到特征充分融合的特征图。
[0016]进一步地,所述按照所述IncreasedFFM特征融合模型中的通道自上而下将顶层信息传递至底层以及自下而上将底层信息传递至顶层完成特征融合,包括:
[0017]从特征提取后的所述无人机航拍图像最后得到的特征图中获取小尺度特征图和大尺度特征图,其中,随着神经网络的深入特征提取后的特征图逐渐变小;
[0018]按照所述IncreasedFFM特征融合模型中的通道自上而下对所述小尺度特征图进行上采样并将采样后的特征图调整至与相邻下一通道的特征图具有相同的尺寸,以及进行堆叠与卷积操作以将顶层信息传递至底层完成特征融合;
[0019]按照所述IncreasedFFM特征融合模型中的通道自下而上对所述大尺寸特征图进行下采样并将采样后的特征图调整至与相邻上一通道的特征图具有相同的尺寸,以及进行堆叠与卷积操作将底层信息传递至顶层完成特征融合。
[0020]进一步地,所述将所述无人机航拍图像的特征图进行特征浓缩,并将浓缩的特征图进行网络自适应通道选择获取通道权重,分别进行上采样、普通卷积和下采样,得到不同尺寸的特征图,包括:
[0021]对所述无人机航拍图像的特征图中的上层特征进行上采样,并将上采样的特征图调整至与中间层特征图的尺寸相同,得到第一特征图,以及对所述无人机航拍图像的特征图中的下层特征进行下采样,并将下采样的特征图调整至与中间层特征图的尺寸相同,得到第二特征图;
[0022]将所述第一特征图、第二特征图和中间层特征图进行相加得到浓缩特征图;
[0023]将所述浓缩特征图输入至预设的通道注意力结构模型中进行网络自适应选取通道,得到具有通道权重的浓缩特征图,以及对所述具有通道权重的浓缩特征图分别进行上采样、普通卷积和下采样,得到三个不同尺寸的特征图。
[0024]进一步地,模型训练时还包括损失函数,所述损失函数由定位损失函数、置信度损失函数和分类损失函数加权求和得到,其中,所述分类损失函数为BalancedLoss分类损失
函数,所述BalancedLoss分类损失函数计算步骤包括:
[0025]统计每个类别的样本数量,进行归一化得到所述每个类别样本的出现频率;
[0026]利用反相关函数计算所述出现频率得到所述每个类别的权重;
[0027]将所述每个类别的权重与增强正样本比重的交叉熵损失函数相乘得到所述BalancedLoss分类损失函数。
[0028]一种影像数据处理装置,包括:
[0029]获取模块,用于获取待输入的无人机航拍图像;
[0030]处理模块,用于利用预设的CSP本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种无人机航拍目标检测方法,其特征在于,包括:获取待输入的无人机航拍图像;利用预设的CSPdarknet53提取模型对所述无人机航拍图像进行特征提取,并利用预设的IncreasedFFM特征融合模型对提取的特征进行特征融合;通过预设的YOLOv3 Head网络模型对融合后的特征进行定位及分类,以及经非最大值抑制计算后得到所述无人机航拍图像的检测结果。2.根据权利要求1所述的方法,其特征在于,所述利用预设的IncreasedFFM特征融合模型对提取的特征进行特征融合,包括:将提取的所述无人机航拍图像的特征图按照所述IncreasedFFM特征融合模型中的通道自上而下将顶层信息传递至底层以及自下而上将底层信息传递至顶层完成特征融合;将所述无人机航拍图像的特征图进行特征浓缩,并将浓缩的特征图进行网络自适应通道选择获取通道权重,分别进行上采样、普通卷积和下采样,得到不同尺寸的特征图;将融合后的特征图与浓缩后的特征图相加得到特征充分融合的特征图。3.根据权利要求2所述的方法,其特征在于,所述按照所述IncreasedFFM特征融合模型中的通道自上而下将顶层信息传递至底层以及自下而上将底层信息传递至顶层完成特征融合,包括:从特征提取后的所述无人机航拍图像最后得到的特征图中获取小尺度特征图和大尺度特征图,其中,随着神经网络的深入特征提取后的特征图逐渐变小;按照所述IncreasedFFM特征融合模型中的通道自上而下对所述小尺度特征图进行上采样并将采样后的特征图调整至与相邻下一通道的特征图具有相同的尺寸,以及进行堆叠与卷积操作以将顶层信息传递至底层完成特征融合;按照所述IncreasedFFM特征融合模型中的通道自下而上对所述大尺寸特征图进行下采样并将采样后的特征图调整至与相邻上一通道的特征图具有相同的尺寸,以及进行堆叠与卷积操作将底层信息传递至顶层完成特征融合。4.根据权利要求2所述的方法,其特征在于,所述将所述无人机航拍图像的特征图进行特征浓缩,并将浓缩的特征图进行网络自适应通道选择获取通道权重,分别进行上采样、普通卷积和下采样,得到不同尺寸的特征图,包括:对所述无人机航拍图像的特征图中的上层特征进行上采样,并将上采样的特征图调整至与中间层特征图的尺寸相同,得到第一特征图,以及对所述无人机航拍图像的特征图中的下层特征进行下采样,并将下采样的特征图调整至与中间层特征图的尺寸相同,得到第二特征图;将所述第一特征图、第二特征图和中间层特征图进行相加得到浓缩特征图;将所述浓缩特征图输入至预设的通道注意力结构模型中进行网络自适应选取通道,得到具有通道权重的浓缩特征图,以及对所述具有通道权重的浓缩特征图分别进行上采样、普通卷积和下采样,得到三个不同尺寸的特征图。5.根据权利要求1所述的方法,其特征在于,在对模型训练时模型中还包括损失函数,所述损失函数由定位损失函数、置信度损失函数和分类损失函数加权求和得到,其中,所述分类损失函数为BalancedLoss分类损失函数,所述BalancedLoss分类损失函数计算步骤包括:
统计每个类别的样本数量,进行归一化得到所述每个类别样本的出现频率;利用反相关函数计算所述出现频率得到所述每个类别的权重;将所述每个类别的权重与增强正样本比重的交叉熵损失函数相乘得到所述BalancedLo...

【专利技术属性】
技术研发人员:王嘉荣李岩山张坤华
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1