一种基于多尺度特征融合及动态卷积的福寿螺卵检测方法技术

技术编号:30783525 阅读:17 留言:0更新日期:2021-11-16 07:45
本发明专利技术公开了一种基于多尺度特征融合及动态卷积福寿螺卵检测方法,属于计算机视觉技术领域,提高了当前福寿螺卵检测的准确率。本发明专利技术包括以下步骤:首先采集福寿螺卵的航拍图像,并对其中的虫卵进行标注;之后再darknet53网络结构的基础上,使用四尺度特征融合和动态卷积,构造出新的网络结构;将获得的福寿螺卵数据集送入神经网络进行训练,直至网络收敛,获得权重文件;然后利用训练好的神经网络和权重文件来检测测试图像中的福寿螺卵目标,并输出检测结果。本发明专利技术解决了目前福寿螺卵识别准确度低、模型在真实自然环境下对福寿螺卵识别率低的问题。率低的问题。率低的问题。

【技术实现步骤摘要】
一种基于多尺度特征融合及动态卷积的福寿螺卵检测方法


[0001]本专利技术属于计算机视觉
,尤其涉及一种基于多尺度特征融合及动态卷积的福寿螺卵检测方法。

技术介绍

[0002]近些年计算机视觉的快速发展,使得智慧农业、科学防疫等场景成为一种现实的存在,人们越来越倾向使用计算机视觉技术检测潜在的病虫危害。现有的大多数目标检测方法只能对虫卵进行分类,或在特定背景条件而非自然环境中检测它们,在面对复杂的真实世界场景,它们不能取得良好的效果。
[0003]在病虫害防治方面,为了解决分类问题,Konantinos P.Ferentinos等人开发了一个基于VGG卷积神经网络架构的特殊深度学习模型,用于通过简单的健康或生病的叶片图像来识别植物疾病。实验在17548张图像上进行,准确率达到99.53%(top

1误差0.47%);该模型是在一个公开的数据集上训练的,该数据集由25种植物和疾病的组合以及87848张图像组成;它还验证了在单个GPU上进行单个图像分类需要大约两毫秒的时间,这使得该模型有可能被整合到移动应用程序中,以应用到其他领域,该模型可以帮助种植者或农学家对大规模田地进行实时监测;然而它只能对病害进行分类,不能检测病害的数量和位置。
[0004]在检测方面,Shen等人基于深度学习物体检测框架,对被瓦楞纸板型诱捕器诱捕的害虫图像进行定位和识别,基于深度学习的物体检测框架Faster R

CNN[9],取得了88%的平均识别精度。然而,这种方法是为特定背景设计的而在现实世界中不够稳健。Alvaro Fuentes等人提出了一个基于深度学习的鲁棒性检测器来检测番茄植物病害,该模型使用R

FCN与ResNeXt

50为主干。可以识别9种不同类型的病害,并达到85.98%的平均精度(mAP)。然而,该模型对一些疾病检测效果不够理想,如叶霉病、灰霉病、溃疡病和瘟疫。
[0005]在实际应用层面,已经有很多基于深度学习的害虫检测系统。Everton Castelao Tetila等人提出一种基于深度学习的大豆害虫自动分类和计数方法。采用Slic超级像素分割算法对图片中的害虫进行分割,100%微调(FT)的Densenet

201模型的分类精度达到94.89%,平均检测精度达到90.86%。X.F.Xu等人使用Parasnet检测细胞水平的隐孢子虫和贾第虫散射图像。他们在自己的细胞级散射图像上达到了超过95.6%的准确率。在嵌入式Jetson TX2设备上以100fps的速度实现。现有的方法缺陷主要有:基于多模块的卷积神经网络的方法模型精确度鲁棒性不高,对一些特定的目标检测效果较差。

技术实现思路

[0006]本专利技术提出了一种基于多尺度特征融合及动态卷积的福寿螺卵检测方法,解决了目前福寿螺虫卵识别准确度低、模型健壮性差的问题。
[0007]为了实现上述目的,本专利技术的技术方案为:
[0008]一种基于多尺度特征融合及动态卷积的福寿螺卵检测方法,包括以下步骤:
[0009](1)数据集获取过程:采集针对福寿螺卵的航拍图像,并对其中的虫卵进行标注,
标注出图像中虫卵的种类和位置;
[0010](2)构建神经网络过程:使用darknet53作为骨干网络,将卷积核全部替换为动态卷积核,更精确地提取特征;再添加第四个针对更小目标的分支,与其它三个分支的特征进行融合,更准确地定位和识别小目标;
[0011](3)神经网络训练过程:将标注后的福寿螺卵图像数据集送入步骤2构建的神经网络进行训练,直至网络收敛;
[0012](4)测试图像检测过程:利用训练好的神经网络和权重文件来检测测试图像中的福寿螺卵目标。
[0013]以上所述步骤中,步骤(2)中的动态卷积相较于其他神经网络中的传统卷积方式,动态卷积能够更好地提取输入的特征,并且四个尺度的特征融合能够更好地检测小目标,步骤(2)具体包括以下步骤:
[0014](21)在darknet53网络中使用动态卷积模块,更精确地根据不同的输入图像自身的信息,生成各个初始卷积核的权重,再通过初始卷积核及权重的加权和得到各自输入图像的动态卷积核,从而更精确地提取图像信息;
[0015](22)增加第四个分支以获得更高层次的语义信息,将高层次的语义信息与浅层细节信息进行融合,使福寿螺卵的检测结果更好。
[0016]进一步地,在步骤(21)中使用动态卷积来提取图片特征信息,拥有更高的准确性;
[0017]进一步地,在步骤(22)中使用四个尺度的特征融合,将高层次的语义信息与浅层细节信息进行融合,使神经网络对小目标的检测性能更好;
[0018]步骤(3)中具体包括以下步骤:
[0019](31)针对数据集中目标的大小,使用k

means聚类算法,计算适合福寿螺卵尺寸的anchors作为网络的超参数,加快网络收敛速度;
[0020](32)学习率使用余弦衰减的方式,从初始值进行衰减,使神经网络能够达到更好的检测结果;
[0021](33)在神经网络上尝试不同的训练超参数,进行训练,当损失函数收敛或者达到最大迭代次数时,停止训练得到可用于福寿螺卵检测的网络文件和权重文件;
[0022]进一步地,步骤(31)中使用IOU值进行K

means聚类,在采集到的数据集上生成12个大小不同的先验框,分别对应四个大小不同的尺度,每个尺度均对应四个先验框;
[0023]进一步地,步骤(32)中利用余弦函数进行学习率衰减,余弦衰减学习率计算公式如下:
[0024]global_step=min(global_step,decay_steps)
[0025]cosine_decay=0.5*(1+cos(pi*global_step/decay_steps))
[0026]decayed=(1

alpha)*cosine_decay+alpha
[0027]decayed_learning_rate=learning_rate*decayed
[0028]进一步地,步骤(33)中,根据经验和多次的尝试,在训练过程中尝试各种参数的取值,使网络得到更好的收敛效果。
[0029]步骤(4)具体包括以下步骤:
[0030](41)将测试图像送入改进的darknet主干网络中,获取四个尺度的卷积特征图;
[0031](42)将四个尺度的特征进行分层融合;
[0032](43)通过darknet算法对卷积特征图进行处理,输出预测边界值与分类值;
[0033](44)设置阈值,通过非极大值抑制,只保留效果最好的检测框,其余的都过滤掉,若检测框效果都不好都过滤掉,过滤出最终的检测结果。
[0034]有益效果:本专利技术提出了一种基于多尺度特征融合和动态卷积的福寿螺本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多尺度特征融合及动态卷积的福寿螺卵检测方法,其特征在于,包括以下步骤:(1)数据集获取过程:采集针对福寿螺卵的航拍图像,并对其中的虫卵进行标注,标注出图像中虫卵的种类和位置;(2)构建神经网络过程:使用darknet53作为骨干网络,将卷积核全部替换为动态卷积核,再添加第四个针对更小目标的分支,与其它三个分支的特征进行融合;(3)神经网络训练过程:将标注后的福寿螺卵图像数据集送入步骤2构建的神经网络进行训练,直至网络收敛;(4)测试图像检测过程:利用训练好的神经网络和权重文件来检测测试图像中的福寿螺卵目标。2.根据权利要求1所述的基于多尺度特征融合及动态卷积的福寿螺卵检测方法,其特征在于,步骤(2)具体包括以下步骤:(21)在darknet53网络中使用动态卷积模块,更精确地根据不同的输入图像自身的信息,生成各个初始卷积核的权重,再通过初始卷积核及权重的加权和得到各自输入图像的动态卷积核,从而更精确地提取图像信息;(22)增加第四个分支以获得更高层次的语义信息,将高层次的语义信息与浅层细节信息进行融合,使神经网络对小目标的的检测结果更好。3.根据权利要求1所述的基于多尺度特征融合及动态卷积的福寿螺卵检测方法,其特征在于,步骤(3)具体包括以下步骤:(31)针对数据集中目标的大小,使用k

means聚类算法,计算适合福寿螺卵尺寸的anchors作为网络的超参数,加快网络收敛速度;(32)学习率使用余弦衰减的方式,从初始值进行衰减,使神经网络能够达到更好的检测结果;(33)在神经网络上...

【专利技术属性】
技术研发人员:刘宁钟徐亚欣寇金桥
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1