一种基于DC-SMKD轻量化牛群检测方法及设备技术

技术编号:33459936 阅读:20 留言:0更新日期:2022-05-19 00:41
本申请提供一种基于DC

【技术实现步骤摘要】
一种基于DC

SMKD轻量化牛群检测方法及设备


[0001]本申请涉及计算机视觉领域,尤其涉及一种基于深度可分离卷积

平滑多层感知知识蒸馏(Depthwise Separable Convolution

Smooth Multi

layer Perceptual Knowledge Distillation,DC

SMKD)轻量化牛群检测方法及设备。

技术介绍

[0002]现有技术中,近年来,YOLO系列算法给牛群检测领域带来了一个新的思路,即融合分类任务和定位任务,图像经过主干网络提取特征之后,通过对这个特征直接进行进一步的分类回归和位置定位,最终得到该物体的位置信息和类别信息。尤其是最新的YOLOv5模型,它使用了端到端的设计思想,提取全图特征。不仅进一步降低了网络模型大小,还保证了检测的速度和精度。然而,YOLOv5模型大小还是不够理想,模型还可以根据需求压缩的更小。模型的轻量化意味着对芯片部署要求更低,极大的降低牛场监控的运营成本,这对于将模型移植到牛场监控设备上具有深远的影响,不仅可以节约建设成本,而且还能提升牛场监控的智能化水平。
[0003]越来越多的研究人员开始了对模型轻量化的研究,也涌现出了大量的研究成果,主要包括低秩分解、模型量化、知识蒸馏。为了在不降低模型精度或者稍微降低模型精度的前提下,可以利用低秩分解来实现模型轻量化。在卷积神经网络的早期发展过程中,就有一些研究者使用低秩滤波器来加速卷积。有研究人员借鉴了Dictionary Learning的方式,改进了一种新型的低秩滤波器,对检测速度有一定的加速作用。但是,这种方法的缺点也很明显,低秩分解不是全局进行,而是逐层进行,这样会导致牛身花纹特征逐层稀疏,主干网络提取不到足够的牛身细节特征,会导致检测效果降低。
[0004]有研究者对卷积神经网络的参数进行量化,来减轻卷积神经网络的负担,从而降低模型大小。模型参数量化也叫Low

bit表达,比如主干网络提取的特征图的参数都是float类型,换成低精度的参数类型,降低模型的大小,实现模型轻量化。研究人员通过k

mean的方法对模型中存在大量冗余的的参数进行量化操作。有学者在前人工作的基础上,对卷积网络模型中的float类型的数据进行8bit量化,理论上可以将模型减小到原来的四分之一。然而,这些方法在牛群检测模型上的缺点显而易见,由于直接对牛群模型进行量化操作,在处理牛群模型这种大型卷积神经网络时,最终的模型将比原始模型损失更多的性能。
[0005]知识蒸馏是指在一个检测效果的较好教师模型的监督下,通过最后一层的输出,来训练一个的检测效果较差的学生模型,从而提升学生模型性能。但是这种方法的缺点也很明显,由于牛群的牛身特征比较复杂,如果忽略了牛身特征的浅层信息,强行让学生模型只学习教师模型的最后的深层特征信息,很难获取到牛身完整的特征。
[0006]然而,这些轻量化模型方法都没有比较完整的获取牛身特征,从而导致牛群检测模型效果降低。

技术实现思路

[0007]本申请的一个目的是提供一种基于DC

SMKD轻量化牛群检测方法及设备,以解决现有技术中如何改进轻量化牛群检测模型,使得在牛群检测过程中获取完整牛身特征并提高检测精确度的问题。
[0008]根据本申请的一个方面,提供了一种基于DC

SMKD轻量化牛群检测方法,包括:
[0009]获取牛群图像,将所述牛群图像处理为VOC数据集格式;
[0010]在YOLOv5s模型中使用可深度分离卷积得到学生模型,所述学生模型通过平滑多层感知知识蒸馏学习教师模型输出的多层特征信息,得到轻量化牛群检测模型;
[0011]将处理后的所述牛群图像输入所述轻量化牛群检测模型中得到牛群检测结果。
[0012]进一步地,上述轻量化牛群检测方法中,所述学生模型和教师模型分别是基于YOLOv5模型中的两个经典模型即YOLOv5s模型和YOLOv5x模型,所述YOLOv5模型包括主干网络层、网络颈层和预测层,所述YOLOv5的主干网络包括一个Focus结构、四个DCBL、三个C3和一个空间金字塔池化(Spatial Pyramid Pooling,SPP)结构。
[0013]进一步地,上述轻量化牛群检测方法中,在YOLOv5s模型中使用可深度分离卷积得到学生模型,所述学生模型通过平滑多层感知知识蒸馏学习教师模型输出的多层特征信息,得到轻量化牛群检测模型,包括:
[0014]在YOLOv5s的主干网络中,采用可深度分离卷积DConv代替标准卷积得到学生模型;
[0015]在所述学生模型和所述教师模型中的预测层分别通过softmax函数输出学生模型特征向量和教师模型特征向量;
[0016]基于所述学生模型特征向量和所述教师模型特征向量,结合平滑损失函数确定联合蒸馏损失函数,通过不断的迭代训练得到轻量化牛群检测模型。
[0017]进一步地,上述轻量化牛群检测方法中,在所述学生模型的预测层中通过softmax函数输出三个不同尺寸的学生模型特征向量;
[0018]在所述教师模型的预测层中通过softmax函数输出三个不同尺寸的教师模型特征向量。
[0019]进一步地,上述轻量化牛群检测方法中,基于所述学生模型特征向量和所述教师模型特征向量,结合平滑损失函数确定联合蒸馏损失函数,包括:
[0020]将所述学生模型特征向量和所述教师模型特征向量输入到平滑损失函数之后得到平滑多层感知损失函数,公式如下:
[0021]L
S

M
=L
smooth
(P
1s
,P
1t
)+L
smooth
(P
2s
,P
2t
)+L
smooth
(P
3s
,P
3t
)
[0022]其中,L
smooth
表示平滑损失函数,P1
s
、P2
s
、P3
s
表示学生模型特征向量,P1
t
,P2
t
,P3
t
表示老师模型特征向量;
[0023]联合蒸馏损失函数公式如下:
[0024]L
KD
=H(y,(P1
s
,P2
s
,P3
s
))+λL
S

M
[0025]其中,λ为调节蒸馏损失的超参数,H(
·
)为BCEWithLogitsLoss损失函数,
[0026]H(y,P(T
i


))=

(ylog本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于DC

SMKD轻量化牛群检测方法,其特征在于,所述方法包括:获取牛群图像,将所述牛群图像处理为VOC数据集格式;在YOLOv5s模型中使用可深度分离卷积得到学生模型,所述学生模型通过平滑多层感知知识蒸馏学习教师模型输出的多层特征信息,得到轻量化牛群检测模型;将处理后的所述牛群图像输入所述轻量化牛群检测模型中得到牛群检测结果。2.根据权利要求1所述的方法,其特征在于,所述学生模型和教师模型分别是基于YOLOv5模型中的两个经典模型即YOLOv5s模型和YOLOv5x模型,所述YOLOv5模型包括主干网络层、网络颈层和预测层,所述YOLOv5的主干网络包括一个Focus结构、四个DCBL、三个C3和一个SPP结构。3.根据权利要求2所述的方法,其特征在于,所述在YOLOv5s模型中使用可深度分离卷积得到学生模型,所述学生模型通过平滑多层感知知识蒸馏学习教师模型输出的多层特征信息,得到轻量化牛群检测模型,包括:在YOLOv5s的主干网络中,采用可深度分离卷积DConv代替标准卷积得到学生模型;在所述学生模型和所述教师模型中的预测层分别通过softmax函数输出学生模型特征向量和教师模型特征向量;基于所述学生模型特征向量和所述教师模型特征向量,结合平滑损失函数确定联合蒸馏损失函数,通过不断的迭代训练得到轻量化牛群检测模型。4.根据权利要求3所述的方法,其特征在于,在所述学生模型的预测层中通过softmax函数输出三个不同尺寸的学生模型特征向量;在所述教师模型的预测层中通过softmax函数输出三个不同尺寸的教师模型特征向量。5.根据权利要求4所述的方法,其特征在于,所述基于所述学生模型特征向量和所述教师模型特征向量,结合平滑损失函数确定联合蒸馏损失函数,包括:将所述学生模型特征向量和所述教师模型特征向量输入到平滑损失函数之后得到平滑多层感知损失函数,公式如下:L
S

M
=L
smooth
(P
1s
,P
1t
)+L
smooth
(P
2s
,P
2t
...

【专利技术属性】
技术研发人员:沈雷徐溢凡
申请(专利权)人:易采天成郑州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1