多目标检测方法、装置和存储介质制造方法及图纸

技术编号：27478699 阅读：26 留言：0更新日期：2021-03-02 17:48

本发明专利技术提供了一种多目标检测方法，装置及存储介质，通过构建一种改进的YOLO

全部详细技术资料下载

【技术实现步骤摘要】
多目标检测方法、装置和存储介质

[0001]本专利技术涉及深度学习
，具体涉及一种多目标检测检测方法、装置和存储介质。

技术介绍

[0002]在很多目标检测的应用场景中，需要检测的目标是存在从属关系的。比如：有时候我们可能想要检测电脑屏幕是在玩游戏还是在办公；有时候我们想要检测在某一物体上是否存在另外一个物体；比如面包上是火腿还是肉松或者什么都没有；有时候我们可能需要检测车子上是什么logo。随着深度学习近年来的迅猛发展，越来越多的深度学习模型开始广泛应用于计算机视觉的各项技术中。基于卷积神经网络的目标检测方法大幅提高了检测精度与速度；但是现有的YOLO v3模型提取的特征过于单一，导致在多目标检测的场景中无法快速准确进行识别。

技术实现思路

[0003]本专利技术的目的是提供一种多目标检测方法，装置及存储介质，用以检测场景中相似度较大且具有不同尺度的多个目标。
[0004]为了达到上述目的，本专利技术一方面提供一种多目标检测方法，包括：
[0005]建立数据集，所述数据集包括应用场景中不同尺度的检测对象及其标注，所述标注用以确定对象之间的嵌套关系；
[0006]模型构建，基于YOLO-V3模型进行修改，将用以特征提取的卷积层与用以对象识别的yolo层之间分别增加空洞卷积层、转置卷积层和可分离卷积层，生成修改后的YOLO-DN模型；
[0007]模型训练，定义损失函数，通过K-means聚类方法生成锚框，采用数据集分别训练YOLO-DN模型和YOLO-V3模型；<...

【技术保护点】

【技术特征摘要】
1.多目标检测方法，其特征在于，包括：建立数据集，所述数据集包括应用场景中不同尺度的检测对象及其标注，所述标注用以确定对象之间的嵌套关系；模型构建，基于YOLO-V3模型进行修改，将用以特征提取的卷积层与用以对象识别的yolo层之间分别增加空洞卷积层、转置卷积层和可分离卷积层，生成修改后的YOLO-DN模型；模型训练，定义损失函数，通过K-means聚类方法生成锚框，采用数据集分别训练YOLO-DN模型和YOLO-V3模型；模型剪枝，在所述空洞卷积层、转置卷积层和可分离卷积层后增加BN层，利用BN层的系数进行通道剪枝和模型压缩；模型检测，将YOLO-V3模型与YOLO-DN模型的检测结果进行比较，根据比较结果验证YOLO-DN模型的准确度。2.如权利要求1所述的多目标检测方法，其特征在于，还包括以下步骤：建立空洞卷积层，所述空洞卷积层基于不同膨胀率的空洞卷积对多尺度的目标进行检测；建立转置卷积层，所述转置卷积恢复卷积计算的空间分辨率，对粗粒化图像进行卷积操作；建立可分离卷积层，所述可分离卷积层通过区域和通道的分离实现卷积操作。3.如权利要求1所述的多目标检测方法，其特征在于，在模型构建过程中，所述卷积层的计算公式为：其中l表示第l层卷积层，j代表当前卷积层的第j个特征图，示第l-1层卷积层的第j个特征图，表示第1层卷积层第j个特征图的第m个卷积核，Mj表示第j个特征图对应的所有卷积核集合，符号*代表卷积运算，表示第l层卷积第j个特征图的偏置参数，f(x)代表激活函数。4.如权利要求3所述的多目标检测方法，其特征在于，所述激活函数包括Leaky-ReLU和ELU，其中Leaky-ReLU的计算公式为：ELU的计算公式为：5.如权利要求4所述的多目标检测方法，其特征在于，所述模型的损失函数为...

【专利技术属性】
技术研发人员：刘凤余，张冲，张平平，
申请(专利权)人：上海卓繁信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人