本发明专利技术提供了一种多目标检测方法,装置及存储介质,通过构建一种改进的YOLO
【技术实现步骤摘要】
多目标检测方法、装置和存储介质
[0001]本专利技术涉及深度学习
,具体涉及一种多目标检测检测方法、装置和存储介质。
技术介绍
[0002]在很多目标检测的应用场景中,需要检测的目标是存在从属关系的。比如:有时候我们可能想要检测电脑屏幕是在玩游戏还是在办公;有时候我们想要检测在某一物体上是否存在另外一个物体;比如面包上是火腿还是肉松或者什么都没有;有时候我们可能需要检测车子上是什么logo。随着深度学习近年来的迅猛发展,越来越多的深度学习模型开始广泛应用于计算机视觉的各项技术中。基于卷积神经网络的目标检测方法大幅提高了检测精度与速度;但是现有的YOLO v3模型提取的特征过于单一,导致在多目标检测的场景中无法快速准确进行识别。
技术实现思路
[0003]本专利技术的目的是提供一种多目标检测方法,装置及存储介质,用以检测场景中相似度较大且具有不同尺度的多个目标。
[0004]为了达到上述目的,本专利技术一方面提供一种多目标检测方法,包括:
[0005]建立数据集,所述数据集包括应用场景中不同尺度的检测对象及其标注,所述标注用以确定对象之间的嵌套关系;
[0006]模型构建,基于YOLO-V3模型进行修改,将用以特征提取的卷积层与用以对象识别的yolo层之间分别增加空洞卷积层、转置卷积层和可分离卷积层,生成修改后的YOLO-DN模型;
[0007]模型训练,定义损失函数,通过K-means聚类方法生成锚框,采用数据集分别训练YOLO-DN模型和YOLO-V3模型;<br/>[0008]模型剪枝,在所述空洞卷积层、转置卷积层和可分离卷积层后增加BN层,利用BN层的系数进行通道剪枝和模型压缩;
[0009]模型检测,将YOLO-V3模型与YOLO-DN模型的检测结果进行比较,根据比较结果验证YOLO-DN模型的准确度。
[0010]进一步的,还包括以下步骤:
[0011]建立空洞卷积层,所述空洞卷积层基于不同膨胀率的空洞卷积对多尺度的目标进行检测;
[0012]建立转置卷积层,所述转置卷积恢复卷积计算的空间分辨率,对粗粒化图像进行卷积操作;
[0013]建立可分离卷积层,所述可分离卷积层通过区域和通道的分离实现卷积操作。
[0014]进一步的,在模型构建过程中,所述卷积层的计算公式为:
[0015][0016]其中,l表示第l层卷积层,j代表当前卷积层的第j个特征图,示第l-1层卷积层的第j个特征图,表示第1层卷积层第j个特征图的第m个卷积核,Mj表示第j个特征图对应的所有卷积核集合,符号*代表卷积运算,表示第l层卷积第j个特征图的偏置参数,f(x)代表激活函数。
[0017]进一步的,所述激活函数包括Leaky-ReLU和ELU,其中Leaky-ReLU的计算公式为:
[0018][0019]ELU的计算公式为:
[0020][0021]进一步的,所述模型的损失函数为:
[0022][0023]其中,损失函数中的第一行和第二行表示边界框的位置损失,第三行第四行表示置信度误差,第五行表示框的分类误差;x,y,w,h分别表示边界框的中心点横轴坐标,纵轴坐标,宽度和高。C表示置信度,P表示分类概率。
[0024]进一步的,在模型剪枝过程中,所述BN层数据进行归一化:在训练样本{}上,进行归一化计算过程如下:
[0025]求出样本均值与样本方差,计算公式为:
[0026][0027][0028]将样本数据归一化处理,公式为:
[0029][0030]其中ε是一个极小值,防止分母为零时计算值为NaN;
[0031]对归一化的数据进行重构,令其中γ和β为待学习的参数。
[0032]为了不改变数据的分布特征,γ和β应按照如下公式进行计算:
[0033][0034]β=μ
a
[0035]另一方面,本专利技术还提供了一种多目标检测装置,包括:
[0036]数据获取模块,所述数据获取模块用以构建数据集,所述数据集包括应用场景中不同尺度的检测对象及其标注,所述标注用以确定对象之间的嵌套关系;
[0037]模型构建模块,基于YOLO-V3模型进行修改,将用以特征提取的卷积层与用以对象识别的yolo层之间分别增加空洞卷积层、转置卷积层和可分离卷积层,生成修改后的YOLO-DN模型;
[0038]模型训练模块,定义损失函数,通过K-means聚类方法生成锚框,采用数据集分别训练YOLO-DN模型和YOLO-V3模型;
[0039]模型剪枝模块,在所述空洞卷积层、转置卷积层和可分离卷积层后增加BN层,利用BN层的系数进行通道剪枝和模型压缩;
[0040]模型检测模块,将YOLO-V3模型与YOLO-DN模型的检测结果进行比较,根据比较结果验证YOLO-DN模型的准确度。
[0041]另一方面,本专利技术还提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述多目标检测方法中的步骤。
[0042]本专利技术提供了一种多目标检测方法,装置及存储介质,通过构建一种改进的YOLO-V3模型,并建立具有包含关系的多目标数据集以训练模型,相比传统的目标检测方法在检测多个目标时出现的漏检或错检等缺陷,大大提高了检测准确率,同时降低了漏检率,改进后的模型综合空洞卷积层、转置卷积层和可分离卷积层三种网络结构,具有良好的鲁棒性、对于不同类别目标之间存在遮挡关系时也具有良好的检测效果。
附图说明
[0043]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0044]图1是本专利技术实施例的一种多目标检测方法的方法流程图。
[0045]图2为本专利技术实施例的一种多目标检测装置的系统架构图。
[0046]图3为本专利技术实施例的YOLO-DN模型的结构示意图。
具体实施方式
[0047]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完
整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。、在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
[0048]如果申请文件中出现“第一/第二”的类似描述则增加以下的说明,在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.多目标检测方法,其特征在于,包括:建立数据集,所述数据集包括应用场景中不同尺度的检测对象及其标注,所述标注用以确定对象之间的嵌套关系;模型构建,基于YOLO-V3模型进行修改,将用以特征提取的卷积层与用以对象识别的yolo层之间分别增加空洞卷积层、转置卷积层和可分离卷积层,生成修改后的YOLO-DN模型;模型训练,定义损失函数,通过K-means聚类方法生成锚框,采用数据集分别训练YOLO-DN模型和YOLO-V3模型;模型剪枝,在所述空洞卷积层、转置卷积层和可分离卷积层后增加BN层,利用BN层的系数进行通道剪枝和模型压缩;模型检测,将YOLO-V3模型与YOLO-DN模型的检测结果进行比较,根据比较结果验证YOLO-DN模型的准确度。2.如权利要求1所述的多目标检测方法,其特征在于,还包括以下步骤:建立空洞卷积层,所述空洞卷积层基于不同膨胀率的空洞卷积对多尺度的目标进行检测;建立转置卷积层,所述转置卷积恢复卷积计算的空间分辨率,对粗粒化图像进行卷积操作;建立可分离卷积层,所述可分离卷积层通过区域和通道的分离实现卷积操作。3.如权利要求1所述的多目标检测方法,其特征在于,在模型构建过程中,所述卷积层的计算公式为:其中l表示第l层卷积层,j代表当前卷积层的第j个特征图,示第l-1层卷积层的第j个特征图,表示第1层卷积层第j个特征图的第m个卷积核,Mj表示第j个特征图对应的所有卷积核集合,符号*代表卷积运算,表示第l层卷积第j个特征图的偏置参数,f(x)代表激活函数。4.如权利要求3所述的多目标检测方法,其特征在于,所述激活函数包括Leaky-ReLU和ELU,其中Leaky-ReLU的计算公式为:ELU的计算公式为:5.如权利要求4所述的多目标检测方法,其特征在于,所述模型的损失函数为...
【专利技术属性】
技术研发人员:刘凤余,张冲,张平平,
申请(专利权)人:上海卓繁信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。