针对长宽比大物体的目标检测方法、系统、设备及介质技术方案

技术编号:29675865 阅读:17 留言:0更新日期:2021-08-13 21:58
本申请涉及目标检测技术领域,更为具体来说,本申请涉及针对长宽比大物体的目标检测方法、系统、设备及介质。所述方法包括:获取待检测的目标图像;将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;输出所述目标图像中各物体的位置与多个类别概率值;根据所述多个类别概率值确定出所述各物体的最终类别。本申请所述针对长宽比大物体的目标检测方法在损失函数中额外加入物体长边的中心位置损失值和物体长边的长度损失值,从而引导模型提升对长宽比例大物体的检测性能,进而提升了目标检测精度和效率。

【技术实现步骤摘要】
针对长宽比大物体的目标检测方法、系统、设备及介质
本申请涉及目标检测
,更为具体来说,本申请涉及针对长宽比大物体的目标检测方法、系统、设备及介质。
技术介绍
目标检测是计算机视觉和数字图像处理的重要研究方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域。目标检测的目标是找出图像中感兴趣的对象,包含物体定位和物体分类两个子任务,即同时确定物体的类别和位置。目前,利用神经网络结合大量图片数据进行训练的目标检测模式已经成为行业的主流方式。基于神经网络的算法基本上可以归为两类:以FasterR-CNN为代表的两阶段算法和以YOLO、SSD等为代表的一阶段算法。不论是一阶段算法还是两阶段算法,对于检测长宽比例很大的长条形物体,例如滑雪板、铅笔等,相比检测长宽比例较小的物体,如足球、汽车等,性能有很大程度的下降。一些情况下,网络不能检测出长宽比大的物体,另一些情况,虽然网络可以检测出长宽比大的物体,但是目标位置不够准确,特别是物体的长边检测得不准确。此外,从检测结果看,目前现有的方法很多是在目标的长边出现较大的误差,这也进一步证实了IoU损失的缺点。
技术实现思路
基于上述IoU损失的缺点,本专利技术旨在通过计算物体长边的长度损失值与物体长边的中心位置损失值来优化目标检测模型,从而引导模型提升对长宽比例大物体的检测性能。为实现上述技术目的,本申请提供了一种针对长宽比大物体的目标检测方法,包括以下步骤:一种针对长宽比大物体的目标检测方法,包括以下步骤:获取待检测的目标图像;将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;输出所述目标图像中各物体的位置与多个类别概率值;根据所述多个类别概率值确定出所述各物体的最终类别。具体地,所述目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值,包括:判断物体是否为长宽比大物体,如果是,则计算长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值;根据所述长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值构建所述目标检测模型的损失函数。优选地,所述目标检测模型的训练步骤包括:采集模型训练样本,所述模型训练样本包括长宽比大物体的图像;将所述模型训练样本输入到所述目标检测模型中,输出每个物体的位置信息与类别信息;计算所述目标检测模型的损失值,所述目标检测模型的损失值为位置信息损失值、类别信息损失值、长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值的加权和;利用所述目标检测模型的损失值优化所述目标检测模型。进一步地,所述目标检测模型包括特征提取模块、分类模块与回归模块;将所述模型训练样本输入到所述目标检测模型中,输出每个物体的位置信息与类别信息,包括:从所述模型训练样本中获取第n图像输入所述特征提取模块中,得到图像特征图;针对所述图像特征图的每个位置产生多个不同大小和不同长宽比的候选区域;采用所述分类模块与所述回归模块针对所述候选区域进行分类以及位置调整后,输出所述第n图像中每个物体的位置信息与类别信息。优选地,利用所述目标检测模型的损失值优化所述目标检测模型,包括:根据所述目标检测模型的损失值对所述目标检测模型的参数进行求导,生成局部梯度序列;采用随机梯度下降算法以及所述局部梯度序列对所述目标检测模型进行迭代优化;当所述迭代优化的优化次数等于预设上限值或者所述损失值小于预设阈值时,停止所述模型的优化;生成训练好的目标检测模型。选择性地,所述目标检测模型采用基于锚框的一阶段目标检测模型或采用基于锚框的二阶段目标检测模型。优选地,根据所述多个类别概率值确定出所述各物体的最终类别,包括:选择所述多个类别概率值中的最大概率值;识别所述选择的最大概率值对应的类别;将所述最大概率值对应的类别确定为所述各物体的最终类别。本专利技术第二方面提供了一种针对长宽比大物体的目标检测系统,所述系统包括:图像获取模块,用于获取待检测的目标图像;图像输入模块,用于将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;输出模块,用于输出所述目标图像中各物体的位置与多个类别概率值;最终类别确定模块,用于根据所述多个类别概率值确定出所述各物体的最终类别。本专利技术第三方面提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如下步骤:获取待检测的目标图像;将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;输出所述目标图像中各物体的位置与多个类别概率值;根据所述多个类别概率值确定出所述各物体的最终类别。本专利技术第四方面提供了一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如下步骤:获取待检测的目标图像;将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;输出所述目标图像中各物体的位置与多个类别概率值;根据所述多个类别概率值确定出所述各物体的最终类别。本申请的有益效果为:本专利技术的针对长宽比大物体的目标检测方法在损失函数中额外加入物体长边的中心位置损失值和物体长边的长度损失值,从而引导模型提升对长宽比例大物体的检测性能,进而提升了目标检测精度和效率。附图说明图1示出了本申请一示例性实施例的方法流程示意图;图2示出了本申请一示例性实施例的目标检测模型的结构示意图;图3示出了本申请一示例性实施例的系统结构示意图;图4示出了本申请一实施例所提供的一种电子设备的结构示意图;图5示出了本申请一实施例所提供的一种存储介质的示意图。具体实施方式以下,将参照附图来描述本申请的实施例。但是应该理解的是,这些描述只是示例性的,而并非要限制本申请的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本申请的概念。对于本领域技术人员来说显而易见的是,本申请可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本申请发生混淆,对于本领域公知的一些技术特征未进行描述。应予以注意的是,这里所使用的术语仅是为了描述具体实施例,而非意图限制根据本申请的示例性实施例。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式。此外,还应当理解的是,当在本说明书中使用术语“本文档来自技高网...

【技术保护点】
1.一种针对长宽比大物体的目标检测方法,其特征在于,包括以下步骤:/n获取待检测的目标图像;/n将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;/n输出所述目标图像中各物体的位置与多个类别概率值;/n根据所述多个类别概率值确定出所述各物体的最终类别。/n

【技术特征摘要】
1.一种针对长宽比大物体的目标检测方法,其特征在于,包括以下步骤:
获取待检测的目标图像;
将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;
输出所述目标图像中各物体的位置与多个类别概率值;
根据所述多个类别概率值确定出所述各物体的最终类别。


2.根据权利要求1所述的针对长宽比大物体的目标检测方法,其特征在于,所述目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值,包括:
判断物体是否为长宽比大物体,如果是,则计算长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值;
根据所述长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值构建所述目标检测模型的损失函数。


3.根据权利要求2所述的针对长宽比大物体的目标检测方法,其特征在于,所述目标检测模型的训练步骤包括:
采集模型训练样本,所述模型训练样本包括长宽比大物体的图像;
将所述模型训练样本输入到所述目标检测模型中,输出每个物体的位置信息与类别信息;
计算所述目标检测模型的损失值,所述目标检测模型的损失值为位置信息损失值、类别信息损失值、长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值的加权和;
利用所述目标检测模型的损失值优化所述目标检测模型。


4.根据权利要求3所述针对长宽比大物体的目标检测方法,其特征在于,所述目标检测模型包括特征提取模块、分类模块与回归模块;
将所述模型训练样本输入到所述目标检测模型中,输出每个物体的位置信息与类别信息,包括:
从所述模型训练样本中获取第n图像输入所述特征提取模块中,得到图像特征图;
针对所述图像特征图的每个位置产生多个不同大小和不同长宽比的候选区域;
采用所述分类模块与所述回归模块针对所述候选区域进行分类以及位置调整后,输出所述第n图像中每个物体的位置信...

【专利技术属性】
技术研发人员:廖丹萍
申请(专利权)人:浙江智慧视频安防创新中心有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1