本申请公开了一种目标检测模型训练方法和装置,涉及图像识别技术领域。所述训练方法包括获取样本图像对应的多个目标特征图像,并将各目标特征图像输入到检测头网络中进行特征识别,得到每个锚点框对应的多个训练目标的若干个预测属性信息,目标特征图像中的每个像素至少包括一个锚点框;然后建立若干个预测属性信息和多个训练目标的检测框之间的特征连接关系,最后依据特征连接关系,确定所述目标检测模型的损失函数,并基于损失函数调整模型参数,得到训练完成的目标检测模型。每个锚点框可以朝着多个训练目标进行学习,从而可以增加了每种检测类型对应的训练样本,能够提高预测结果的精确度,适用于密集场景中的目标检测。测。测。
【技术实现步骤摘要】
一种目标检测模型训练方法和装置
[0001]本专利技术涉及图像识别
,特别是涉及一种目标检测模型训练方法和装置。
技术介绍
[0002]目标检测技术指的是对于给定输入的图像或视频数据,能够使计算机自动预测出感兴趣目标定位信息和类别信息的技术。例如现有技术中会将目标检测技术应用于密集场景中。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:在密集场景中,位于同一区域内的目标对象数量较多,普遍存在无法检测到每一个目标对象的情况,从而影响到目标对象检测的准确度。
技术实现思路
[0003]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的目标检测模型训练方法和装置。
[0004]依据本专利技术的第一方面,提供了一种目标检测模型训练方法,所述方法包括:获取样本图像对应的多个目标特征图像;将各目标特征图像输入到检测头网络中进行特征识别,得到每个锚点框对应的多个训练目标的若干个预测属性信息,所述目标特征图像中的每个像素至少包括一个锚点框;建立若干个预测属性信息和多个训练目标的检测框之间的特征连接关系;依据所述特征连接关系,确定所述目标检测模型的损失函数,并基于所述损失函数调整模型参数,得到训练完成的目标检测模型。
[0005]依据本专利技术的第二方面,提供了一种目标检测方法,所述方法包括:获取待检测图像;将所述待检测图像输入到目标检测模型中进行识别,确定所述待检测图像的分类信息和定位信息,所述目标检测模型通过模型训练方法训练得到,所述模型训练方法包括将样本图像对应的各目标特征图像输入到检测头网络中进行特征识别,得到每个锚点框对应的多个训练目标的若干个预测属性信息,建立若干个预测属性信息和多个训练目标的检测框之间的特征连接关系,并确定所述目标检测模型的损失函数,基于所述损失函数调整模型参数,确定训练完成的目标检测模型。
[0006]依据本专利技术的第三方面,提供了一种目标检测模型训练装置,所述目标检测模型包括检测头网络,所述装置包括:特征图像获取模块,用于获取样本图像对应的多个目标特征图像;预测信息确定模块,用于将各目标特征图像输入到检测头网络中进行特征识别,得到每个锚点框对应的多个训练目标的若干个预测属性信息,所述目标特征图像中的每个像素至少包括一个锚点框;特征连接模块,用于建立若干个预测属性信息和多个训练目标的检测框之间的特
征连接关系;参数调整模块,用于依据所述特征连接关系,确定所述目标检测模型的损失函数,并基于所述损失函数调整模型参数,得到训练完成的目标检测模型。
[0007]依据本专利技术的第四方面,提供了一种目标检测装置,所述装置包括:检测图像获取模块,用于获取待检测图像;目标识别模块,用于将所述待检测图像输入到目标检测模型中进行识别,确定所述待检测图像的分类信息和定位信息,所述目标检测模型通过模型训练方法训练得到,所述模型训练方法包括将样本图像对应的各目标特征图像输入到检测头网络中进行特征识别,得到每个锚点框对应的多个训练目标的若干个预测属性信息,建立若干个预测属性信息和多个训练目标的检测框之间的特征连接关系,并确定所述目标检测模型的损失函数,基于所述损失函数调整模型参数,确定训练完成的目标检测模型。
[0008]本专利技术方案中,通过获取样本图像对应的多个目标特征图像,并将各目标特征图像输入到检测头网络中进行特征识别,得到每个锚点框对应的多个训练目标的若干个预测属性信息,目标特征图像中的每个像素至少包括一个锚点框;然后建立若干个预测属性信息和多个训练目标的检测框之间的特征连接关系,最后依据特征连接关系,确定所述目标检测模型的损失函数,并基于损失函数调整模型参数,得到训练完成的目标检测模型。每个锚点框可以朝着多个训练目标进行学习,从而可以增加了每种检测类型对应的训练样本,能够提高预测结果的精确度,适用于密集场景中的目标检测。
[0009]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0010]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。
[0011]在附图中:图1是本专利技术实施例提供的一种目标检测模型训练方法的步骤流程图;图2是本专利技术实施例提供的另一种目标检测模型训练方法的步骤流程图;图3是本专利技术实施例提供的一种目标检测模型的结构示意图;图4是本专利技术实施例提供的一种颈部网络进行图像融合的方法示意图;图5是本专利技术实施例提供的又一种目标检测模型训练方法的步骤流程图;图6是本专利技术实施例提供的一种目标检测方法的步骤流程图;图7是本专利技术实施例提供的一种目标检测模型训练装置的框图;图8是本专利技术实施例提供的一种目标检测装置的框图。
具体实施方式
[0012]下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例
所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。
[0013]参照图1,示出了本专利技术实施例提供的一种目标检测模型训练方法的步骤流程图,所述目标检测模型包括检测头网络,所述方法可以包括:S101、获取样本图像对应的多个目标特征图像。
[0014]本专利技术实施例中,目标检测模型可以包括主干网络、颈部网络以及检测头网络。其中,所述主干网络用于提取目标特征图像的全局的特征图集合。所述特征图集合中包括目标特征图像对应的多个第一特征图像,多个第一特征图像的图像分辨率不同。所述颈部网络用于实现不同图像分辨率的特征图像的融合。由此,将所述特征图集合输入到所述颈部网络中进行处理,实现不同图像分辨率的第一特征图像之间的融合,从而达到目标特征图像的图像特征的增强。将经过所述颈部网络处理得到的特征图像,确定为目标特征图像。
[0015]样本图像指的是为了模型训练,预先确定的目标特征图像。在模型训练过程中,经过主干网络和颈部网络,可以得到同一个样本图像对应的多个目标特征图像。
[0016]S102、将各目标特征图像输入到检测头网络中进行特征识别,得到每个锚点框对应的多个训练目标的若干个预测属性信息,所述目标特征图像中的每个像素至少包括一个锚点框。
[0017]本专利技术实施例中,所述锚点框指的是在图像中预先铺设的包括有参数信息的边界框。其中所述参数信息包括锚点框的位置信息和尺寸信息。例如,边界框是一个矩形框,其可以通过矩形框的左上角的坐标信息和右下角的坐标信息确定。一种示例中,可以将左上角的坐标信息作为锚点框的位置信息,通过左上角的坐标信息和右下角的坐标信息计算出矩形框的宽度和高度,并将所述矩形框的宽度和高度作为锚点框的尺寸信息。另一种示例中,可以本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种目标检测模型训练方法,其特征在于,所述目标检测模型包括检测头网络,所述方法包括:获取样本图像对应的多个目标特征图像;将各目标特征图像输入到检测头网络中进行特征识别,得到每个锚点框对应的多个训练目标的若干个预测属性信息,所述目标特征图像中的每个像素至少包括一个锚点框;建立若干个预测属性信息和多个训练目标的检测框之间的特征连接关系;依据所述特征连接关系,确定所述目标检测模型的损失函数,并基于所述损失函数调整模型参数,得到训练完成的目标检测模型。2.根据权利要求1所述的目标检测模型训练方法,其特征在于,所述检测头网络包括分类子网络和回归子网络;所述将各目标特征图像输入到检测头网络中进行特征识别,得到每个预测锚点框对应的多个训练目标的若干个预测属性信息,包括:将各目标特征图像分别输入到所述分类子网络中识别,得到每个锚点框对应的多个训练目标的分类信息;将各目标特征图像分别输入到所述回归子网络中识别,得到每个锚点框对应的多个训练目标的定位信息;分别将各分类信息和定位信息按序组合,作为多个训练目标的若干个预测属性信息。3.根据权利要求2所述的目标检测模型训练方法,其特征在于,所述建立若干个预测属性信息和多个训练目标的检测框之间的特征连接关系,包括:计算每个训练目标的检测框和对应的锚点框之间的第一交并比;降序排列各第一交并比,并清除符合阈值条件的第一交并比,生成交并序列;建立若干个预测属性信息和所述交并序列中各第一交并比所对应的检测框的特征连接关系。4.根据权利要求2所述的目标检测模型训练方法,其特征在于,所述建立若干个预测属性信息和多个训练目标的检测框之间的特征连接关系,包括:计算每个训练目标的检测框和每个预测属性信息之间的匹配代价;在所述匹配代价符合匹配条件时,建立若干个预测属性信息和多个训练目标的检测框之间的特征连接关系。5.根据权利要求4所述的目标检测模型训练方法,其特征在于,所述计算每个训练目标的检测框和每个预测属性信息之间的匹配代价,包括:计算每个训练目标的检测框和每个预测属性信息之间的交并比差值;计算每个训练目标的检测框和每个预测属性信息之间的定位差值;确定每个训练目标对应的真实分类在每个预测属性信息中的预测概率差值;对所述交并比差值、定位差值以及预测概率差值进行加权,确定对应的匹配代价。6.一种目标检测方...
【专利技术属性】
技术研发人员:田鲲,叶云,黄冠,
申请(专利权)人:北京鉴智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。