目标检测方法及其模型的训练方法及相关装置、设备制造方法及图纸

技术编号:25188155 阅读:32 留言:0更新日期:2020-08-07 21:15
本申请公开了一种目标检测方法及其模型的训练方法及相关装置、设备,其中,目标检测模型的训练方法包括:获取样本图像,其中,样本图像标注有目标所在的实际区域的实际位置信息;以样本图像中的若干点为检测点,基于每个检测点与实际区域的预设点之间的距离,选择至少一个检测点作为目标的正样本点;利用目标检测模型对样本图像进行目标检测,得到每个正样本点对应的预测区域信息,其中,每个正样本点对应的预测区域信息包括正样本点对应的预测区域的预测位置信息;利用实际位置信息与预测区域信息,确定目标检测模型的损失值;基于目标检测模型的损失值,调整目标检测模型的参数。上述方案,能够提高目标检测的准确性。

【技术实现步骤摘要】
目标检测方法及其模型的训练方法及相关装置、设备
本申请涉及人工智能
,特别是涉及一种目标检测方法及其模型的训练方法及相关装置、设备。
技术介绍
随着神经网络、深度学习等人工智能技术的发展,对神经网络模型进行训练,并利用经训练的神经网络模型完成目标检测等任务的方式,逐渐受到人们的青睐。目前,现有的神经网络模型一般是基于锚框(anchor)匹配或者无锚框(anchorfree)策略,以实现目标检测,然而现有策略在实际使用中仍然存在误检率较高的问题。有鉴于此,如何提高目标检测的准确性成为迫切研究的课题。
技术实现思路
本申请提供一种目标检测方法及其模型的训练方法及相关装置、设备。本申请第一方面提供了一种目标检测模型的训练方法,包括:获取样本图像,其中,样本图像标注有目标所在的实际区域的实际位置信息;以样本图像中的若干点为检测点,基于每个检测点与实际区域的预设点之间的距离,选择至少一个检测点作为目标的正样本点;利用目标检测模型对样本图像进行目标检测,得到每个正样本点对应的预测区域信息,其中,每个正样本点对应的预测区域信息包括正样本点对应的预测区域的预测位置信息;利用实际位置信息与预测区域信息,确定目标检测模型的损失值;基于目标检测模型的损失值,调整目标检测模型的参数。因此,通过将样本图像中的若干点作为检测点,并基于每个检测点与实际区域的预设点之间的距离,选择至少一个检测点作为目标的正样本点,从而利用目标监测模型对样本图像进行目标检测,得到每个正样本点对应的预测区域信息,并利用样本图像中目标所在的实际区域的实际位置信息和预测区域信息所包括的预测位置信息,确定目标检测模型的损失值,从而基于目标检测模型的损失值,调整目标检测模型的参数,能够基于匹配得到的多个正样本点所对应的预测位置信息进行目标检测模型的训练,从而能够在无需设计锚框的前提下,确保召回率,此外,通过基于与位置信息相关的损失值调整目标检测模型的参数,能够确保准确率,进而能够提高目标检测的准确性。其中,样本图像中包含多个目标;以样本图像中的若干点为检测点,基于每个检测点与实际区域的预设点之间的距离,选择至少一个检测点作为目标的正样本点,包括:对样本图像进行降采样,得到对应不同分辨率的多个特征图;基于目标的实际区域的尺寸,将多个目标的实际区域与多个特征图进行分组;其中,尺寸越大的实际区域与分辨率越小的特征图作为同一分组;对于同一分组的特征图和目标的实际区域,以特征图中的每个点为检测点,执行基于每个检测点与实际区域的预设点之间的距离,选择至少一个检测点作为目标的正样本点的步骤。因此,通过对样本图像进行降采样,得到对应不同分辨率的多个特征图,从而基于目标的实际区域的尺寸,将多个目标的实际区域与多个特征图进行分组,且尺寸越大的实际区域和分辨率越小的特征图作为同一分组,从而对同一分组的特征图和目标的实际区域,以特征图的每个点为检测点,执行基于每个检测点与实际区域的预设点之间的距离,选择至少一个检测点作为目标的正样本点的步骤,一方面能够使得分辨率高的特征图负责小尺寸的目标,而分辨率低的特征图负责大尺寸的目标,从而有利于实现多尺度的目标检测,另一方面能够以每个分组的特征图的每个点为检测点进行正样本点的选取,从而能够有利于确保产生尽可能多的正样本点,进而有利于确保召回率,进而有利于提高目标检测的准确性。其中,特征图为m个;基于目标的实际区域的尺寸,将多个目标的实际区域与多个特征图进行分组,包括:计算每个目标的实际区域的面积,将面积的最大值和最小值之间的范围划分为从小到大排序的m个区间;将m个特征图按照分辨率从大到小排列,并将面积属于第i个区间的目标的实际区域与第i个特征图划分至同一分组;其中,i和m为正整数,且i为0至m之间的值。因此,通过计算每个目标的实际区域的面积,将面积的最大值和最小值之间的范围划分为从小到大排序的m个区间,且m与特征图的数量相同,并将m个特征图按照分辨率从大到小排序,将面积属于第i个区间的目标的实际区域与第i个特征图划分至同一分组,能够使得尺寸越大的实际区域与分辨率越小的特征图作为同一分组,从而能够有利于实现多尺度的目标检测,进而能够有利于提高目标检测的准确性。其中,基于每个检测点与实际区域的预设点之间的距离,选择至少一个检测点作为目标的正样本点,包括:获得每个检测点与实际区域的预设点之间的距离;选择与预设点之间的距离满足预设条件的至少一个检测点作为目标的正样本点。因此,通过获取每个检测点与实际区域的预设点之间的距离,并选择与预设点之间的距离满足预设条件的至少一个检测点作为目标的正样本点,能够有利于确保产生尽可能多的正样本点,进而有利于确保召回率,进而有利于提高目标检测的准确性。其中,选择与预设点之间的距离满足预设条件的至少一个检测点作为目标的正样本点,包括:选择与预设点之间的距离最近的前若干个检测点作为目标的正样本点。因此,通过选择与预设点之间的距离最近的前若干个检测点作为目标的正样本点,能够使得每个实际区域均匹配到数量相同的正样本点,从而能够有利于确保不同大小的目标之间的梯度均衡,进而能够有利于提高目标检测的准确性。其中,预测区域信息还包括预测区域的预测置信度;利用实际位置信息与预测区域信息,确定目标检测模型的损失值,包括:利用每个目标的实际位置信息与预测位置信息,得到位置损失值;利用预测置信度,得到置信度损失值;基于位置损失值和置信度损失值,得到目标检测模型的损失值。因此,通过每个目标的实际位置信息与预测位置信息,得到位置损失值,并利用预测置信度得到置信度损失值,从而基于位置损失值和置信度损失值,得到目标检测模型的损失值,能够确保训练过程中损失值计算的准确性,进而能够有利于提高目标检测的准确性。其中,实际位置信息包括实际区域的实际区域尺寸,预测位置信息包括预测区域的预测区域尺寸;利用每个目标的实际位置信息与预测位置信息,得到位置损失值,包括:利用每个目标的实际区域尺寸和预测区域尺寸,得到区域尺寸损失值;基于区域尺寸损失值,得到位置损失值。因此,利用每个目标的实际区域尺寸和预测区域尺寸,得到区域尺寸损失值,并基于区域尺寸损失值,得到位置损失值,能够提高损失值的准确性,能够进一步确保训练过程中损失值计算的准确性,进而能够有利于提高目标检测的准确性。其中,实际位置信息还包括实际区域的预设点位置;预测位置信息还包括预测区域的正样本点与实际区域的预设点之间的预测偏移信息;利用每个目标的实际位置信息与预测位置信息,得到位置损失值,还包括:计算目标的实际区域的预设点位置与对应的正样本点位置之间的实际偏移信息;利用实际偏移信息和预测偏移信息,得到偏移损失值;基于区域尺寸损失值,得到位置损失值,包括:基于区域尺寸损失值和偏移损失值,得到位置损失值。因此,基于预测区域的正样本点与实际区域的预设点之间的预测偏移信息,以及实际区域的预设点位置与对应的正样本点位置之间的实际偏移信息,得到偏移损失值,并基于区域尺寸损失值和偏移损失值,得到位置损失值,能够提高本文档来自技高网...

【技术保护点】
1.一种目标检测模型的训练方法,其特征在于,包括:/n获取样本图像,其中,所述样本图像标注有目标所在的实际区域的实际位置信息;/n以所述样本图像中的若干点为检测点,基于每个所述检测点与所述实际区域的预设点之间的距离,选择至少一个所述检测点作为所述目标的正样本点;/n利用目标检测模型对所述样本图像进行目标检测,得到每个所述正样本点对应的预测区域信息,其中,每个所述正样本点对应的预测区域信息包括所述正样本点对应的预测区域的预测位置信息;/n利用所述实际位置信息与所述预测区域信息,确定所述目标检测模型的损失值;/n基于所述目标检测模型的损失值,调整所述目标检测模型的参数。/n

【技术特征摘要】
1.一种目标检测模型的训练方法,其特征在于,包括:
获取样本图像,其中,所述样本图像标注有目标所在的实际区域的实际位置信息;
以所述样本图像中的若干点为检测点,基于每个所述检测点与所述实际区域的预设点之间的距离,选择至少一个所述检测点作为所述目标的正样本点;
利用目标检测模型对所述样本图像进行目标检测,得到每个所述正样本点对应的预测区域信息,其中,每个所述正样本点对应的预测区域信息包括所述正样本点对应的预测区域的预测位置信息;
利用所述实际位置信息与所述预测区域信息,确定所述目标检测模型的损失值;
基于所述目标检测模型的损失值,调整所述目标检测模型的参数。


2.根据权利要求1所述的训练方法,其特征在于,所述样本图像中包含多个所述目标;
所述以所述样本图像中的若干点为检测点,基于每个所述检测点与所述实际区域的预设点之间的距离,选择至少一个所述检测点作为所述目标的正样本点,包括:
对所述样本图像进行降采样,得到对应不同分辨率的多个特征图;
基于所述目标的实际区域的尺寸,将所述多个目标的实际区域与所述多个特征图进行分组;其中,尺寸越大的所述实际区域与分辨率越小的所述特征图作为同一分组;
对于同一分组的特征图和所述目标的实际区域,以所述特征图中的每个点为检测点,执行所述基于每个所述检测点与所述实际区域的预设点之间的距离,选择至少一个所述检测点作为所述目标的正样本点的步骤。


3.根据权利要求2所述的训练方法,其特征在于,所述特征图为m个;
所述基于所述目标的实际区域的尺寸,将所述多个目标的实际区域与所述多个特征图进行分组,包括:
计算每个所述目标的实际区域的面积,将所述面积的最大值和最小值之间的范围划分为从小到大排序的m个区间;
将所述m个特征图按照分辨率从大到小排列,并将面积属于第i个区间的所述目标的实际区域与第i个特征图划分至同一分组;其中,i和m为正整数,且i为0至m之间的值。


4.根据权利要求1至3任一项所述的训练方法,其特征在于,所述基于每个所述检测点与所述实际区域的预设点之间的距离,选择至少一个所述检测点作为所述目标的正样本点,包括:
获得每个所述检测点与所述实际区域的预设点之间的距离;
选择与所述预设点之间的距离满足预设条件的至少一个所述检测点作为所述目标的正样本点。


5.根据权利要求4所述的训练方法,其特征在于,所述选择与所述预设点之间的距离满足预设条件的至少一个所述检测点作为所述目标的正样本点,包括:
选择与所述预设点之间的距离最近的前若干个检测点作为所述目标的正样本点。


6.根据权利要求1所述的训练方法,其特征在于,所述预测区域信息还包括所述预测区域的预测置信度;
所述利用所述实际位置信息与所述预测区域信息,确定所述目标检测模型的损失值,包括:
利用每个目标的所述实际位置信息与所述预测位置信息,得到位置损失值;
利用所述预测置信度,得到置信度损失值;
基于所述位置损失值和所述置信度损失值,得到所述目标检测模型的损失值。


7.根据权利要求6所述的训练方法,其特征在于,所述实际位置信息包括所述实际区域的实际区域尺寸,所述预测位置信息包括所述预测区域的预测区域尺寸;
所述利用每个目标的所述实际位置信息与所述预测位置信息,得到位置损失值,包括:
利用每个所述目标的实际区域尺寸和预测区域尺寸,得到区域尺寸损失值;
基于所述区域尺寸损失值,得到位...

【专利技术属性】
技术研发人员:宋涛
申请(专利权)人:上海商汤智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1