优化行人检测模型的训练数据集的方法、装置及存储介质制造方法及图纸

技术编号:27060983 阅读:31 留言:0更新日期:2021-01-15 14:41
本发明专利技术提出了一种用于优化用于行人检测模型的训练数据集的方法,所述方法包括:获取原始的行人数据,原始的行人数据至少包括图像数据、行人位置数据和边界框尺寸数据;获取原始的行人数据的数据分布特性;利用原始的行人数据训练行人检测模型,从而获得原始检测结果;利用原始的行人数据训练数据生成模型,数据生成模型为生成式模型;根据数据分布特性和原始检测结果,利用数据生成模型生成具有特定的边界框尺寸数据的行人数据作为附加的行人数据;基于原始的行人数据和附加的行人数据,构建用于行人检测模型的训练数据集。本发明专利技术还涉及相应的优化装置和计算机可读存储介质。通过本发明专利技术,能够优化训练数据集,以获得准确性更高的行人检测模型。

【技术实现步骤摘要】
优化行人检测模型的训练数据集的方法、装置及存储介质
本专利技术涉及一种用于优化用于行人检测模型的训练数据集的方法、一种用于优化用于行人检测模型的训练数据集的优化装置以及一种计算机可读存储介质。
技术介绍
基于计算机视觉的行人检测技术可通过处理摄像头采集到的图像或视频信息对行人的位置等进行检测。行人检测具有极其重大的意义,它是车辆辅助驾驶、车辆自动驾驶、智能视频监控和人体行为分析等应用中的关键技术。近年来,行人检测技术越来越受到学术界和工业界的重视。传统的行人检测主要通过HOG+SVM来实现,即提取图片的HOG(HistogramofOrientedGradient)特征并利用支持向量机(SVM)进行分类。这种方法使用人工特征来统计计算图像的梯度方向直方图结合SVM分类器来检测行人,虽然它在直立姿态行人图像上取得不错的效果,但是在行人相互遮挡以及非直立状态下效果不好,泛化能力较差。近些年,卷积神经网络在图像识别检测领域产生越来越好的结果,RCNN(RegionswithCNNfeatures)等一系列目标检测模型的精度远远超过传统方法。然而,目前以数据驱动为基础的深度学习行人检测方法在自动驾驶场景下依旧面临一些问题。例如,基于原始的行人数据训练得到的行人检测模型对于某些特殊姿态的行人的检测结果不够准确。可能发生边界框作为检测结果无法完整包含张开的四肢而导致行人重要的姿态信息丢失的情况。现有技术在行人检测模型的准确性方面仍然存在诸多不足。
技术实现思路
本专利技术的目的在于提供一种改进的用于优化用于行人检测模型的训练数据集的方法以及相应的优化装置和计算机可读存储介质,从而优化用于行人检测模型的训练数据集,以获得准确性更高的行人检测模型。根据本专利技术的第一方面,提供了一种用于优化用于行人检测模型的训练数据集的方法,其中,所述方法包括下述步骤:获取原始的行人数据,所述原始的行人数据至少包括图像数据、行人位置数据和边界框尺寸数据;获取原始的行人数据的数据分布特性;利用原始的行人数据训练行人检测模型,从而获得原始检测结果;利用原始的行人数据训练数据生成模型,所述数据生成模型为生成式模型;根据数据分布特性和原始检测结果,利用数据生成模型生成具有特定的边界框尺寸数据的行人数据作为附加的行人数据;以及基于原始的行人数据和附加的行人数据,构建用于行人检测模型的训练数据集。根据本专利技术的一个实施例,所述方法还包括下述步骤:针对边界框尺寸对原始检测结果进行评估,获得检测准确度相对较低的边界框尺寸;以及根据检测准确度相对较低的边界框尺寸,确定所述特定的边界框尺寸数据。根据本专利技术的一个实施例,检测准确度相对较低的边界框尺寸被确定为检测准确度低于平均检测准确度的边界框尺寸。根据本专利技术的一个实施例,所述方法还包括下述步骤:针对边界框尺寸数据分析原始的行人数据的数据分布特性,获得数据数量相对较少的边界框尺寸;以及根据数据数量相对较少的边界框尺寸,确定所述特定的边界框尺寸数据。根据本专利技术的一个实施例,数据数量相对较少的边界框尺寸被确定为与边界框尺寸数据的期望值相差大于边界框尺寸数据的标准差的边界框尺寸。根据本专利技术的一个实施例,确定所述特定的边界框尺寸数据的步骤包括:将所述特定的边界框尺寸数据确定为检测准确度相对较低并且数据数量相对较少的边界框尺寸。根据本专利技术的一个实施例,利用数据生成模型生成具有特定的边界框尺寸数据的行人数据的步骤包括:使生成的行人数据的行人位置数据符合正态分布。根据本专利技术的一个实施例,所述方法还包括:利用所述训练数据集训练行人检测模型,从而获得检测结果,当所述检测结果优于原始检测结果时,确定所述训练数据集为优化的训练数据集合,其中:调整所述正态分布的期望值和/或标准差以获得不同的训练数据集,直到获得优于原始检测结果的检测结果;和/或选择附加的行人数据的不同的子集用于与原始的行人数据构建不同的训练数据集,直到获得优于原始检测结果的检测结果。根据本专利技术的第二方面,提供了一种用于优化用于行人检测模型的训练数据集的优化装置,所述优化装置配置成能够执行根据本专利技术的方法,其中,所述优化装置包括:行人数据分布分析单元,其配置成能够获取原始的行人数据的数据分布特性;检测评估单元,其配置成能够利用原始的行人数据训练行人检测模型,从而获得原始检测结果;极端行人姿态挖掘单元,其配置成能够根据数据分布特性和原始检测结果,确定特定的边界框尺寸数据;以及数据生成单元,其配置成能够利用原始的行人数据训练数据生成模型,并利用数据生成模型生成具有特定的边界框尺寸数据的行人数据,从而构建用于行人检测模型的训练数据集。根据本专利技术的第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算器程序,当所述计算机程序被一个或多于一个处理器执行时,所述处理器能够执行根据本专利技术所述的方法。本专利技术的积极效果在于:基于原始的行人数据的数据分布特性和原始检测结果,利用生成网络生成对应特定姿态的行人数据,能够达到优化训练数据集的目的。本专利技术尤其基于下述发现:某些特殊姿态、例如四肢张开的行人姿态在自然采集的原始的行人数据中的分布较少,因此基于这样不平衡的原始的行人数据训练得到的行人检测模型针对此类特殊姿态的检测结果往往不够准确。通过利用生成网络生成对应此类特殊姿态的行人数据,能够有针对性地优化训练数据集,以用于训练出准确性更高的行人检测模型。进而,能够为后续的行人姿态估计和意图识别提供更完整准确的信息。另外,能够降低行人数据的采集和标注成本。附图说明下面,通过参看附图更详细地描述本专利技术,可以更好地理解本专利技术的原理、特点和优点。附图包括:图1示出了根据本专利技术的一个示例性实施例的用于优化用于行人检测模型的训练数据集的方法的流程图;图2示出了根据本专利技术的一个示例性实施例的方法中的部分步骤的流程图;图3示出了根据本专利技术的一个示例性实施例的方法中的部分步骤的流程图;以及图4示出了根据本专利技术的一个示例性实施例的优化装置的示意图。具体实施方式为了使本专利技术所要解决的技术问题、技术方案以及有益的技术效果更加清楚明白,以下将结合附图以及多个示例性实施例对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本专利技术,而不是用于限定本专利技术的保护范围。图1示出了根据本专利技术的一个示例性实施例的用于优化用于行人检测模型的训练数据集的方法的流程图。用于优化用于行人检测模型的训练数据集的方法可包括下述步骤:S1:获取原始的行人数据,所述原始的行人数据至少包括图像数据、行人位置数据和边界框尺寸数据;S2:获取原始的行人数据的数据分布特性;S3:利用原始的行人数据训练行人检测模型,从而获得原始检测结果;S4:利用原始的行人数据训练数据生成模型,所述数据生成模型为生成式模型;...

【技术保护点】
1.一种用于优化用于行人检测模型的训练数据集的方法,其中,所述方法包括下述步骤:/n获取原始的行人数据,所述原始的行人数据至少包括图像数据、行人位置数据和边界框尺寸数据;/n获取原始的行人数据的数据分布特性;/n利用原始的行人数据训练行人检测模型,从而获得原始检测结果;/n利用原始的行人数据训练数据生成模型,所述数据生成模型为生成式模型;/n根据数据分布特性和原始检测结果,利用数据生成模型生成具有特定的边界框尺寸数据的行人数据作为附加的行人数据;以及/n基于原始的行人数据和附加的行人数据,构建用于行人检测模型的训练数据集。/n

【技术特征摘要】
1.一种用于优化用于行人检测模型的训练数据集的方法,其中,所述方法包括下述步骤:
获取原始的行人数据,所述原始的行人数据至少包括图像数据、行人位置数据和边界框尺寸数据;
获取原始的行人数据的数据分布特性;
利用原始的行人数据训练行人检测模型,从而获得原始检测结果;
利用原始的行人数据训练数据生成模型,所述数据生成模型为生成式模型;
根据数据分布特性和原始检测结果,利用数据生成模型生成具有特定的边界框尺寸数据的行人数据作为附加的行人数据;以及
基于原始的行人数据和附加的行人数据,构建用于行人检测模型的训练数据集。


2.如权利要求1所述的方法,其中,所述方法还包括下述步骤:
针对边界框尺寸对原始检测结果进行评估,获得检测准确度相对较低的边界框尺寸;以及
根据检测准确度相对较低的边界框尺寸,确定所述特定的边界框尺寸数据。


3.如权利要求2所述的方法,其中,检测准确度相对较低的边界框尺寸被确定为检测准确度低于平均检测准确度的边界框尺寸。


4.如权利要求1-3中任一项所述的方法,其中,所述方法还包括下述步骤:
针对边界框尺寸数据分析原始的行人数据的数据分布特性,获得数据数量相对较少的边界框尺寸;以及
根据数据数量相对较少的边界框尺寸,确定所述特定的边界框尺寸数据。


5.如权利要求4所述的方法,其中,数据数量相对较少的边界框尺寸被确定为与边界框尺寸数据的期望值相差大于边界框尺寸数据的标准差的边界框尺寸。


6.如权利要求4或5所述的方法,其中,确定所述特定的边界框尺寸数据的步骤包括:将所述特定的边界框尺寸数据确定为检测...

【专利技术属性】
技术研发人员:张武强王宝锋支蓉郭子杰
申请(专利权)人:戴姆勒股份公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1