System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 训练样本集数据增强方法、装置、电子设备及存储介质制造方法及图纸_技高网

训练样本集数据增强方法、装置、电子设备及存储介质制造方法及图纸

技术编号:41833979 阅读:2 留言:0更新日期:2024-06-27 18:17
本发明专利技术公开了一种训练样本集数据增强方法、装置、电子设备及存储介质。该方法包括:获取训练样本集;其中,训练样本集包括至少两帧激光雷达数据和激光雷达数据包含的目标标注结果;针对单帧激光雷达数据,根据各帧激光雷达数据包含的目标标注结果,计算单帧激光雷达数据与剩余激光雷达数据之间的第一关联程度;将第一关联程度小于等于预设第一关联程度的激光雷达数据,确定为第一目标激光雷达数据;对第一目标激光雷达数据进行数据增强,更新训练样本集;训练样本集用于对目标检测模型进行训练;目标检测模型用于检测激光雷达数据中的至少一个目标。本发明专利技术实施例的技术方案在兼顾目标检测模型的检测效果的同时,提高了训练样本集中数据的均衡性。

【技术实现步骤摘要】

本专利技术涉及自动驾驶,尤其涉及一种训练样本集数据增强方法、装置、电子设备及存储介质


技术介绍

1、目标检测模型的训练样本通常来自于采集标注的数据。但是,在采集标注的数据中,不同类别的数据数量之间的差异很大。这将会导致通过采集标注的数据训练出来的目标检测模型在数据数量多的类别上检测效果好,在数据数量少的类别上检测效果差。因此,需要对目标检测模型的训练样本进行数据增强,以提高目标检测模型的检测精度。

2、现有技术中目标检测模型的训练样本的数据增强的方案主要有两种:第一种是通过对数据数量少的类别的整帧数据进行直接复制扩展,使其训练的频次变高。但是,通常含有数据数量少的类别的整帧数据中也含有数据数量多的类别,直接根据类别简单地进行整帧数据的复制,不仅不能使不同类别的数据数量均衡,甚至可能会适得其反。第二种是从目标层面进行数据增强,类似于“抠图”。通过将数量较少的目标抠出来,移动到不含该目标的帧中。但是,由于不同帧之间目标的位置不同,直接抠图的方式可能会出现目标与不含目标的帧中的原有目标发生重叠或目标与地面不吻合等问题,容易引发目标检测模型的错检;同时,盲目地直接扩展比例较少的类别的数据,会导致类别较少的数据训练过于频繁,导致目标检测模型过拟合,这样所得到的目标检测模型适应其他场景的能力较差。


技术实现思路

1、本专利技术提供了一种训练样本集数据增强方法、装置、电子设备及存储介质,在兼顾目标检测模型的检测效果的同时,提高了训练样本集中数据的均衡性。

2、根据本专利技术的一方面,提供了一种训练样本集数据增强方法,所述方法包括:

3、获取训练样本集;其中,所述训练样本集包括至少两帧激光雷达数据和所述激光雷达数据包含的目标标注结果;

4、针对单帧激光雷达数据,根据各帧所述激光雷达数据包含的目标标注结果,计算所述单帧激光雷达数据与剩余激光雷达数据之间的第一关联程度;

5、将所述第一关联程度小于等于预设第一关联程度的激光雷达数据,确定为第一目标激光雷达数据;

6、对所述第一目标激光雷达数据进行数据增强,更新所述训练样本集;所述训练样本集用于对目标检测模型进行训练;所述目标检测模型用于检测激光雷达数据中的至少一个目标。

7、根据本专利技术的另一方面,提供了一种训练样本集数据增强装置,所述装置包括:

8、激光雷达数据获取模块,用于获取训练样本集;其中,所述训练样本集包括至少两帧激光雷达数据和所述激光雷达数据包含的目标标注结果;

9、第一关联程度计算模块,用于针对单帧激光雷达数据,根据各帧所述激光雷达数据包含的目标标注结果,计算所述单帧激光雷达数据与剩余激光雷达数据之间的第一关联程度;

10、第一目标激光雷达数据筛选模块,用于将所述第一关联程度小于等于预设第一关联程度的激光雷达数据,确定为第一目标激光雷达数据;

11、数据增强模块,用于对所述第一目标激光雷达数据进行数据增强,更新所述训练样本集;所述训练样本集用于对目标检测模型进行训练;所述目标检测模型用于检测激光雷达数据中的至少一个目标。

12、根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:

13、至少一个处理器;以及

14、与所述至少一个处理器通信连接的存储器;其中,

15、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的训练样本集数据增强方法。

16、根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的训练样本集数据增强方法。

17、本专利技术实施例的技术方案,通过获取训练样本集,针对单帧激光雷达数据,根据各帧激光雷达数据包含的目标标注结果,计算单帧激光雷达数据与剩余激光雷达数据之间的第一关联程度,将第一关联程度小于等于预设第一关联程度的激光雷达数据,确定为第一目标激光雷达数据,对第一目标激光雷达数据进行数据增强,更新训练样本集,解决了现有技术直接根据类别简单地进行整帧数据的复制,不仅不能使不同类别的数据数量均衡,甚至可能会适得其反的问题,也解决了直接抠图的方式可能会出现目标与不含目标的帧中的原有目标发生重叠或目标与地面不吻合等问题,容易引发目标检测模型的错检,同时,盲目地直接扩展比例较少的类别的数据,会导致类别较少的数据训练过于频繁,导致目标检测模型过拟合,这样所得到的目标检测模型适应其他场景的能力较差的问题,在兼顾目标检测模型的检测效果的同时,提高了训练样本集中数据的均衡性。

18、应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种训练样本集数据增强方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据各帧所述激光雷达数据包含的目标标注结果,计算所述单帧激光雷达数据与剩余激光雷达数据之间的第一关联程度,包括:

3.根据权利要求2所述的方法,其特征在于,所述针对除所述单帧激光雷达数据之外的各其他帧激光雷达数据,根据所述单帧激光雷达数据包含的目标标注结果和所述其他帧激光雷达数据包含的目标标注结果,计算所述单帧激光雷达数据和所述其他帧激光雷达数据之间的关联程度,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述单帧激光雷达数据和所述其他帧激光雷达数据之间的所述类别数量关联程度,确定所述单帧激光雷达数据和所述其他帧激光雷达数据之间的关联程度,包括:

5.根据权利要求4所述的方法,其特征在于,在所述针对所述单帧激光雷达数据包含的单个目标,在所述目标与所述其他帧激光雷达数据包含的各目标之间的交并比中,确定单个目标对应的交并比最大值之后,还包括:

6.根据权利要求1所述的方法,其特征在于,所述对所述第一目标激光雷达数据进行数据增强,更新所述训练样本集,包括:

7.根据权利要求1所述的方法,其特征在于,还包括:

8.一种训练样本集数据增强装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的训练样本集数据增强方法。

...

【技术特征摘要】

1.一种训练样本集数据增强方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据各帧所述激光雷达数据包含的目标标注结果,计算所述单帧激光雷达数据与剩余激光雷达数据之间的第一关联程度,包括:

3.根据权利要求2所述的方法,其特征在于,所述针对除所述单帧激光雷达数据之外的各其他帧激光雷达数据,根据所述单帧激光雷达数据包含的目标标注结果和所述其他帧激光雷达数据包含的目标标注结果,计算所述单帧激光雷达数据和所述其他帧激光雷达数据之间的关联程度,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述单帧激光雷达数据和所述其他帧激光雷达数据之间的所述类别数量关联程度,确定所述单帧激光雷达数据和所述其他帧激光雷达数据之间的关联程度,包括:

【专利技术属性】
技术研发人员:孙雪王宇李锦瑭蒋萌庞伟凇张凯陈光
申请(专利权)人:中国第一汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1