一种图像数据标注方法、装置、电子设备以及可读存储介质制造方法及图纸

技术编号：40604575 阅读：11 留言：0更新日期：2024-03-12 22:10

本申请公开了一种图像数据标注方法，包括以下步骤：获取车辆行驶过程中用于表征行驶环境信息的至少一图像；采用切割模型对所述至少一图像进行标注，获得第一样本数据集；所述第一样本数据集包括所述图像和所述图像对应的标注信息；基于所述第一样本数据集对所述切割模型进行迭代训练，以通过迭代训练后的所述切割模型对待标注图像进行标注。如此，能够在车辆自动驾驶时，对行驶环境图像进行高效、准确地标注。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器学习领域，尤其涉及一种图像数据标注方法、装置、电子设备以及可读存储介质。

技术介绍

1、数据标注是机器学习领域的一个重要环节，数据模型需要有足够多的标注数据才能学习到数据内在的规律和模式。在自动驾驶领域，数据标注最主要的技术是图像切割，这涉及到对车辆周围环境的识别和解析，如道路、行人、车辆、交通标志等。

2、随着深度学习技术的发展，越来越多的图像切割方法被提出，例如u-net、mask r-cnn等，这些方法在医学图像处理、遥感图像解析等领域得到了广泛应用。然而，在自动驾驶领域，准确的图像切割对于自动驾驶的安全性至关重要，而由于其场景的复杂性和实时性的要求，这些方法的性能并不完全满足实际应用的需求，无法对行驶环境进行高效、准确地标注。

技术实现思路

1、本申请的目的在于提供一种图像数据标注方法、装置、电子设备以及可读存储介质，能够实现在车辆自动驾驶中，对行驶环境图像进行高效、准确地标注。

2、为达到上述目的：

3、第一方面，本申请实施例提供了一种图像数据标注方法，包括以下步骤：获取车辆行驶过程中用于表征行驶环境信息的至少一图像；

4、采用切割模型对所述至少一图像进行标注，获得第一样本数据集；所述第一样本数据集包括所述图像和所述图像对应的标注信息；

5、基于所述第一样本数据集对所述切割模型进行迭代训练，以通过迭代训练后的所述切割模型对待标注图像进行标注。

6、在一实施方式中，所述采用切割模型对所

7、对所述至少一图像进行预处理；所述预处理包括以下至少一种：格式转化、删除重复或无效图像、几何矫正、图像增强、滤波。

8、在一实施方式中，所述采用切割模型对所述至少一图像进行标注，获得第一样本数据集，包括：

9、采用切割模型对所述至少一图像进行标注，获得初始样本数据集；所述初始样本数据集包括所述图像和所述图像对应的标注信息；

10、对至少一目标图像和所述目标图像对应的标注信息同时执行目标操作，并将执行目标操作后的所述目标图像和所述目标图像对应的标注信息分别添加至背景图像的预设方位中，获得至少一第一图像和所述第一图像对应的标注信息；所述目标图像为从所述初始样本数据集中确定的图像；所述目标操作包括以下至少一种：缩放、裁剪、切割；

11、基于所述初始的样本数据集以及所述第一图像和所述第一图像对应的标注信息，生成第一样本数据集。

12、在一实施方式中，在所述基于所述初始的样本数据集以及所述第一图像和所述第一图像对应的标注信息，生成第一样本数据集之后，还包括：

13、根据所述第一样本数据集中每一类别的样本的权重以及特征值，计算每个样本的加权值；

14、根据所述加权值对所述第一样本数据集进行调整，以使所述每一类别的样本在所述第一样本数据集中分布均匀。

15、在一实施方式中，所述基于所述第一样本数据集对所述切割模型进行迭代训练，包括：

16、获取所述切割模型对所述第一样本数据集的第一识别结果，所述第一识别结果包括标注失败的图像；

17、利用第二样本数据集对所述切割模型进行训练，并获取训练后的所述切割模型对第三样本数据集的第二识别结果；所述第二样本数据集包括所述标注失败的图像和新获取的至少一第二图像；所述第三样本数据集包括所述第一样本数据集和所述第二图像；所述第二识别结果包括识别精度；

18、在确定所述第二识别结果对应的识别精度满足预设条件时，退出迭代训练。

19、在一实施方式中，所述方法还包括：在确定所述第二识别结果对应的识别精度不满足预设条件时，利用第四样本数据集对所述切割模型进行训练，并获取训练后的所述切割模型对第五样本数据集的第三识别结果；所述第四样本数据集包括所述标注失败的图像和新获取的至少一第三图像；所述第四样本数据集包括所述第一样本数据集和所述第三图像。

20、第二方面，本专利技术提供了一种图像数据标注装置，包括：

21、获取模块，用于获取行驶过程中用于表征行驶环境信息的至少一图像；

22、切割模块，用于采用切割模型对所述至少一图像进行标注，获得第一样本数据集；

23、训练模块，用于基于所述第一样本数据集对所述切割模型进行迭代训练，以通过迭代训练后的所述切割模型对目标图像数据进行标注。

24、在一实施方式中，所述装置还包括：

25、预处理模块，用于对所述至少一图像进行预处理，以使所述至少一图像能够被所述切割模型准确标注。

26、在一实施方式中，所述预处理包括以下至少一种：格式转化、删除重复或无效图像、几何矫正、图像增强、滤波。

27、在一实施方式中，所述切割模块，具体用于：

28、采用切割模型对所述至少一图像进行标注，获得初始样本数据集；所述初始样本数据集包括所述图像和所述图像对应的标注信息；

29、对至少一目标图像和所述目标图像对应的标注信息同时执行目标操作，并将执行目标操作后的所述目标图像和所述目标图像对应的标注信息分别添加至背景图像的预设方位中，获得至少一第一图像和所述第一图像对应的标注信息；所述目标图像为从所述初始样本数据集中确定的图像；所述目标操作包括以下至少一种：缩放、裁剪、切割；

30、基于所述初始的样本数据集以及所述第一图像和所述第一图像对应的标注信息，生成第一样本数据集。

31、在一实施方式中，所述训练模块，具体用于：

32、获取所述切割模型对所述第一样本数据集的第一识别结果，所述第一识别结果包括标注失败的图像；

33、利用第二样本数据集对所述切割模型进行训练，并获取训练后的所述切割模型对第三样本数据集的第二识别结果；所述第二样本数据集包括所述标注失败的图像和新获取的至少一第二图像；所述第三样本数据集包括所述第一样本数据集和所述第二图像；所述第二识别结果包括识别精度；

34、在确定所述第二识别结果对应的识别精度满足预设条件时，退出迭代训练。

35、在一实施方式中，所述训练模块，具体用于：

36、在确定所述第二识别结果对应的识别精度不满足预设条件时，利用第四样本数据集对所述切割模型进行训练，并获取训练后的所述切割模型对第五样本数据集的第三识别结果；所述第四样本数据集包括所述标注失败的图像和新获取的至少一第三图像；所述第四样本数据集包括所述第一样本数据集和所述第三图像。

37、在一实施方式中，所述装置还包括：

38、样本均匀模块，用于根据所述第一样本数据集中每一类别的样本的权重以及特征值，计算每个样本的加权值；

39、根据所述加权值对所述第一样本数据集进行调整，以使所述每一类别的样本在所述第一样本数据集中分布均匀。

40、第三方面，本专利技术提供了一种电子设备，包括处理器和用于本文档来自技高网...

【技术保护点】

1.一种图像数据标注方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述采用切割模型对所述至少一图像进行标注，获得第一样本数据集之前，还包括：

3.根据权利要求1所述的方法，其特征在于，所述采用切割模型对所述至少一图像进行标注，获得第一样本数据集，包括：

4.根据权利要求3所述的方法，其特征在于，在所述基于所述初始的样本数据集以及所述第一图像和所述第一图像对应的标注信息，生成第一样本数据集之后，还包括：

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述基于所述第一样本数据集对所述切割模型进行迭代训练，包括：

6.根据权利要求5所述的方法，其特征在于，还包括：

7.一种图像数据标注装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，还包括：

9.一种电子设备，其特征在于，包括处理器和用于存储可执行指令的存储器；

10.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由处理器执行时，实现如权利要求1-6中

...

【技术特征摘要】

1.一种图像数据标注方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述采用切割模型对所述至少一图像进行标注，获得第一样本数据集之前，还包括：

3.根据权利要求1所述的方法，其特征在于，所述采用切割模型对所述至少一图像进行标注，获得第一样本数据集，包括：

5.根据权利要求1至4中任一...

【专利技术属性】
技术研发人员：梅璐莹，
申请(专利权)人：浙江吉利控股集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人