标注数据集的构建方法、装置、设备和存储介质制造方法及图纸

技术编号：42492723 阅读：21 留言：0更新日期：2024-08-21 13:10

本发明专利技术提供一种标注数据集的构建方法、装置、设备和存储介质，该方法包括：对第一目标进行跟踪采集，得到包括所述第一目标对应的第一标注框的第一样本图像；将所述第一目标所在的区域图像粘贴至背景图像中，得到包括所述第一目标对应的第二标注框的第二样本图像；所述第二标注框为基于所述第一目标所在的区域图像拟合得到的标注框；基于所述第一样本图像和所述第二样本图像对初始目标检测模型进行训练，得到目标检测模型；将至少一帧第三样本图像输入所述目标检测模型，得到所述目标检测模型输出的各所述第三样本图像中第二目标对应的第三标注框；基于包括所述第一标注框的第一样本图像、包括所述第二标注框的第二样本图像和各包括所述第三标注框的第三样本图像，构建标注数据集。本发明专利技术能够实现自动进行图像标注，降低了消耗的人力资源，提高了标注数据集的获取效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理，尤其涉及一种标注数据集的构建方法、装置、设备和存储介质。

技术介绍

1、巡逻无人车通常会搭载侦察光电和相机等设备，可进行自主巡逻侦察，识别存在危险的目标并进行告警，例如非法闯入人员、非法车辆、烟雾火灾或危险动物等。其中，实现上述自主巡逻侦察的核心技术为目标检测。

2、目前，成熟的目标检测为基于卷积神经网络的监督式的学习方法，而监督式的学习方法的核心是快速构建高质量的训练数据集，通过高质量的训练数据集训练高效的目标识别模型。其中，在通过监督式方法对目标识别模型进行训练时，需要对训练数据集中的训练数据进行标注才能正确训练模型。现有技术中，通常是使用标注工具，通过人工方式对图像进行一一标注，以得到能够正常训练目标识别模型的数据集。

3、然而，上述的标注方式中，不仅会消耗巨大的人力资源，而且会使得标注数据集的获取效率较低。

技术实现思路

1、本专利技术提供一种标注数据集的构建方法、装置、设备和存储介质，用以解决现有技术中不仅会消耗巨大的人力资源，而且会使得标注数据集的获取效率较低的缺陷，实现自动进行图像标注，降低所消耗的人力资源，提高标注数据集的获取效率的目的。

2、本专利技术提供一种标注数据集的构建方法，包括：

3、对第一目标进行跟踪采集，得到包括所述第一目标对应的第一标注框的第一样本目标所在的区域图像；

4、将所述第一目标所在的区域图像粘贴至背景图像中，得到包括所述第一目标对应的第二标注框的第二样本图像

5、将至少一帧第三样本图像输入所述目标检测模型，得到所述目标检测模型输出的各所述第三样本图像中第二目标对应的第三标注框；

6、基于包括所述第一标注框的第一样本图像、包括所述第二标注框的第二样本图像和各包括所述第三标注框的第三样本图像，构建标注数据集。

7、根据本专利技术提供的一种标注数据集的构建方法，所述将所述第一目标所在的区域图像粘贴至背景图像中，得到包括所述第一目标对应的第二标注框的第二样本图像，包括：

8、从所述第一样本图像中提取所述第一目标所在的区域图像；

9、对所述第一目标所在的区域图像进行增强处理，得到增强后的区域图像；

10、将所述增强后的区域图像随机粘贴至所述背景图像中，得到包括所述第一目标对应的第二标注框的第二样本图像。

11、根据本专利技术提供的一种标注数据集的构建方法，所述将至少一帧第三样本图像输入所述目标检测模型，得到所述目标检测模型输出的各所述第三样本图像中第二目标对应的第三标注框，包括：

12、将所述至少一帧第三样本图像输入所述目标检测模型，得到所述目标检测模型输出的各所述第三样本图像中第二目标对应的初始标注框；

13、在所有第三样本图像中初始标注框预测正确的第三样本图像的数量和所述第三样本图像的总数量的比值小于预设值的情况下，基于初始标注框预测错误的第三样本图像和/或未检测出目标的第三样本图像，对所述目标检测模型的模型参数进行更新，直至所有第三样本图像中初始标注框预测正确的第三样本图像的数量和所述第三样本图像的总数量的比值大于或等于所述预设值，将最终得到的目标检测模型输出的各所述第三样本图像中第二目标对应的标注框确定为所述第三标注框。

14、根据本专利技术提供的一种标注数据集的构建方法，所述方法还包括：

15、在所有第三样本图像中初始标注框预测正确的第三样本图像的数量和所述第三样本图像的总数量的比值大于或等于所述预设值的情况下，将所述初始标注框确定为所述第三标注框。

16、根据本专利技术提供的一种标注数据集的构建方法，所述第三样本图像为通过网络爬虫和/或基于仿真技术得到的。

17、根据本专利技术提供的一种标注数据集的构建方法，所述基于包括所述第一标注框的第一样本图像、包括所述第二标注框的第二样本图像和各包括所述第三标注框的第三样本图像，构建标注数据集，包括：

18、将所述第一标注框在所述第一样本图像中的位置信息和所述第一目标的类别确定为所述第一样本图像的标注信息；

19、将所述第二标注框在所述第二样本图像中的位置信息和所述第一目标的类别确定为所述第二样本图像的标注信息；

20、将所述第三标注框在所述第三样本图像中的位置信息和所述第二目标的类别确定为所述第三样本图像的标注信息；

21、基于所述第一样本图像的标注信息、所述第二样本图像的标注信息和所述第三样本图像的标注信息，构建所述标注数据集。

22、本专利技术还提供一种标注数据集的构建装置，包括：

23、采集模块，用于对第一目标进行跟踪采集，得到包括所述第一目标对应的第一标注框的第一样本图像；

24、粘贴模块，用于将所述第一目标所在的区域图像粘贴至背景图像中，得到包括所述第一目标对应的第二标注框的第二样本图像；所述第二标注框为基于所述第一目标所在的区域图像拟合得到的标注框；

25、训练模块，用于基于所述第一样本图像和所述第二样本图像对初始目标检测模型进行训练，得到目标检测模型；

26、输入模块，用于将至少一帧第三样本图像输入所述目标检测模型，得到所述目标检测模型输出的各所述第三样本图像中第二目标对应的第三标注框；

27、构建模块，用于基于包括所述第一标注框的第一样本图像、包括所述第二标注框的第二样本图像和各包括所述第三标注框的第三样本图像，构建标注数据集。

28、本专利技术还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述标注数据集的构建方法。

29、本专利技术还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述标注数据集的构建方法。

30、本专利技术还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述标注数据集的构建方法。

31、本专利技术提供的标注数据集的构建方法、装置、设备和存储介质，通过对第一目标进行跟踪采集，可以得到包括第一目标对应的第一标注框的第一样本图像，由于可以通过跟踪算法实现对第一样本图像中第一目标的标注，从而可以避免人工标注的现象，节省了人力和物力。另外，可以将第一目标所在的区域图像粘贴至背景图像中，得到包括第一目标对应的第二标注框的第二样本图像，再基于第一样本图像和第二样本图像对初始目标检测模型进行训练，得到目标检测模型后，将至少一帧第三样本图像输入至目标检测模型中，得到目标检测模型输出的第三样本图像中第二目标对应的第三标注框，由此，第一样本图像、第二样本图像和第三样本图像都已经被标注，上述的标注过程不需要人为参与，实现了全自动的标注，提高了标注数据集本文档来自技高网...

【技术保护点】

1.一种标注数据集的构建方法，其特征在于，包括：

2.根据权利要求1所述的标注数据集的构建方法，其特征在于，所述将所述第一目标所在的区域图像粘贴至背景图像中，得到包括所述第一目标对应的第二标注框的第二样本图像，包括：

3.根据权利要求1所述的标注数据集的构建方法，其特征在于，所述将至少一帧第三样本图像输入所述目标检测模型，得到所述目标检测模型输出的各所述第三样本图像中第二目标对应的第三标注框，包括：

4.根据权利要求3所述的标注数据集的构建方法，其特征在于，所述方法还包括：在所有第三样本图像中初始标注框预测正确的第三样本图像的数量和所述第三样本图像的总数量的比值大于或等于所述预设值的情况下，将所述初始标注框确定为所述第三标注框。

5.根据权利要求1-4任一项所述的标注数据集的构建方法，其特征在于，所述第三样本图像为通过网络爬虫和/或基于仿真技术得到的。

6.根据权利要求1-4任一项所述的标注数据集的构建方法，其特征在于，所述基于包括所述第一标注框的第一样本图像、包括所述第二标注框的第二样本图像和各包括所述第三标注框的第三

7.一种标注数据集的构建装置，其特征在于，包括：

8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述标注数据集的构建方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述标注数据集的构建方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述标注数据集的构建方法。

...

【技术特征摘要】

1.一种标注数据集的构建方法，其特征在于，包括：

5.根据权利要求1-4任一项所述的标注数据集的构建方法，其特征在于，所述第三样本图像为通过网络爬虫和/或基于仿...

【专利技术属性】
技术研发人员：车满强，
申请(专利权)人：广州海格通信集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人