【技术实现步骤摘要】
一种基于数据增强的生活垃圾数据集生成方法
[0001]本专利技术涉及深度学习及生活垃圾识别领域,尤其涉及一种基于Copy
‑
Paste数据增强的生活垃圾数据集生成方法。
技术介绍
[0002]在计算机图像识别领域,基于深度学习的图像目标检测目标成为了重要的研究方向,近年来,深度学习技术在生活垃圾分类与识别方面得到了广泛应用,然而数据样本量不足和数据样本类别不均衡成为制约深度学习在生活垃圾目标识别中的重要因素,在构建用于分类的大量标记数据集时,需要一个专业人员对每个图像进行标注,会出现标记数据很耗时和标记数据可能很昂贵的问题。
[0003]此外,在一个特定的场景中找到一个包含实例的大型标记数据集是不大可能的,一旦场景改变,原来的模型便无法准确检测物体,所以每一个具有新实例的新环境又需要进行数据重新收集和注释。而在工程应用上需要的是一个标准化的系统,能够高效快速地获取大量的有效数据集供模型进行训练。
[0004]在此之前,解决这类问题一个较为成功的研究方向是使用合成渲染的场景和对象作为数据集来进行训练。然而这种方法需要耗费很大的工作量来使得场景及对象尽可能地逼真,确保高质量的全局和局部一致性。另外,通过这种合成数据集训练的模型泛化能力很差。
[0005]因此,现有技术需要一种基于Copy
‑
Paste数据增强的生活垃圾数据集生成方法,在真实图像中粘贴真实对象的掩膜,从而减少对图形渲染的依赖。
技术实现思路
[0006]为了解决现有技术存在的上述问 ...
【技术保护点】
【技术特征摘要】
1.一种基于数据增强的生活垃圾数据集生成方法,其特征在于,方法具体步骤如下:将生活垃圾分作若干批次,每一批次为相同类别,并且分批将生活垃圾稀疏放置在传送带上;使用RGB
‑
D采集系统对物体进行彩色图和高度图的图像采集;所述的RGB
‑
D采集系统分为彩色成像模块和高度成像模块,所述的彩色成像模块,由Linea Color Camera和同轴光源组成,用于采集物体的彩色图;所述的高度成像模块,为Laser Line
‑
Scaning Sensor,其内部包含一个激光发射器和两台单色相机,用于采集物体的深度图;所述的图像采集为RGB
‑
D系统使用编码器将输送带的位移按固定的比例转换为脉冲信号,然后同时触发彩色成像模块和高度成像模块进行数据的采集;利用高度图中物体的轮廓信息和高度信息,对彩色图进行自动标注;通过Copy
‑
Paste将N个物体随机粘贴到图像模板上,N为整数,生成第一批生活垃圾数据集A1;使用第一批生活垃圾数据集A1对深度学习模型进行训练;使用训练好的深度学习模型对未标注的生活垃圾数据集D进行预测;以带有伪标签的数据集作为图像模板,通过Copy
‑
Paste对第一批生活垃圾数据集A1进行数据增强,生成第二批生活垃圾数据集A2;合并第一批生活垃圾数据集A1和第二批生活垃圾数据集A2,形成合并生活垃圾数据集B1。2.根据权利要求1所述的一种基于Copy
‑
Paste数据增强的生活垃圾数据集生成方法,其特征在于,所述的利用高度图中物体的轮廓信息和高度信息,对彩色图进行自动标注,包括如下步骤:读取需要进行自动标注的生活垃圾图像,获取采集的高度图中物体的轮廓信息以及高度信息;利用高度图的高度信息将传送带上的干扰物进行去除;通过高度图生成物体的掩膜图像,得到物体的轮廓标签;对同一批次的物体进行自动标注类别,并将标签信息保存在json文件中。3.根据权利要求2所述的一种基于Copy
‑
Paste数据增强的生活垃圾数据集生成方法,其特征在于,对高度图生成的掩膜图像使用OpenCV的findContours函数得到物体的轮廓标签,并标注类别。4.根据权利要求1所述的一种基于Copy
‑
Paste数据增强的生活垃圾数据集生成方法,其特征在于,所述...
【专利技术属性】
技术研发人员:杨建红,蔡振兴,李建涛,房怀英,陈伟鑫,计天晨,杨天成,胡杨洋,汪鑫,黄斐智,冀效胜,
申请(专利权)人:华侨大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。