用于视觉概念检测的自监督数据增强方法、系统、设备技术方案

技术编号：31803039 阅读：16 留言：0更新日期：2022-01-08 11:04

本发明专利技术属于图像处理技术领域，公开了一种用于视觉概念检测的自监督数据增强方法、系统、设备，用于视觉概念检测的自监督数据增强方法包括：对数据集中的图像数据进行预处理，进行数据集的初步扩充；对图像对应标注信息进行修改与新增；新增旋转后图像对应的标注文件信息。本发明专利技术使用自监督中图像自身旋转的方法处理了MSCOCO数据集中的所有图像(包括训练集、验证集、测试集)。本发明专利技术修改并增加了MSCOCO数据集中用于目标检测与实例分割的标注信息。将本发明专利技术处理好的数据集应用于YOLOv3模型上，证明了处理后标注信息的可用性，并实现旋转后图像的检测，得到理想的检测效果。得到理想的检测效果。得到理想的检测效果。

全部详细技术资料下载

【技术实现步骤摘要】
用于视觉概念检测的自监督数据增强方法、系统、设备

[0001]本专利技术属于图像处理
，尤其涉及一种用于视觉概念检测的自监督数据增强方法、系统、设备。

技术介绍

[0002]近年来，深度神经网络(Deep neural network，DNN)在目标检测、图像分类等计算机视觉任务上得到了广泛应用并取得了显著成果。然而，目标检测领域存在检测图像有一定角度的倾斜或者检测图像中的目标有一定角度倾斜的问题，从而导致此类图像检测精准度较低。目前，解决这一问题的可行方法是在不影响检测精度的情况下对数据集进行有效的数据增强操作。数据增强是一种常见的数据处理方法，并在处理目标检测模型上展现其显著优势，增强模型的泛化能力。
[0003]图像数据增强即让一张图片变得更加多样，数据增强是人工扩充数据集的一种方法，让有限的数据产生更多有价值的数据。通过寻找这些样本中的相似特征，放入神经网络中进行训练从而提高网络模型的鲁棒性，降低外界因素对目标检测的影响，解决模型过拟合等问题。图像的数据增强操作包含水平翻转、平移、旋转、裁剪、视角变换、jpeg压缩、尺度变换、颜色变换、cutout等。自监督任务是一种基于数据变换的任务，也是一种数据增强的方法，自监督学习的出发点是考虑在缺少标签或者没有标签的情况下，依然能够学习到原始图像中有意义的特征。在数据增强的过程中，这些常用的变换方法可以被全部使用。然而还要考虑图像中目标的标注框(box)位置变换的情况。
[0004]目标检测任务是把图像输入到网络中，经特征提取后输出目标的类别及位...

【技术保护点】

【技术特征摘要】
1.一种用于视觉概念检测的自监督数据增强方法，其特征在于，所述用于视觉概念检测的自监督数据增强方法使用自监督中图像自身旋转的方法对图像进行处理，修改并增加图像中用于目标检测与实例分割的标注信息。2.如权利要求1所述用于视觉概念检测的自监督数据增强方法，其特征在于，所述用于视觉概念检测的自监督数据增强方法包括以下步骤：步骤一，对数据集中的图像数据进行预处理，进行数据集的初步扩充；步骤二，对图像对应标注信息进行修改与新增；新增旋转后图像对应的标注文件信息。3.如权利要求2所述用于视觉概念检测的自监督数据增强方法，其特征在于，步骤一中，所述对数据集中的图像数据进行预处理包括：对图像分别进行四个角度的旋转处理，并对应修改图像的名称。4.如权利要求3所述用于视觉概念检测的自监督数据增强方法，其特征在于，所述四个角度分别为：0
°
、90
°
、180
°
、270
°
。5.如权利要求2所述用于视觉概念检测的自监督数据增强方法，其特征在于，所述对图像对应标注信息进行修改与新增包括：将图像标注文件中的images字段与annotations字段进行修改与新增。6.如权利要求5所述用于视觉概念检测的自监督数据增强方法，其特征在于，所述对图像对应标注信息进行修改与新增包括以下步骤：1)将images字段中file_name的值修改为图像名称一致；当图像置为90
°
和270
°
时，交换images字段中height与width的值；2)根据images字段中id与annotations中image_id的对应关系，找到每张图像中的所有object的bbox，分别根据四个旋转角...

【专利技术属性】
技术研发人员：韩笑，杜方，余振华，宋丽娟，陈宇，王海鹏，
申请(专利权)人：宁夏大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人