一种用于神经网络训练的数据集生成方法和装置制造方法及图纸

技术编号:32209792 阅读:15 留言:0更新日期:2022-02-09 17:15
本发明专利技术涉及一种用于神经网络训练的数据集生成方法、装置、设备及计算机可读存储介质,包括:首先从包括目标物体信息的视频各帧图像中采集样本图像,其次对滤波降噪后的每张样本图像做特征区域检测,确定每张样本图像的特征区域位置;然后对每张样本图像进行随机不重复的增强变换,从得到的增强图像集的每张增强图像中裁剪出区域图像集,最后将所有样本图像的区域图像集整体压缩打包,生成训练数据集。本发明专利技术所提供的方法能快速生成用于训练的数据集,加速数据集的制作速度,并自动扩充数据的多样性,实现数据增强功能。实现数据增强功能。实现数据增强功能。

【技术实现步骤摘要】
一种用于神经网络训练的数据集生成方法和装置


[0001]本专利技术涉及智能制造
,尤其是指一种用于神经网络训练的数据集生成方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]随着深度学习技术的发展,在物体分类识别上,神经网络的应用愈来愈普遍。神经网络的训练往往需要大量的数据集图片,而在工业领域中,缺乏统一公开的数据集,因此各企业单位需要建立自己产品的图片数据集,用于为神经网络提供丰富的学习样本,以提高神经网络模型的识别的能力。而建立神经网络的数据集往往需要耗费大量的人力物力等资源,且耗时长。
[0003]因此,需要提出一种用于神经网络训练的数据集生成方法来解决上述问题。

技术实现思路

[0004]为此,本专利技术所要解决的技术问题在于克服现有技术中用于神经网络训练的数据集生成耗时长且样本少的缺陷。
[0005]为解决上述技术问题,本专利技术提供了一种用于神经网络训练的数据集生成方法,包括:
[0006]获取预先拍摄完成的包括目标物体的视频,每隔预设帧数,从所述视频各帧图像中采集一张样本图像;
[0007]对每张样本图像进行特征区域检测,确定所述每张样本图像的特征区域;
[0008]根据预设数据增强参数,对所述每张样本图像进行随机不重复的增强变换,得到所述每张样本图像所对应的增强图像集;其中,所述增强变换包括镜像变换和旋转变换;
[0009]根据所述每张样本图像的特征区域,从所述增强图像集的每张增强图像中裁剪出与所述特征区域尺寸相同的区域,得到所述每张样本图像的区域图像集;
[0010]将所有样本图像的区域图像集整体压缩打包,生成训练数据集。
[0011]在本专利技术的一个实施例中,所述对每张样本图像进行特征区域检测,确定所述每张样本图像的特征区域包括:
[0012]对所述每张样本图像进行滤波降噪处理;
[0013]通过对所述滤波降噪处理后的每张样本图像进行遍历操作,计算出所述每张样本图像的Harris角点和FAST角点;
[0014]统计所述Harris角点的矩形区域和所述FAST角点的矩形区域,取两个矩形区域交集的k倍作为所述每张样本图像的特征区域。
[0015]在本专利技术的一个实施例中,所述根据预设数据增强参数,对所述每张样本图像进行随机不重复的增强变换,得到所述每张样本图像所对应的增强图像集包括:
[0016]根据预设数据增强参数m,判断所述每张样本图像是否进行随机不重复的增强变换;
[0017]若所述增强参数m等于1,则所述每张样本图像不进行随机不重复的增强变换;
[0018]若所述增强参数m大于1,则所述每张样本图像进行m

1次随机不重复的增强变换。
[0019]在本专利技术的一个实施例中,所述镜像变换包括:X轴镜像、Y轴镜像和X

Y轴镜像。
[0020]在本专利技术的一个实施例中,所述旋转变换的旋转角度范围为:0
°
~360
°

[0021]在本专利技术的一个实施例中,所述根据所述每张样本图像的特征区域,从所述增强图像集的每张增强图像中裁剪出与所述特征区域尺寸相同的区域,得到所述每张样本图像的区域图像集包括:
[0022]确定所述每张样本图像的特征区域中心点;
[0023]以所述每张样本图像的特征区域中心点为基准,从所述增强图像集的每张增强图像中裁剪出与所述特征区域尺寸相同的区域。
[0024]在本专利技术的一个实施例中,所述将所有样本图像的区域图像集整体压缩打包,生成训练数据集前包括:对所有样本图像的区域图像集进行归一化处理。
[0025]本专利技术提供了一种用于神经网络训练的数据集生成装置,包括:
[0026]采集模块,用于获取预先拍摄完成的包括目标物体的视频,每隔预设帧数,从所述视频各帧图像中采集一张样本图像;
[0027]检测模块,用于对每张样本图像进行特征区域检测,确定所述每张样本图像的特征区域;
[0028]增强模块,用于根据预设数据增强参数,对所述每张样本图像进行随机不重复的增强变换,得到所述每张样本图像所对应的增强图像集;其中,所述增强变换包括镜像变换和旋转变换;
[0029]裁剪模块,用于根据所述每张样本图像的特征区域,从所述增强图像集的每张增强图像中裁剪出与所述特征区域尺寸相同的区域,得到所述每张样本图像的区域图像集;
[0030]生成模块,用于将所有样本图像的区域图像集整体压缩打包,生成训练数据集。
[0031]本专利技术提供了一种用于神经网络训练的数据集生成设备,包括:
[0032]存储器,用于存储计算机程序;
[0033]处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述一种用于神经网络训练的数据集生成方法的步骤。
[0034]本专利技术提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述一种用于神经网络训练的数据集生成方法的步骤。
[0035]本专利技术的上述技术方案相比现有技术具有以下优点:
[0036]本专利技术所提供的数据集生成方法,首先获取预先拍摄完成的包括目标物体的视频,每隔预设帧数,从所述视频各帧图像中采集一张样本图像;其次对每张样本图像做特征区域检测,确定每张样本图像的特征区域位置;然后对每张样本图像进行随机不重复的增强变换,从得到的增强图像集的每张增强图像中裁剪出区域图像集,最后将所有样本图像的区域图像集整体压缩打包,生成训练数据集。本专利技术所提供的方法,根据预设帧数来控制数据集样本图像的相似度;通过对每张样本图像做特征区域检测,精准的识别出每张样本图像的特征区域位置,加快数据集的制作速度;采用随机不重复的增强变换来扩充数据集的多样性,实现数据增强的功能。
附图说明
[0037]为了使本专利技术的内容更容易被清楚的理解,下面根据本专利技术的具体实施例并结合附图,对本专利技术作进一步详细的说明,其中:
[0038]图1为本专利技术所提供的用于神经网络训练的数据集生成方法的第一种具体实施例的流程图;
[0039]图2为本专利技术所提供的用于神经网络训练的数据集生成方法的第二种具体实施例的流程图;
[0040]图3为本专利技术所提供的用于神经网络训练的数据集生成方法的原理示意图;
[0041]图4为本专利技术实施例提供的一种用于神经网络训练的数据集生成方法的结构框图。
具体实施方式
[0042]下面结合附图和具体实施例对本专利技术作进一步说明,以使本领域的技术人员可以更好地理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。
[0043]参照图1所示,图1为本专利技术所提供的用于神经网络训练的数据集生成方法的第一种具体实施例的流程图;具体操作步骤如下:
[0044]步骤S101:获取预先拍摄完成的包括目标物体的视频,每隔预设帧数,从所述视频各帧图像中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于神经网络训练的数据集生成方法,其特征在于,包括:获取预先拍摄完成的包括目标物体的视频,每隔预设帧数,从所述视频各帧图像中采集一张样本图像;对每张样本图像进行特征区域检测,确定所述每张样本图像的特征区域;根据预设数据增强参数,对所述每张样本图像进行随机不重复的增强变换,得到所述每张样本图像所对应的增强图像集;其中,所述增强变换包括镜像变换和旋转变换;根据所述每张样本图像的特征区域,从所述增强图像集的每张增强图像中裁剪出与所述特征区域尺寸相同的区域,得到所述每张样本图像的区域图像集;将所有样本图像的区域图像集整体压缩打包,生成训练数据集。2.根据权利要求1所述的方法,其特征在于,所述对每张样本图像进行特征区域检测,确定所述每张样本图像的特征区域包括:对所述每张样本图像进行滤波降噪处理;通过对所述滤波降噪处理后的每张样本图像进行遍历操作,计算出所述每张样本图像的Harris角点和FAST角点;统计所述Harris角点的矩形区域和所述FAST角点的矩形区域,取两个矩形区域交集的k倍作为所述每张样本图像的特征区域。3.根据权利要求1所述的方法,其特征在于,所述根据预设数据增强参数,对所述每张样本图像进行随机不重复的增强变换,得到所述每张样本图像所对应的增强图像集包括:根据预设数据增强参数m,判断所述每张样本图像是否进行随机不重复的增强变换;若所述增强参数m等于1,则所述每张样本图像不进行随机不重复的增强变换;若所述增强参数m大于1,则所述每张样本图像进行m

1次随机不重复的增强变换。4.根据权利要求1所述的方法,其特征在于,所述镜像变换包括:X轴镜像、Y轴镜像和X

Y轴镜像。5.根据权利要求1所述的方法,其特征在于,所述旋转变换的旋转角度范围为:0
°
...

【专利技术属性】
技术研发人员:万加富谭劲标
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1