一种图像数据增强方法、系统、电子设备及存储介质技术方案

技术编号:28127865 阅读:26 留言:0更新日期:2021-04-19 11:45
本发明专利技术提供一种图像数据增强方法、系统、电子设备及存储介质,方法包括:分别获取实际采集的第一目标图像数据集和从公共数据集中获取第二目标图像数据集;对于所述第二目标图像数据集中的每一张目标图像,通过添加散粒噪声的方式进行增强处理,得到增强处理后的第二目标图像数据集;将第一目标图像数据集和增强处理后的第二目标图像数据集作为最终的目标图像数据集。本发明专利技术对于公共数据集中的目标图像,通过添加散粒噪声的方式进行增强加躁处理,消除公共数据集中的目标图像与实际采集的目标图像之间的差异,扩充实际采集的目标图像数据集。数据集。数据集。

【技术实现步骤摘要】
一种图像数据增强方法、系统、电子设备及存储介质


[0001]本专利技术涉及图像处理领域,更具体地,涉及一种图像数据增强方法、系统、电子设备及存储介质。

技术介绍

[0002]当前,深度神经网络在大数据支持下,通过模型的学习和训练,可以构建出一个性能较为出色的模型,在目标检测、识别和跟踪等图像处理应用领域已经取得了巨大的成功。神经网络模型需要在海量数据支持下才能具备较强的泛化性能,适应不同的环境和场景的应用需求。
[0003]实际采集的目标图像的数据量有限,需要对目标图像数据进行增强扩充,目前常用的数据增强手段有:对实际采集的目标图像水平或垂直翻转;以图像中心随机角度的图像旋转;随机缩放;随机裁剪;图像水平或垂直方向的移位;以及图像的剪切重组等技术手段,来增加原始数据的数据量。
[0004]上述数据增强方法是针对已有的数据(实际采集的目标图像数据)进行数据扩充,其一,在实际的应用中,存在现实应用场景数据不足的问题。其二,进行翻转或缩放等处理的图像来源依然为实际采集的有限的图像数据,这样的数据集不具有泛化性。

技术实现思路

[0005]本专利技术提供一种克服上述问题或者至少部分地解决上述问题的一种图像数据增强方法、系统、电子设备及存储介质。
[0006]根据本专利技术的第一方面,提供了一种图像数据增强方法,包括:分别获取实际采集的第一目标图像数据集和从公共数据集中获取第二目标图像数据集;对于所述第二目标图像数据集中的每一张目标图像,通过添加散粒噪声的方式进行增强处理,得到增强处理后的第二目标图像数据集;将第一目标图像数据集和增强处理后的第二目标图像数据集作为最终的目标图像数据集。
[0007]在上述技术方案的基础上,本专利技术还可以作出如下改进。
[0008]可选的,所述从公共数据集中获取第二目标图像数据集之后还包括:对于公共数据集中的目标图像数据,选取预设比例的目标图像数据作为第二目标图像数据集。
[0009]可选的,所述对于所述第二目标图像数据集中的每一张目标图像,通过添加散粒噪声的方式进行增强处理,得到增强处理后的第二目标图像数据集包括:对于第二目标图像数据集中的任一张目标图像,提取所述任一张目标图像中任一个像素点的原始灰度值;基于所述任一个像素点的原始灰度值,生成满足泊松分布的随机数,并对所述随机数进行截断操作,得到截断操作后的随机数;采用截断后的随机数替换原始灰度值,得到所述任一个像素点替换后的灰度值;遍历所述任一张目标图像中的任一个像素点,得到增强处理后的第二目标图像数据集。
[0010]可选的,所述基于所述任一个像素点的原始灰度值,产生满足泊松分布的随机数
包括:基于所述任一个像素点的原始灰度值,通过调用python中numpy库中的函数产生对应的随机数:
[0011]G
p
=np.random.poisson(λ
p
,1);
[0012]其中,λ
p
为像素点的灰度值,G
p
为产生的随机数。
[0013]可选的,所述对所述随机数进行截断操作,得到截断操作后的随机数包括:按照下式对随机数G
p
进行截断操作:
[0014][0015]其中,G
p
'为截断操作后的随机数。
[0016]根据本专利技术的第二方面,提供一种图像数据增强系统,包括:获取模块,用于分别获取实际采集的第一目标图像数据集和从公共数据集中获取第二目标图像数据集;增强处理模块,用于对于所述第二目标图像数据集中的每一张目标图像,通过添加散粒噪声的方式进行增强处理,得到增强处理后的第二目标图像数据集;确定模块,用于将第一目标图像数据集和增强处理后的第二目标图像数据集确定为最终的目标图像数据集。
[0017]可选的,所述增强处理模块包括:提取单元,用于对于第二目标图像数据集中的任一张目标图像,提取所述任一张目标图像中任一个像素点的原始灰度值;生成单元,用于基于所述任一个像素点的原始灰度值,生成满足泊松分布的随机数;截断操作单元,用于对所述随机数进行截断操作,得到截断操作后的随机数;替换单元,用于采用截断后的随机数替换原始灰度值,得到所述任一个像素点替换后的灰度值;遍历所述任一张目标图像中的任一个像素点,得到增强处理后的第二目标图像数据集。
[0018]根据本专利技术的第三方面,提供了一种电子设备,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现如图像数据增强方法的步骤。
[0019]根据本专利技术的第四方面,提供了一种计算机可读存储介质,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现图像数据增强方法的步骤。
[0020]本专利技术提供的一种图像数据增强方法、系统、电子设备及存储介质,对于公共数据集中的目标图像,通过添加散粒噪声的方式进行增强加躁处理,消除公共数据集中的目标图像与实际采集的目标图像之间的差异,扩充实际采集的目标图像数据集。
附图说明
[0021]图1为本专利技术提供的一种图像数据增强方法流程图;
[0022]图2为本专利技术提供的一种图像数据增强方法的整体流程图;
[0023]图3为本专利技术实施例提供的一种图像数据增强系统结构图;
[0024]图4为图3中增强处理模块的内部结构示意图;
[0025]图5为本专利技术实施例提供的一种可能的电子设备的硬件结构示意图;
[0026]图6为本专利技术实施例提供的一种可能的计算机可读存储介质的硬件结构示意图。
具体实施方式
[0027]下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。
[0028]图1为本专利技术提供的一种图像数据增强方法流程图,如图1所示,方法包括:101、分别获取实际采集的第一目标图像数据集和从公共数据集中获取第二目标图像数据集;102、对于所述第二目标图像数据集中的每一张目标图像,通过添加散粒噪声的方式进行增强处理,得到增强处理后的第二目标图像数据集;103、将第一目标图像数据集和增强处理后的第二目标图像数据集作为最终的目标图像数据集。
[0029]可以理解的是,基于
技术介绍
中的缺陷,在构建神经网络模型训练的数据集时,通常从公共数据集中选取相似目标的图像来训练模型。公共数据集中的图像来源多种多样,绝大部分与实际应用中传感器采集到的图像存在一定的差异。这也造成了用公共数据集训练的模型在实际应用中检测性能不佳的问题。
[0030]通过分析传感器成像机制,发现光源发出的光在CMOS传感器件上成像,每秒发射的光子到达CMOS的越多,像素灰度值越大。由于光源发射和CMOS接收之间有可能存在某些因素导致单个光子并没能被CMOS接收或一段时间内发射的光子特别多的现象,使得灰度值产生波动,造成了实际传感器采集到的图像数据存在较多的散粒噪声。因此,为了解决公共数据集与实际图像存在差异的问题,采用对公共数据集图像随机添加散本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像数据增强方法,其特征在于,包括:分别获取实际采集的第一目标图像数据集和从公共数据集中获取第二目标图像数据集;对于所述第二目标图像数据集中的每一张目标图像,通过添加散粒噪声的方式进行增强处理,得到增强处理后的第二目标图像数据集;将第一目标图像数据集和增强处理后的第二目标图像数据集作为最终的目标图像数据集。2.根据权利要求1所述的图像数据增强方法,其特征在于,所述从公共数据集中获取第二目标图像数据集之后还包括:对于公共数据集中的目标图像数据,选取预设比例的目标图像数据作为第二目标图像数据集。3.根据权利要求1或2所述的图像数据增强方法,其特征在于,所述对于所述第二目标图像数据集中的每一张目标图像,通过添加散粒噪声的方式进行增强处理,得到增强处理后的第二目标图像数据集包括:对于第二目标图像数据集中的任一张目标图像,提取所述任一张目标图像中任一个像素点的原始灰度值;基于所述任一个像素点的原始灰度值,生成满足泊松分布的随机数,并对所述随机数进行截断操作,得到截断操作后的随机数;采用截断后的随机数替换原始灰度值,得到所述任一个像素点替换后的灰度值;遍历所述任一张目标图像中的任一个像素点,得到增强处理后的第二目标图像数据集。4.根据权利要求3所述的图像数据增强方法,其特征在于,所述基于所述任一个像素点的原始灰度值,产生满足泊松分布的随机数包括:基于所述任一个像素点的原始灰度值,通过调用python中numpy库中的函数产生对应的随机数:G
p
=np.random.poisson(λ
p
,1);其中,λ
p
为像素点的灰度值,G
p
为产生的随机数。5.根...

【专利技术属性】
技术研发人员:张智杰邹尔博程文韶谭海王群
申请(专利权)人:华中光电技术研究所中国船舶重工集团公司第七一七研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1