当前位置: 首页 > 专利查询>华侨大学专利>正文

一种基于遗传算法的图像数据自动增强方法技术

技术编号:36774760 阅读:11 留言:0更新日期:2023-03-08 21:57
本发明专利技术提供一种基于遗传算法的图像数据自动增强方法,包括:获取用于搜索的代理数据集;获取多种数据增强操作方法:根据增强操作原理把数据增强操作分为几何变换和颜色变换;构建离散搜索空间:把每种增强策略的操作方法、操作概率、操作幅度进行离散编码;搜索增强策略:采用遗传算法,随机生成若干个操作方法作为初始种群,通过种群的迭代寻优,在搜索空间中搜索出若干个最优的增强策略,确定最优的增强策略组合个数;通过在搜索时使用代理数据集,对几何变换和颜色变换分开进行寻优,减少单个搜索空间的参数量,即减少了搜索过程的时间成本,又能实现增强策略组合个数的优选,最大限度的保留了数据增强的有效性,普遍适用于各类数据集。各类数据集。各类数据集。

【技术实现步骤摘要】
一种基于遗传算法的图像数据自动增强方法


[0001]本专利技术涉及计算机视觉领域,特别是指一种基于遗传算法的图像数据自动增强方法。

技术介绍

[0002]随着深度学习的发展以及计算机计算性能的提升,基于深度学习的图像识别方法在计算机视觉领域的应用越来越广泛。深度学习模型的性能依赖于大量的数据,获取数据的方法一般是人工标注。人工标注需要耗费大量的人力物力,数据增强可以扩展可训练的数据。数据增强通过对图片进行几何变换和颜色变换,来获得与原始数据集相似的训练数据,进而提高深度学习模型的性能。
[0003]通常在模型的训练过程中,会手工设置一些数据增强方法,手工设计增强策略需要丰富的专家经验,并且很难使模型达到最优的性能。近年来已有一些自动数据增强的方法来缓解手工设计增强策略的缺点。常见的自动数据增强方法有Autoaugment,Autoaugment

det等,其思想是把增强策略离散化,建立若干个增强策略组合,每个增强策略组合包含多个增强操作。然后利用离散寻优的方法,搜索出若干个最优的增强策略组合。但是,这些自动增强方法是针对于大型数据集的,如COCO数据集,因此存在搜索空间大,搜索过程耗时多的缺点,需要耗费大量的计算资源。

技术实现思路

[0004]本专利技术的主要目的在于克服现有技术中的上述缺陷,提出一种基于遗传算法的图像数据自动增强方法,旨在减少数据集自动增强的搜索成本,在较短的时间内搜索出最优的增强策略组合。
[0005]本专利技术采用如下技术方案:
[0006]一种基于遗传算法的图像数据自动增强方法,包括:
[0007]获取用于搜索的代理数据集:把原始数据集按照设定的比例划分为训练集T和测试集V,从训练集和测试集中随机抽取一定比例的数据,作为代理训练集t和代理测试集v;
[0008]获取多种数据增强操作方法:根据增强操作原理把数据增强操作分为几何变换和颜色变换;
[0009]构建离散搜索空间:把每种增强策略的操作方法、操作概率、操作幅度进行离散编码,分别构建数据自动增强的几何变换搜索空间和颜色变换搜索空间;
[0010]搜索增强策略:采用遗传算法,随机生成若干个操作方法作为初始种群,通过种群的迭代寻优,在几何变换搜索空间中,搜索出若干个最优的几何增强策略,同样在颜色变换搜索空间中搜索出若干个最优的颜色增强策略,将若干个最优的几何增强策略和若干个最优的颜色增强策略合成增强策略组合;
[0011]确定最优的增强策略组合个数:在每个增强策略组合分别从搜索到的几何增强策略和颜色增强策略中,按精度顺序各选择N个增强策略组合,N=1、2、3

;在N取不同值时,
采用对应的增强策略组合训练模型并评估精度,根据精度来确定N的最优值。
[0012]具体地,所述数据增强操作方法,包括几何变换和颜色变换;其中所述几何变换包括但不限于旋转、翻转、平移、缩放、剪切、裁剪;所述颜色变换包括但不限于颜色、亮度、对比度、锐度、曝光、直方图均衡化。
[0013]具体地,增强策略的离散编码是采用3个正整数,来分别代表具体的操作方法、使用该操作的概率和使用该操作的幅度。
[0014]具体地,采用遗传算法,从单个搜索空间中,搜索出若干个最优增强策略的过程,具体包括:
[0015]S201,使用原始训练集T训练出一个初始模型M;
[0016]S202,随机生成初始种群,种群由K个增强策略组成;
[0017]S203,循环遍历K个增强策略,在代理训练集t上应用每个增强策略,对初始模型M进行微调训练,得到增强后的模型M*;采用M*评估代理测试集v的精度;
[0018]S204,根据代理测试集v的精度大小,从K个增强策略中选择k个精度最高的策略,作为遗传的亲本,k≥2;
[0019]S205,在k个遗传亲本中,随机选择两个亲本进行交叉,生成新的子代,交叉过程中有p的概率发生变异;交叉过程重复(K

k)次,即生成(K

k)个子代;
[0020]S206,k个遗传亲本和(K

k)个子代结合,组成新的种群,新的种群依然有K个增强策略;
[0021]S207,重复S203~S206的过程,不断对种群进行迭代;种群I次迭代后,输出k个最优的增强策略。
[0022]具体地,确定最优的增强策略组合个数,具体包括:
[0023]增强策略组合包括一个几何增强策略和一个颜色增强策略;使用N个增强策略组合训练模型时,训练集为原始训练集T,评估模型精度时,测试集为原始测试集V。
[0024]由上述对本专利技术的描述可知,与现有技术相比,本专利技术具有如下有益效果:
[0025]本专利技术中的图像数据自动增强方法,包括:获取用于搜索的代理数据集:把原始数据集按照设定的比例划分为训练集T和测试集V,从训练集和测试集中随机抽取一定比例的数据,作为代理训练集t和代理测试集v;获取多种数据增强操作方法:根据增强操作原理把数据增强操作分为几何变换和颜色变换;构建离散搜索空间:把每种增强策略的操作方法、操作概率、操作幅度进行离散编码,分别构建数据自动增强的几何变换搜索空间和颜色变换搜索空间;搜索增强策略:采用遗传算法,随机生成若干个操作方法作为初始种群,通过种群的迭代寻优,在几何变换搜索空间中,搜索出若干个最优的几何增强策略,同样在颜色变换搜索空间中搜索出若干个最优的颜色增强策略,将若干个最优的几何增强策略和若干个最优的颜色增强策略合成增强策略组合;确定最优的增强策略组合个数:在每个增强策略组合分别从搜索到的几何增强策略和颜色增强策略中,按精度顺序各选择N个增强策略组合,N=1、2、3

;在N取不同值时,采用对应的增强策略组合训练模型并评估精度,根据精度来确定N的最优值;通过在搜索时使用代理数据集,对几何变换和颜色变换分开进行寻优,减少单个搜索空间的参数量,即减少了搜索过程的时间成本,又能实现增强策略组合个数的优选,最大限度的保留了数据增强的有效性,普遍适用于各类数据集。
附图说明
[0026]图1为本专利技术实施例提供的图像数据自动增强流程图。
[0027]图2为本专利技术实施例提供的单个搜索空间的搜索流程图。
[0028]以下结合附图和具体实施例对本专利技术作进一步详述。
具体实施方式
[0029]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0030]本专利技术中的图像数据自动增强方法,通过在搜索时使用代理数据集,对几何变换和颜色变换分开进行寻优,减少单个搜索空间的参数量,即减少了搜索过程的时间成本,又能实现增强策略组合个数的优选,最大本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于遗传算法的图像数据自动增强方法,其特征在于,包括:获取用于搜索的代理数据集:把原始数据集按照设定的比例划分为训练集T和测试集V,从训练集和测试集中随机抽取一定比例的数据,作为代理训练集t和代理测试集v;获取多种数据增强操作方法:根据增强操作原理把数据增强操作分为几何变换和颜色变换;构建离散搜索空间:把每种增强策略的操作方法、操作概率、操作幅度进行离散编码,分别构建数据自动增强的几何变换搜索空间和颜色变换搜索空间;搜索增强策略:采用遗传算法,随机生成若干个操作方法作为初始种群,通过种群的迭代寻优,在几何变换搜索空间中,搜索出若干个最优的几何增强策略,同样在颜色变换搜索空间中搜索出若干个最优的颜色增强策略,将若干个最优的几何增强策略和若干个最优的颜色增强策略合成增强策略组合;确定最优的增强策略组合个数:在每个增强策略组合分别从搜索到的几何增强策略和颜色增强策略中,按精度顺序各选择N个增强策略组合,N=1、2、3

;在N取不同值时,采用对应的增强策略组合训练模型并评估精度,根据精度来确定N的最优值。2.根据权利要求1所述的一种基于遗传算法的图像数据自动增强方法,其特征在于,所述数据增强操作方法,包括几何变换和颜色变换;其中所述几何变换包括但不限于旋转、翻转、平移、缩放、剪切、裁剪;所述颜色变换包括但不限于颜色、亮度、对比度、锐度、曝光、直方图均衡化。3.根据权利要求1所述的一种基于遗传算法的图像数据自动增强方法,其特征在于,增强...

【专利技术属性】
技术研发人员:杨天成杨建红房怀英陈伟鑫计天晨汪鑫
申请(专利权)人:华侨大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1