一种重拼接数据增强方法技术

技术编号：39644050 阅读：12 留言：0更新日期：2023-12-09 11:11

本发明专利技术适用于计算机视觉领域，提供了一种重拼接数据增强方法

全部详细技术资料下载

【技术实现步骤摘要】
一种重拼接数据增强方法、系统及相关设备

[0001]本专利技术属于计算机视觉
，尤其涉及数据增强领域
。

技术介绍

[0002]计算机视觉是使用计算机及其相关设备对生物视觉的一种模拟，数据增强是指通过对图像和数据集进行相应变换得更加丰富多样的图像和数据集的过程
。2012
年开始，基于深度学习的计算机视觉应用如雨后春笋般出现
。
深度学习的方法需要依托与大量的数据进行训练，因此便产生了数据增强的需求
。
数据增强方法按照使用的样本数量可以分为单样本数据增强和多样本数据增强
。
单样本数据增强通过对单个样本进行几何变换或者颜色变换来达到扩充数据集的目的
。
其中几何变换主要包括翻转
、
旋转
、
裁减
、
缩放
、
仿射等，颜色色变换主要包括噪声，模糊，色彩空间变换，随机擦除，超像素等方法
。
多样本数据增强包括
smote
，
mixup
，
cutmix、mosica
等
。smote
方法通过合成人工样本来扩充数据集；
mixup
通过透明度混合照片达到扩充数据集的目的；
cutmix
与
mixup
相似，不同的是
cutmix
首先需要进行裁减操作，之后将裁减的照片混合如原始照片中；
mosica
>数据增强方法通过拼接若干张图片的方式进行数据增强
。
这些数据增强方法能够有效的扩充数据集的规模，提升模型的检测效果，但是无法很好的使模型关注于全局特征且提取到局部特征与全局特征之间的关系，防止模型过拟合的能力较弱
。

技术实现思路

[0003]本专利技术实施例提供一种重拼接数据增强方法，旨在解决模型训练过程中过度关注局部特征忽略全局特征而造成的过拟合问题
。
[0004]第一方面，本专利技术实施例提供一种自然场景文本检测方法，其特征在于，所述方法具体包括以下步骤：获取第一图像并将所述第一图像进行分割得到第一图像子图集；将所述第一图像子图集进行随机空间变换和随机色彩变换，得到变换后的第一图像子图集；将所述变换后的第一图像子图集进行分组并按所述分组进行拼接，得到数据增强后的图片集
。
[0005]更进一步地，将所述第一图像进行分割得到第一图像子图集方法还包括以下步骤：确定行分割块数量和列分割块数量；根据所述的行分割块数量确定行分割步长，根据所述列分割块数量确定列步长；根据所述列步长和行步长将所述第一图像分割得到第一图像子图集
。
[0006]更进一步地，将所述第一图像子图集进行随机空间变换和随机色彩变换，得到变换后的第一图像子图集的步骤具体包括：确定随机变换的概率
、
空间变换与色彩变换的组合方式；根据所述随机变换的概率将所述第一图像子图集中的图片按照所述空间变换与色彩变换的组合进行变换得到变换后的第一图像子图集
。
[0007]更进一步地，确定随机变换的概率
、
空间变换与色彩变换的组合方式的步骤具体包括：所述空间变换由旋转
、
翻转
、
裁减
、
缩放
、
仿射方法中的一种或多种构成；所述色彩变
换由锐化
、
明度变化
、
对比度变化
、
高光变化
、
暗部变化
、
饱和度变化
、
色温变化
、
色调变化
、
色散方法中的一种或多种构成；所述空间变换与色彩变换的组合方式从所述空间变换和色彩变换中选取一种或多种并按照预定顺序进行组合
。
[0008]更进一步地，将所述变换后的第一图像子图集进行分组并按所述分组进行拼接，得到数据增强后的图片集的步骤具体包括：确定子图分组的行数与子图分组的列数；根据所述子图分组的行数与子图分组的列数按照由左至右
、
由上至下的顺序对变换后的第一图像子图集进行分组；将所述每一变换后的第一图像子图集分组按照由上至下由左至右的顺序进行由低至高的排序并将所述每一变换后的第一图像子图集中编号相同的图片进行拼接
。
[0009]更进一步地，将所述每一变换后的第一图像子图集中编号相同的图片进行拼接的步骤具体包括：选取每一变换后的第一图像子图集中编号相同的图片；将所述编号相同的图片按照在所述第一图像中由左至右，由上至下出现的顺序进行拼接组成所述数据增强后的图片集
。
[0010]第二方面，本专利技术实施例提供一种计算机系统，包括：包括第一图像获取模块，用于获取第一图像；第一图像分割模块，用于将所述第一图像进行分割得到第一图像子图集；图像变换模块，用于将所述第一图像子图集进行图像变换得到变换后的第一图像子图集；图像拼接模块，用于将所述变换后的第一图像子图集进行拼接得到数据增强后的图片
。
[0011]第三方面，本专利技术实施例提供一种计算机设备，包括：存储器
、
处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述实施例中任一项所述的重拼接数据增强方法中的步骤
。
[0012]第四方面，本专利技术实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述实施例中任一项所述的重拼接数据增强方法中的步骤
。
[0013]本专利技术实施例达到的有益效果：由于分散了局部特征保留了全局特征，使得模型能够减少对局部特征的依赖达到了避免过拟合的目的；局部特征并未被去除而是分散至不同的图片中，模型依旧能够学习到局部特征与全局特征之间的关系，提升了模型的泛化能力；
附图说明
[0014]图1是本专利技术实施例提供的重拼接数据增强方法流程图；
[0015]图2是本专利技术实施例提供的重拼接数据增强方法示意图；
[0016]图3是本专利技术实施例提供的重拼接数据增强系统示意图；
[0017]图4是本专利技术实施例提供的计算机设备结构示意图
。
具体实施方式
[0018]为了使本专利技术的目的
、
技术方案及优点更加清楚明白，以下结合附图及实施例，对本专利技术进行进一步详细说明
。
应当理解，此处所描述的具体实施例仅仅用以解释本专利技术，并不用于限定本专利技术
。
基于本专利技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本专利技术保护的范围
。
[0019]请参照图1，图1是本专利技术实施例提供的方法重拼接数据增强方法流程框图，所述方法具体包括以下步骤：
[0020]S101、...

【技术保护点】

【技术特征摘要】
1.
一种重拼接数据增强方法
、
系统及相关设备，其特征在于，所述重拼接数据增强方法具体包括以下步骤：获取第一图像并将所述第一图像进行分割得到第一图像子图集；将所述第一图像子图集进行随机空间变换和随机色彩变换，得到变换后的第一图像子图集；将所述变换后的第一图像子图集进行分组并按所述分组进行拼接，得到数据增强后的图片集
。2.
如权利要求1所述的重拼接数据增强方法，其特征在于，获取第一图像并将所述第一图像进行分割得到第一图像子图集的步骤具体包括：确定行分割块数量和列分割块数量；根据所述的行分割块数量确定行分割步长，根据所述列分割块数量确定列步长；根据所述列步长和行步长将所述第一图像分割得到第一图像子图集
。3.
如权利要求1所述的重拼接数据增强方法，其特征在于，将所述第一图像子图集进行随机空间变换和随机色彩变换，得到变换后的第一图像子图集的具体步骤包括：确定随机变换的概率
、
空间变换与色彩变换的组合方式；根据所述随机变换的概率将所述第一图像子图集中的图片按照所述空间变换与色彩变换的组合进行变换得到变换后的第一图像子图集
。4.
如权利要求3所述的重拼接数据增强方法，其特征在于，确定随机变换的概率
、
空间变换与色彩变换的组合方式的具体步骤包括：所述空间变换由旋转
、
翻转
、
裁减
、
缩放
、
仿射方法中的一种或多种构成；所述色彩变换由锐化
、
明度变化
、
对比度变化
、
高光变化
、
暗部变化
、
饱和度变化
、
色温变化
、
色调变化
、
色...

【专利技术属性】
技术研发人员：马永军，周东晖，
申请(专利权)人：天津科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人