一种基于图像结构信息的OCR数据合成方法技术

技术编号：28840158 阅读：44 留言：0更新日期：2021-06-11 23:38

本发明专利技术公开了一种基于图像结构信息的的OCR数据合成方法，其步骤包括：首先收集自然场景图像，建立图像背景库；接着构建图像结构信息预测网络，并对背景图像中的每一张图片都进行预测，构建图像结构信息库；然后统计真实数据中的前景与背景的颜色分布，建立前景背景颜色库；最后根据背景图像的三维信息选择一个合适位置，将文字嵌入到背景图像中去。本发明专利技术能快速合成海量的逼真文本图像，并解决OCR领域训练数据匮乏的问题，从而提升文本检测与识别模型的准确率与鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图像结构信息的OCR数据合成方法
本专利技术涉及光学字符识别领域的相关问题，具体涉及一种基于图像结构信息的OCR数据合成方法。
技术介绍
OCR领域主要有两种方法：基于传统算法的OCR方法与基于深度学习的OCR方法。基于深度学习OCR方法无论是准确率还是鲁棒性都大大优于基于传统算法的OCR方法。但前者的准确率非常依赖于大批量的训练样本，而仅仅通过人工标注数据来获得训练样本是不够的，因为OCR需要的数据至少是百万级别的，完全靠人为标注是不现实的。另外OCR对训练样本的丰富性要求很高，而目前的一般OCR数据合成方法都是在背景图像上直接嵌入文字，不能充分利用背景图像的三维空间信息以及结构信息，导致合成出来的图像不逼真。
技术实现思路
本专利技术克服了现有技术的不足之处，提供一种基于图像结构信息的的OCR数据合成方法，以期能充分利用背景图像的结构信息来合成海量逼真的文本图像数据，从而提升文本检测与识别模型的准确率与鲁棒性。本专利技术为达到上述专利技术目的，采用如下技术方案：本专利技术一种基于图像结构信息的OCR数据合成方法的特点在于，包括以下步骤：步骤1：收集自然场景图像，用于建立图像背景库；步骤2：构建图像结构信息预测网络SN，包括：编码模块Encoder，快速特征融合模块FM，结构预测模块Decoder；所述编码模块Encoder，包含：4n个卷积层，n个最大池化层；所述快速特征融合模块FM，包含4个卷积层，4个上采样层；所述结构...

【技术保护点】
1.一种基于图像结构信息的OCR数据合成方法，其特征在于，包括以下步骤：/n步骤1：收集自然场景图像，用于建立图像背景库；/n步骤2：构建图像结构信息预测网络SN，包括：编码模块Encoder，快速特征融合模块FM，结构预测模块Decoder；/n所述编码模块Encoder，包含：4n个卷积层，n个最大池化层；/n所述快速特征融合模块FM，包含4个卷积层，4个上采样层；/n所述结构预测模块Decoder，包含3a个卷积层；/n步骤3：将图像背景库中的每一张背景图片均输入图像结构信息预测网络SN中进行预测，得到对应的结构信息；/n步骤3.1：将一张背景图片X送入编码模块Encoder中，每经过n层卷积后再经过一个最大池化层的下采样处理，从而经过4n个卷积层以及n个最大池化层处理后，得到四组特征图F

【技术特征摘要】
1.一种基于图像结构信息的OCR数据合成方法，其特征在于，包括以下步骤：
步骤1：收集自然场景图像，用于建立图像背景库；
步骤2：构建图像结构信息预测网络SN，包括：编码模块Encoder，快速特征融合模块FM，结构预测模块Decoder；
所述编码模块Encoder，包含：4n个卷积层，n个最大池化层；
所述快速特征融合模块FM，包含4个卷积层，4个上采样层；
所述结构预测模块Decoder，包含3a个卷积层；
步骤3：将图像背景库中的每一张背景图片均输入图像结构信息预测网络SN中进行预测，得到对应的结构信息；
步骤3.1：将一张背景图片X送入编码模块Encoder中，每经过n层卷积后再经过一个最大池化层的下采样处理，从而经过4n个卷积层以及n个最大池化层处理后，得到四组特征图F1、F2、F3、F4，尺寸分别为其中，H和W是背景图片X的高与宽；
步骤3.2：将四组特征图F1、F2、F3、F4送入快速特征融合模块FM中，从而利用式(1)-(5)进行快速的特征融合，得到多种尺度的融合特征Ffuse：
Ffuse＝Conv(F1up)(1)
式(1)中：Conv表示卷积层操作，F1up表示第二组特征图F2与第一组特征图F1的融合特征，并有：

式(2)中：Up表示上采样层操作；表示第三组特征图F3与第二组特征图F2的融合特征，并有：

式(3)中：表示第三组特征图F3与第四组特征图F4的融合特征，并有：

式(4)中：表示对第四组特征图F4进行上采样之后的特征，并有：

步骤3.3：将融合特征Ffuse送入结...

【专利技术属性】
技术研发人员：汪增福，吴仕莲，
申请(专利权)人：中国科学院合肥物质科学研究院，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人