OCR图像样本生成、印刷体验证方法、装置、设备及介质制造方法及图纸

技术编号：25522769 阅读：23 留言：0更新日期：2020-09-04 17:12

本发明专利技术涉及人工智能，提供一种OCR图像样本生成、印刷体验证方法、装置、设备及介质，方法包括：接收图像生成指令，获取图像样本；将图像样本输入预设的字体排版生成模型，通过对图像样本进行文本检测和文字识别，获取第一标注信息，并且获取字体排版生成模型重构生成的模拟结果；将图像样本和模拟图像输入预设的风格合成模型，风格合成模型提取出风格特征和内容特征，风格合成模型生成合成结果；获取OCR图像样本标签，同时将合成图像记录为与图像样本对应的OCR图像样本，并将OCR图像样本与OCR图像样本标签关联。此外，本发明专利技术还涉及区块链技术，信息可存储于区块链节点中。本发明专利技术实现自动生成与图像样本一样纹理风格的OCR图像样本，自动标注样本标签。

全部详细技术资料下载

【技术实现步骤摘要】
OCR图像样本生成、印刷体验证方法、装置、设备及介质
本专利技术涉及人工智能的数据建模领域，尤其涉及一种OCR图像样本生成、印刷体验证方法、装置、计算机设备及存储介质。
技术介绍
目前，随着社会的科技发展，以及数字时代不断庞大，基于OCR技术进行文本识别的应用得到了广泛应用；OCR(OpticalCharacterRecognition)，中文叫做光学字符识别，为利用光学技术和计算机技术把印在或写在纸上的文字读取出来，并转换成一种计算机能够接受和可以理解的格式。在现有技术中，越来越多的应用场景(比如：涉及金融、保险、智慧安防的应用场景)都需要识别证件印刷体中的文本信息进行验证，但是由于针对特定的场景就需要非常庞大的证件样本(还需对其进行人工标注样本标签)进行训练神经网络，而通常只能获得数量极少的证件样本，很难获取到如此庞大的证件样本，而且由于其独特的干扰(如在印刷过程中字体很可能变得断裂或者墨水粘连)使得进行OCR识别依然困难，导致训练后的证件识别模型的准确率和精度不高，从而导致验证出错率高，需要人工重新验证，大大浪费成本，效率低。
技术实现思路
本专利技术提供一种OCR图像样本生成、印刷体验证方法、装置、计算机设备及存储介质，实现了自动生成与图像样本一样的纹理风格的OCR图像样本，并自动标注OCR图像样本标签，减少了人工成本和时间，以及能够提升OCR识别结果和印刷体验证的准确率和可靠性。一种OCR图像样本生成方法，包括：接收图像生成指令，获取图像样本；所述图像样本与图像样本标签关...

【技术保护点】
1.一种OCR图像样本生成方法，其特征在于，包括：/n接收图像生成指令，获取图像样本；所述图像样本与图像样本标签关联，所述图像样本标签包括第一字体标签、第一排版标签和第一纹理风格标签；/n将所述图像样本输入预设的字体排版生成模型，通过对所述图像样本进行文本检测和文字识别，获取所述字体排版生成模型识别出所述图像样本的第一标注信息，并且获取所述字体排版生成模型根据所述第一字体标签、所述第一排版标签和所述第一标注信息进行重构生成的模拟结果；所述模拟结果包括模拟图像、第二字体标签、第二排版标签和第二标注信息；/n将所述图像样本和所述模拟图像输入预设的风格合成模型，所述风格合成模型提取出风格特征和内容特征，所述风格合成模型根据所述风格特征和所述内容特征对所述模拟图像进行风格迁移及合成，生成合成结果；所述合成结果包括合成图像和第一纹理风格标签；/n将所述第二字体标签、所述第二排版标签、所述第二标注信息和所述第一纹理风格标签标记为OCR图像样本标签，同时将所述合成图像记录为与所述图像样本对应的OCR图像样本，并将所述OCR图像样本与所述OCR图像样本标签关联。/n

【技术特征摘要】
1.一种OCR图像样本生成方法，其特征在于，包括：
接收图像生成指令，获取图像样本；所述图像样本与图像样本标签关联，所述图像样本标签包括第一字体标签、第一排版标签和第一纹理风格标签；
将所述图像样本输入预设的字体排版生成模型，通过对所述图像样本进行文本检测和文字识别，获取所述字体排版生成模型识别出所述图像样本的第一标注信息，并且获取所述字体排版生成模型根据所述第一字体标签、所述第一排版标签和所述第一标注信息进行重构生成的模拟结果；所述模拟结果包括模拟图像、第二字体标签、第二排版标签和第二标注信息；
将所述图像样本和所述模拟图像输入预设的风格合成模型，所述风格合成模型提取出风格特征和内容特征，所述风格合成模型根据所述风格特征和所述内容特征对所述模拟图像进行风格迁移及合成，生成合成结果；所述合成结果包括合成图像和第一纹理风格标签；
将所述第二字体标签、所述第二排版标签、所述第二标注信息和所述第一纹理风格标签标记为OCR图像样本标签，同时将所述合成图像记录为与所述图像样本对应的OCR图像样本，并将所述OCR图像样本与所述OCR图像样本标签关联。

2.如权利要求1所述的OCR图像样本生成方法，其特征在于，所述将所述图像样本输入预设的字体排版生成模型，通过对所述图像样本进行文本检测和文字识别，获取所述字体排版生成模型识别出所述图像样本的第一标注信息，包括：
通过所述字体排版生成模型对所述图像样本进行文本检测，同时提取出所述图像样本的文本特征，获取所述字体排版生成模型根据提取出的所述文本特征识别出的所述图像样本的区域结果；所述区域结果包括若干个含有文本的文本区域以及与每个所述文本区域关联的区域坐标；
通过所述字体排版生成模型提取出每个所述文本区域的文字特征，获取所述字体排版生成模型根据提取出的每个所述文本区域的所述文字特征识别出的每个所述文本区域的文本内容；
将所述文本区域、与所述文本区域关联的所述区域坐标以及所述文本区域的所述文本内容记录为所述图像样本的第一信息，将所有所述第一信息标记为所述第一标注信息。

3.如权利要求1所述的OCR图像样本生成方法，其特征在于，所述获取所述字体排版生成模型根据所述第一字体标签、所述第一排版标签和所述第一标注信息进行重构生成的模拟结果，包括：
将所述第一字体标签、所述第一排版标签和所述第一标注信息输入所述字体排版生成模型中的重构模型；所述重构模型为基于GAN模型进行训练完成；
通过所述重构模型中的生成器进行组合重构，获取所述重构模型输出的所述模拟图像、第二字体标签、第二排版标签和第二标注信息；
将所述模拟图像、所述第二字体标签、所述第二排版标签和所述第二标注信息记录为所述字体排版生成模型输出的模拟结果。

4.如权利要求1所述的OCR图像样本生成方法，其特征在于，将所述图像样本和所述模拟图像输入预设的风格合成模型，所述风格合成模型提取出风格特征和内容特征，所述风格合成模型根据所述风格特征和所述内容特征对所述模拟图像进行风格迁移及合成，生成合成结果，包括：
将所述模拟图像作为初始图像，获取所述初始图像的所有像素值；
通过所述风格合成模型提取出所述图像样本的风格特征以及所述初始图像的风格特征，并根据所述图像样本的风格特征和所述初始图像的风格特征计算得出风格损失值；
通过所述风格合成模型提取出所述图像样本的内容特征以及所述初始图像的内容特征，并根据所述图像样本的内容特征和所述初始图像的内容特征计算得出内容损失值；
将所述风格损失值和所述内容损失值进行加权处理得到总损失值；
通过L-BFGS算法进行梯度下降，在所述总损失值未达到预设条件时，迭代更新所述初始图像中的所有所述像素值，直至所述总损失值达到所述预设条件时，将更新后的所述初始图像确定为合成图像；
将所述第一纹理风格标签与所述合成图像关联，并将所述合成图像和所述第一纹理风格标签确定为所述合成结果。

5.一种印刷体验证方法，其特征在于，包括：
接收证件验证指令，获取待证件印刷体和验证信息；
将所述待证件印刷体输入已训练完成的证件识别模型；所述证件识别模型通过如权利要求1至4任一项所述OCR图像样本生成方法生成的OCR图像样本训练完成；
通过所...

【专利技术属性】
技术研发人员：陈伟杰，
申请(专利权)人：平安国际智慧城市科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人