OCR图像样本生成、印刷体验证方法、装置、设备及介质制造方法及图纸

技术编号:25522769 阅读:23 留言:0更新日期:2020-09-04 17:12
本发明专利技术涉及人工智能,提供一种OCR图像样本生成、印刷体验证方法、装置、设备及介质,方法包括:接收图像生成指令,获取图像样本;将图像样本输入预设的字体排版生成模型,通过对图像样本进行文本检测和文字识别,获取第一标注信息,并且获取字体排版生成模型重构生成的模拟结果;将图像样本和模拟图像输入预设的风格合成模型,风格合成模型提取出风格特征和内容特征,风格合成模型生成合成结果;获取OCR图像样本标签,同时将合成图像记录为与图像样本对应的OCR图像样本,并将OCR图像样本与OCR图像样本标签关联。此外,本发明专利技术还涉及区块链技术,信息可存储于区块链节点中。本发明专利技术实现自动生成与图像样本一样纹理风格的OCR图像样本,自动标注样本标签。

【技术实现步骤摘要】
OCR图像样本生成、印刷体验证方法、装置、设备及介质
本专利技术涉及人工智能的数据建模领域,尤其涉及一种OCR图像样本生成、印刷体验证方法、装置、计算机设备及存储介质。
技术介绍
目前,随着社会的科技发展,以及数字时代不断庞大,基于OCR技术进行文本识别的应用得到了广泛应用;OCR(OpticalCharacterRecognition),中文叫做光学字符识别,为利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受和可以理解的格式。在现有技术中,越来越多的应用场景(比如:涉及金融、保险、智慧安防的应用场景)都需要识别证件印刷体中的文本信息进行验证,但是由于针对特定的场景就需要非常庞大的证件样本(还需对其进行人工标注样本标签)进行训练神经网络,而通常只能获得数量极少的证件样本,很难获取到如此庞大的证件样本,而且由于其独特的干扰(如在印刷过程中字体很可能变得断裂或者墨水粘连)使得进行OCR识别依然困难,导致训练后的证件识别模型的准确率和精度不高,从而导致验证出错率高,需要人工重新验证,大大浪费成本,效率低。
技术实现思路
本专利技术提供一种OCR图像样本生成、印刷体验证方法、装置、计算机设备及存储介质,实现了自动生成与图像样本一样的纹理风格的OCR图像样本,并自动标注OCR图像样本标签,减少了人工成本和时间,以及能够提升OCR识别结果和印刷体验证的准确率和可靠性。一种OCR图像样本生成方法,包括:接收图像生成指令,获取图像样本;所述图像样本与图像样本标签关联,所述图像样本标签包括第一字体标签、第一排版标签和第一纹理风格标签;将所述图像样本输入预设的字体排版生成模型,通过对所述图像样本进行文本检测和文字识别,获取所述字体排版生成模型识别出所述图像样本的第一标注信息,并且获取所述字体排版生成模型根据所述第一字体标签、所述第一排版标签和所述第一标注信息进行重构生成的模拟结果;所述模拟结果包括模拟图像、第二字体标签、第二排版标签和第二标注信息;将所述图像样本和所述模拟图像输入预设的风格合成模型,所述风格合成模型提取出风格特征和内容特征,所述风格合成模型根据所述风格特征和所述内容特征对所述模拟图像进行风格迁移及合成,生成合成结果;所述合成结果包括合成图像和第一纹理风格标签;将所述第二字体标签、所述第二排版标签、所述第二标注信息和所述第一纹理风格标签标记为OCR图像样本标签,同时将所述合成图像记录为与所述图像样本对应的OCR图像样本,并将所述OCR图像样本与所述OCR图像样本标签关联。一种印刷体验证方法,包括:接收证件验证指令,获取待证件印刷体和验证信息;将所述待证件印刷体输入已训练完成的证件识别模型;所述证件识别模型通过上述OCR图像样本生成方法生成的OCR图像样本训练完成;通过所述证件识别模型对所述待证件印刷体进行OCR识别,获取所述证件识别模型输出的OCR识别结果,所述OCR识别结果包含所述待证件印刷体中与证件相关的文本信息;将所述OCR识别结果与所述验证信息进行比对,确定所述待证件印刷体是否符合所述验证信息;若所述待证件印刷体符合所述验证信息,确定验证通过;若所述待证件印刷体不符合所述验证信息,确认验证不通过,并在显示界面提示。一种OCR图像样本生成装置,包括:接收模块,用于接收图像生成指令,获取图像样本;所述图像样本与图像样本标签关联,所述图像样本标签包括第一字体标签、第一排版标签和第一纹理风格标签;输入模块,用于将所述图像样本输入预设的字体排版生成模型,通过对所述图像样本进行文本检测和文字识别,获取所述字体排版生成模型识别出所述图像样本的第一标注信息,并且获取所述字体排版生成模型根据所述第一字体标签、所述第一排版标签和所述第一标注信息进行重构生成的模拟结果;所述模拟结果包括模拟图像、第二字体标签、第二排版标签和第二标注信息;合成模块,用于将所述图像样本和所述模拟图像输入预设的风格合成模型,所述风格合成模型提取出风格特征和内容特征,所述风格合成模型根据所述风格特征和所述内容特征对所述模拟图像进行风格迁移及合成,生成合成结果;所述合成结果包括合成图像和第一纹理风格标签;生成模块,用于将所述第二字体标签、所述第二排版标签、所述第二标注信息和所述第一纹理风格标签标记为OCR图像样本标签,同时将所述合成图像记录为与所述图像样本对应的OCR图像样本,并将所述OCR图像样本与所述OCR图像样本标签关联。一种印刷体验证装置,包括:获取模块,用于接收证件验证指令,获取待证件印刷体和验证信息;训练模块,用于将所述待证件印刷体输入已训练完成的证件识别模型;所述证件识别模型通过上述OCR图像样本生成方法生成的OCR图像样本训练完成;识别模块,用于通过所述证件识别模型对所述待证件印刷体进行OCR识别,获取所述证件识别模型输出的OCR识别结果,所述OCR识别结果包含所述待证件印刷体中与证件相关的文本信息;比对模块,用于将所述OCR识别结果与所述验证信息进行比对,确定所述待证件印刷体是否符合所述验证信息;第一确定模块,用于若所述待证件印刷体符合所述验证信息,确定验证通过;第二确定模块,用于若所述待证件印刷体不符合所述验证信息,确认验证不通过,并在显示界面提示。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述OCR图像样本生成方法的步骤,或者所述处理器执行所述计算机程序时实现上述印刷体验证方法的步骤。一种计算机可读存储介质,包括存储数据区和存储程序区,存储数据区存储根据区块链节点的使用所创建的数据,存储程序区存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述印刷体验证方法的步骤。本专利技术提供的OCR图像样本生成方法、装置、计算机设备及存储介质,通过获取含有第一字体标签、第一排版标签和第一纹理风格标签的图像样本;将其输入字体排版生成模型,通过对所述图像样本进行文本检测和文字识别,获取识别出的第一标注信息;根据所述第一字体标签、所述第一排版标签和所述第一标注信息进行重构,生成模拟结果;将所述图像样本和所述模拟图像输入风格合成模型,所述风格合成模型根据提取出的所述风格特征和所述内容特征对所述模拟图像进行风格迁移及合成,生成合成结果;所述合成结果包括合成图像和第一纹理风格标签;将所述第二字体标签、所述第二排版标签、所述第二标注信息和所述第一纹理风格标签标记为OCR图像样本标签,同时将所述合成图像记录为与所述图像样本对应的OCR图像样本,并将所述OCR图像样本与所述OCR图像样本标签关联,因此,本专利技术实现了自动生成与图像样本一样的纹理风格的OCR图像样本,并且对所述OCR图像样本进行准确地标注OCR图像样本标签,减少了收集图像样本的人工成本和时间,以及能够快速获得所需场景下的OCR图像样本,更具针对性,为后续模型的训练提升了的准确性和可靠性,而且减少了本文档来自技高网...

【技术保护点】
1.一种OCR图像样本生成方法,其特征在于,包括:/n接收图像生成指令,获取图像样本;所述图像样本与图像样本标签关联,所述图像样本标签包括第一字体标签、第一排版标签和第一纹理风格标签;/n将所述图像样本输入预设的字体排版生成模型,通过对所述图像样本进行文本检测和文字识别,获取所述字体排版生成模型识别出所述图像样本的第一标注信息,并且获取所述字体排版生成模型根据所述第一字体标签、所述第一排版标签和所述第一标注信息进行重构生成的模拟结果;所述模拟结果包括模拟图像、第二字体标签、第二排版标签和第二标注信息;/n将所述图像样本和所述模拟图像输入预设的风格合成模型,所述风格合成模型提取出风格特征和内容特征,所述风格合成模型根据所述风格特征和所述内容特征对所述模拟图像进行风格迁移及合成,生成合成结果;所述合成结果包括合成图像和第一纹理风格标签;/n将所述第二字体标签、所述第二排版标签、所述第二标注信息和所述第一纹理风格标签标记为OCR图像样本标签,同时将所述合成图像记录为与所述图像样本对应的OCR图像样本,并将所述OCR图像样本与所述OCR图像样本标签关联。/n

【技术特征摘要】
1.一种OCR图像样本生成方法,其特征在于,包括:
接收图像生成指令,获取图像样本;所述图像样本与图像样本标签关联,所述图像样本标签包括第一字体标签、第一排版标签和第一纹理风格标签;
将所述图像样本输入预设的字体排版生成模型,通过对所述图像样本进行文本检测和文字识别,获取所述字体排版生成模型识别出所述图像样本的第一标注信息,并且获取所述字体排版生成模型根据所述第一字体标签、所述第一排版标签和所述第一标注信息进行重构生成的模拟结果;所述模拟结果包括模拟图像、第二字体标签、第二排版标签和第二标注信息;
将所述图像样本和所述模拟图像输入预设的风格合成模型,所述风格合成模型提取出风格特征和内容特征,所述风格合成模型根据所述风格特征和所述内容特征对所述模拟图像进行风格迁移及合成,生成合成结果;所述合成结果包括合成图像和第一纹理风格标签;
将所述第二字体标签、所述第二排版标签、所述第二标注信息和所述第一纹理风格标签标记为OCR图像样本标签,同时将所述合成图像记录为与所述图像样本对应的OCR图像样本,并将所述OCR图像样本与所述OCR图像样本标签关联。


2.如权利要求1所述的OCR图像样本生成方法,其特征在于,所述将所述图像样本输入预设的字体排版生成模型,通过对所述图像样本进行文本检测和文字识别,获取所述字体排版生成模型识别出所述图像样本的第一标注信息,包括:
通过所述字体排版生成模型对所述图像样本进行文本检测,同时提取出所述图像样本的文本特征,获取所述字体排版生成模型根据提取出的所述文本特征识别出的所述图像样本的区域结果;所述区域结果包括若干个含有文本的文本区域以及与每个所述文本区域关联的区域坐标;
通过所述字体排版生成模型提取出每个所述文本区域的文字特征,获取所述字体排版生成模型根据提取出的每个所述文本区域的所述文字特征识别出的每个所述文本区域的文本内容;
将所述文本区域、与所述文本区域关联的所述区域坐标以及所述文本区域的所述文本内容记录为所述图像样本的第一信息,将所有所述第一信息标记为所述第一标注信息。


3.如权利要求1所述的OCR图像样本生成方法,其特征在于,所述获取所述字体排版生成模型根据所述第一字体标签、所述第一排版标签和所述第一标注信息进行重构生成的模拟结果,包括:
将所述第一字体标签、所述第一排版标签和所述第一标注信息输入所述字体排版生成模型中的重构模型;所述重构模型为基于GAN模型进行训练完成;
通过所述重构模型中的生成器进行组合重构,获取所述重构模型输出的所述模拟图像、第二字体标签、第二排版标签和第二标注信息;
将所述模拟图像、所述第二字体标签、所述第二排版标签和所述第二标注信息记录为所述字体排版生成模型输出的模拟结果。


4.如权利要求1所述的OCR图像样本生成方法,其特征在于,将所述图像样本和所述模拟图像输入预设的风格合成模型,所述风格合成模型提取出风格特征和内容特征,所述风格合成模型根据所述风格特征和所述内容特征对所述模拟图像进行风格迁移及合成,生成合成结果,包括:
将所述模拟图像作为初始图像,获取所述初始图像的所有像素值;
通过所述风格合成模型提取出所述图像样本的风格特征以及所述初始图像的风格特征,并根据所述图像样本的风格特征和所述初始图像的风格特征计算得出风格损失值;
通过所述风格合成模型提取出所述图像样本的内容特征以及所述初始图像的内容特征,并根据所述图像样本的内容特征和所述初始图像的内容特征计算得出内容损失值;
将所述风格损失值和所述内容损失值进行加权处理得到总损失值;
通过L-BFGS算法进行梯度下降,在所述总损失值未达到预设条件时,迭代更新所述初始图像中的所有所述像素值,直至所述总损失值达到所述预设条件时,将更新后的所述初始图像确定为合成图像;
将所述第一纹理风格标签与所述合成图像关联,并将所述合成图像和所述第一纹理风格标签确定为所述合成结果。


5.一种印刷体验证方法,其特征在于,包括:
接收证件验证指令,获取待证件印刷体和验证信息;
将所述待证件印刷体输入已训练完成的证件识别模型;所述证件识别模型通过如权利要求1至4任一项所述OCR图像样本生成方法生成的OCR图像样本训练完成;
通过所...

【专利技术属性】
技术研发人员:陈伟杰
申请(专利权)人:平安国际智慧城市科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1