图片中文字的识别方法、关键字检索方法、装置及设备制造方法及图纸

技术编号:28422010 阅读:28 留言:0更新日期:2021-05-11 18:29
本发明专利技术提供一种图片中文字的识别方法、关键字检索方法、装置、设备及计算机可读存储介质,其中,图片中文字的识别方法包括如下步骤:步骤S1,提供原始文字图像;步骤S2,根据所述原始文字图像进行OCR识别,生成目标文字;步骤S3,根据所述目标文字生成目标文字图像;步骤S4,将所述原始文字图像与所述目标文字图像进行比较,得到比较结果;步骤S5,基于比较结果,生成最终识别结果。根据本发明专利技术的图片中文字的识别方法,结合OCR识别和图像比对,能够有效地提高识别准确度,且无需大量的模板等,有利于提高效率。

【技术实现步骤摘要】
图片中文字的识别方法、关键字检索方法、装置及设备
本专利技术涉及图像处理
,具体涉及一种图片中文字的识别方法、关键字检索方法、装置、设备及计算机可读存储介质。
技术介绍
在特定的应用场景下,例如检索小屏幕截图(低分辨率、低PPI)上的文字,由于分辨率低,以及webscreentext的反锯齿的影响,OCR的准确度会降低,导致在通过关键字检索图片时的准确度降低。在这些场景下,仅仅依靠OCR来对图片中文字识别后再检索是否包含带检索文字,这样的方法是不足以达到目标。专利文献CN201510816513.4中记载了一种图像关键词检查方法及装置,然而,该方法首先需要大量的样图,将样图上面的文字截取下来,并生成一个样本库,随后将待检测的子图像与样本库中的图像进行比较,但是如果待检测的图没有在样本库中出现,那么现有方案是无法检索到的。
技术实现思路
有鉴于此,本专利技术目的在以提供一种图片中文字的识别方法、关键字检索方法、装置、设备及计算机可读存储介质,来提高检索的准确度。为解决上述技术问题,第一方面,本专利技术提供一种图片中文字的识别方法,包括如下步骤:步骤S1,提供原始文字图像;步骤S2,根据所述原始文字图像进行OCR识别,生成目标文字;步骤S3,根据所述目标文字生成目标文字图像;步骤S4,将所述原始文字图像与所述目标文字图像进行比较,得到比较结果;步骤S5,基于比较结果,生成最终识别结果。根据本专利技术的一些实施例,所述步骤S1包括:<br>提供原图;将所述原图以单个文字作为单位进行切割,形成单个文字图像,以所述单个文字图像作为所述原始文字图像。根据本专利技术的一些实施例,所述步骤S2包括:根据所述原始文字图像进行OCR识别,得到OCR识别文字;根据所述OCR识别文字,调用与其具有预定相似度的文字,生成所述目标文字。进一步地,根据本专利技术的一些实施例,所述步骤S1之后且所述步骤S3之前还包括如下步骤:步骤S6,基于所述原始文字图像中的文字的高宽比,确定其字号和/或字体,所述步骤S3中,以所述字号和/或字体,打印所述目标文字,生成所述目标文字图像。优选地,利用font文件进行打印。根据本专利技术的一些实施例,所述步骤S4包括:步骤S41,将所述原始文字图像与各个所述目标文字图像分别进行叠加,得到叠加图;步骤S42,提取所述叠加图中的未重叠部分,生成差值图;步骤S43,根据所述差值图中的像素值,确定所述比较结果,其中,当所述差值图中的像素值小于等于预定阈值时,确定该原始文字图像中的文字与该目标文字图像中的目标文字一致,并以该目标文字图像中的文字作为识别结果。进一步地,根据本专利技术的一些实施例,所述S42步骤包括:步骤S421,对所述目标文字图像和/或所述原始文字图像进行扩宽或收窄,以消除所述叠加图中的两者的边缘差异;步骤S422,提取消除边缘差异后的未重叠部分,生成所述差值图。进一步地,根据本专利技术的一些实施例,所述步骤S43包括:消除所述差值图中的离散的点,根据去除离散点后的残留图像进行比较,确定所述比较结果,其中,当所述差值图中的像素值小于等于预定阈值时,确定该原始文字图像中的文字与该目标文字图像中的目标文字一致,并以该目标文字图像中的文字作为识别结果。更进一步地,根据本专利技术的一些实施例,通过中值滤波法消除所述差值图中的离散的点。第二方面,本专利技术提供一种检索图片中的关键字的方法,包括如下步骤:提供原始图片;对所述原始图片进行OCR识别,以获得识别文字;在所述识别文字中进行所述关键字检索,其中,当仅仅匹配到部分关键字时,确定该部分关键字前后预定字段所对应的原始图片片段,切割该原始图片片段,并对所述原始图片片段中的文字通过上述任一项所述的识别方法进行识别,得到识别结果,根据所述识别结果,确定有无所述关键字。第三方面,本专利技术提供一种图片中文字的识别装置,包括:获取模块,用于获取原始文字图像;目标文字生成模块,用于根据所述原始文字图像进行OCR识别,生成目标文字;目标文字打印模块,用于根据所述目标文字生成目标文字图像;比较模块,用于将所述原始文字图像与所述目标文字图像进行比较,得到比较结果;识别结果生成模块,用于基于比较结果生成最终识别结果。第四方面,本专利技术实施例提供一种电子设备,包括:处理器;和存储器,在所述存储器中存储有计算机程序指令,其中,在所述计算机程序指令被所述处理器运行时,使得所述处理器执行以下步骤:步骤S1,提供原始文字图像;步骤S2,根据所述原始文字图像进行OCR识别,生成目标文字;步骤S3,根据所述目标文字生成目标文字图像;步骤S4,将所述原始文字图像与所述目标文字图像进行比较,得到比较结果;步骤S5,基于比较结果,生成最终识别结果。第五方面,本专利技术提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器运行时,使得所述处理器执行以下步骤:步骤S1,提供原始文字图像;步骤S2,根据所述原始文字图像进行OCR识别,生成目标文字;步骤S3,根据所述目标文字生成目标文字图像;步骤S4,将所述原始文字图像与所述目标文字图像进行比较,得到比较结果;步骤S5,基于比较结果,生成最终识别结果。本专利技术的上述技术方案至少具有如下有益效果之一:根据本专利技术的图片中文字的识别方法,结合OCR识别与图像比对,能够矫正OCR识别错误,能够提高识别的准确度;本专利技术实施例的检索图片中的关键字的方法不需要大量样图,本方案动态生成待检测字的不同字体和字号的图像,不需要预先建立样本库,也不存在待检测图片不在样本库的情况。附图说明图1为根据本专利技术一实施例的图片中文字的识别方法的流程图;图2为根据本专利技术另一实施例中的图像的比较过程的流程图;图3为根据本专利技术实施例的图片中文字的识别方法在识别过程每个阶段的处理结果示意图;图4为根据本专利技术一实施例的检索图片中的关键字的方法的流程图;图5为根据本专利技术实施例的图片中文字的识别装置的示意图;图6为根据本专利技术实施例的电子设备的示意图。具体实施方式下面将结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。首先,结合图4说明根据本专利技术实施例的检索图片中的关键字的方法的流程图。如图4所示,根据本专利技术实施例的检索图片中的关键字的方法,包括:步骤101、提供原始图片。也就是说,准备需要在其中检索关键字的原始图片。步骤102、对所述原始图片进行OCR识别,以获得识别文字。其中,具体的OCR识别方本文档来自技高网...

【技术保护点】
1.一种图片中文字的识别方法,其特征在于,包括如下步骤:/n步骤S1,提供原始文字图像;/n步骤S2,根据所述原始文字图像进行OCR识别,生成目标文字;/n步骤S3,根据所述目标文字生成目标文字图像;/n步骤S4,将所述原始文字图像与所述目标文字图像进行比较,得到比较结果;/n步骤S5,基于比较结果,生成最终识别结果。/n

【技术特征摘要】
1.一种图片中文字的识别方法,其特征在于,包括如下步骤:
步骤S1,提供原始文字图像;
步骤S2,根据所述原始文字图像进行OCR识别,生成目标文字;
步骤S3,根据所述目标文字生成目标文字图像;
步骤S4,将所述原始文字图像与所述目标文字图像进行比较,得到比较结果;
步骤S5,基于比较结果,生成最终识别结果。


2.根据权利要求1所述的图片中文字的识别方法,其特征在于,所述步骤S1包括:
提供原图;
将所述原图以单个文字作为单位进行切割,形成单个文字图像,以所述单个文字图像作为所述原始文字图像。


3.根据权利要求2所述的图片中文字的识别方法,其特征在于,所述步骤S2包括:
根据所述原始文字图像进行OCR识别,得到OCR识别文字;
根据所述OCR识别文字,调用与其具有预定相似度的文字,生成所述目标文字。


4.根据权利要求3所述的图片中文字的识别方法,其特征在于,所述步骤S1之后且所述步骤S3之前还包括如下步骤:
步骤S6,基于所述原始文字图像中的文字的高宽比,确定其字号和/或字体,
所述步骤S3中,以所述字号和/或字体,打印所述目标文字,生成所述目标文字图像。


5.根据权利要求4所述的图片中文字的识别方法,其特征在于,利用font文件进行打印。


6.根据权利要求3所述的图片中文字的识别方法,其特征在于,所述步骤S4包括:
步骤S41,将所述原始文字图像与各个所述目标文字图像分别进行叠加,得到叠加图;
步骤S42,提取所述叠加图中的未重叠部分,生成差值图;
步骤S43,根据所述差值图中的像素值,确定所述比较结果,
其中,当所述差值图中的像素值小于等于预定阈值时,确定该原始文字图像中的文字与该目标文字图像中的目标文字一致,并以该目标文字图像中的文字作为识别结果。


7.根据权利要求6所述的图片中文字的识别方法,其特征在于,所述S42步骤包括:
步骤S421,对所述目标文字图像和/或所述原始文字图像进行扩宽或收窄,以消除所述叠加图中的两者的边缘差异;
步骤S422,提取消除边缘差异后的未重叠部分,生成所述差值图。


8.根据权利要求6或7所述的图片中文字的识别方法,其特征在于,所述步骤S43包括:
消除所述差值图中的离散的点,根据去除离...

【专利技术属性】
技术研发人员:雷凯李昭
申请(专利权)人:株式会社理光
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1