图片中文字的识别方法、关键字检索方法、装置及设备制造方法及图纸

技术编号：28422010 阅读：28 留言：0更新日期：2021-05-11 18:29

本发明专利技术提供一种图片中文字的识别方法、关键字检索方法、装置、设备及计算机可读存储介质，其中，图片中文字的识别方法包括如下步骤：步骤S1，提供原始文字图像；步骤S2，根据所述原始文字图像进行OCR识别，生成目标文字；步骤S3，根据所述目标文字生成目标文字图像；步骤S4，将所述原始文字图像与所述目标文字图像进行比较，得到比较结果；步骤S5，基于比较结果，生成最终识别结果。根据本发明专利技术的图片中文字的识别方法，结合OCR识别和图像比对，能够有效地提高识别准确度，且无需大量的模板等，有利于提高效率。

全部详细技术资料下载

【技术实现步骤摘要】
图片中文字的识别方法、关键字检索方法、装置及设备
本专利技术涉及图像处理
，具体涉及一种图片中文字的识别方法、关键字检索方法、装置、设备及计算机可读存储介质。
技术介绍
在特定的应用场景下，例如检索小屏幕截图(低分辨率、低PPI)上的文字，由于分辨率低，以及webscreentext的反锯齿的影响，OCR的准确度会降低，导致在通过关键字检索图片时的准确度降低。在这些场景下，仅仅依靠OCR来对图片中文字识别后再检索是否包含带检索文字，这样的方法是不足以达到目标。专利文献CN201510816513.4中记载了一种图像关键词检查方法及装置，然而，该方法首先需要大量的样图，将样图上面的文字截取下来，并生成一个样本库，随后将待检测的子图像与样本库中的图像进行比较，但是如果待检测的图没有在样本库中出现，那么现有方案是无法检索到的。
技术实现思路
有鉴于此，本专利技术目的在以提供一种图片中文字的识别方法、关键字检索方法、装置、设备及计算机可读存储介质，来提高检索的准确度。为解决上述技术问题，第一方面，本专利技术提供一种图片中文字的识别方法，包括如下步骤：步骤S1，提供原始文字图像；步骤S2，根据所述原始文字图像进行OCR识别，生成目标文字；步骤S3，根据所述目标文字生成目标文字图像；步骤S4，将所述原始文字图像与所述目标文字图像进行比较，得到比较结果；步骤S5，基于比较结果，生成最终识别结果。根据本专利技术的一些实施例，所述步骤S1包括：<...

【技术保护点】
1.一种图片中文字的识别方法，其特征在于，包括如下步骤：/n步骤S1，提供原始文字图像；/n步骤S2，根据所述原始文字图像进行OCR识别，生成目标文字；/n步骤S3，根据所述目标文字生成目标文字图像；/n步骤S4，将所述原始文字图像与所述目标文字图像进行比较，得到比较结果；/n步骤S5，基于比较结果，生成最终识别结果。/n

【技术特征摘要】
1.一种图片中文字的识别方法，其特征在于，包括如下步骤：
步骤S1，提供原始文字图像；
步骤S2，根据所述原始文字图像进行OCR识别，生成目标文字；
步骤S3，根据所述目标文字生成目标文字图像；
步骤S4，将所述原始文字图像与所述目标文字图像进行比较，得到比较结果；
步骤S5，基于比较结果，生成最终识别结果。

2.根据权利要求1所述的图片中文字的识别方法，其特征在于，所述步骤S1包括：
提供原图；
将所述原图以单个文字作为单位进行切割，形成单个文字图像，以所述单个文字图像作为所述原始文字图像。

3.根据权利要求2所述的图片中文字的识别方法，其特征在于，所述步骤S2包括：
根据所述原始文字图像进行OCR识别，得到OCR识别文字；
根据所述OCR识别文字，调用与其具有预定相似度的文字，生成所述目标文字。

4.根据权利要求3所述的图片中文字的识别方法，其特征在于，所述步骤S1之后且所述步骤S3之前还包括如下步骤：
步骤S6，基于所述原始文字图像中的文字的高宽比，确定其字号和/或字体，
所述步骤S3中，以所述字号和/或字体，打印所述目标文字，生成所述目标文字图像。

5.根据权利要求4所述的图片中文字的识别方法，其特征在于，利用font文件进行打印。

6.根据权利要求3所述的图片中文字的识别方法，其特征在于，所述步骤S4包括：
步骤S41，将所述原始文字图像与各个所述目标文字图像分别进行叠加，得到叠加图；
步骤S42，提取所述叠加图中的未重叠部分，生成差值图；
步骤S43，根据所述差值图中的像素值，确定所述比较结果，
其中，当所述差值图中的像素值小于等于预定阈值时，确定该原始文字图像中的文字与该目标文字图像中的目标文字一致，并以该目标文字图像中的文字作为识别结果。

7.根据权利要求6所述的图片中文字的识别方法，其特征在于，所述S42步骤包括：
步骤S421，对所述目标文字图像和/或所述原始文字图像进行扩宽或收窄，以消除所述叠加图中的两者的边缘差异；
步骤S422，提取消除边缘差异后的未重叠部分，生成所述差值图。

8.根据权利要求6或7所述的图片中文字的识别方法，其特征在于，所述步骤S43包括：
消除所述差值图中的离散的点，根据去除离...

【专利技术属性】
技术研发人员：雷凯，李昭，
申请(专利权)人：株式会社理光，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人