非常见字体的图像文字OCR识别系统技术方案

技术编号:15355644 阅读:298 留言:0更新日期:2017-05-17 13:51
本发明专利技术涉及图像识别处理领域,特别涉及非常见字体的图像文字OCR识别系统;特征图片生成模块,图像文字切分模块,存储模块和图像文字识别模块;特征图片生成模块,根据用户选择的待识别图像文字的字体,制作出对应的字符特征图片,并将制作成的特征图片存储于存储模块中;图像文字切分模块将待处理图像中的字符进行切分,切分成各个仅包含单个字符的子图片存储模块中;所述图像识别模块,提取存储模块中的子图片,计算子图片与特征图片的符合程度,进而实现子图片字符内容的识别,并将识别结果输入。在使用时用户仅需将待识别图像输入系统中,并根据待识别图像选择对应字体,就可以得出识别后的可编辑,可操作的图像文字识别结果。

【技术实现步骤摘要】

本专利技术图像识别领域,特别涉及非常见字体的图像文字OCR识别系统
技术介绍
随着社会的发展和科技的进步,人类创造的知识正以指数级的数量增加,在电子书籍出现之前,大部分的知识是以图书的方式进行传承,中华上下五千年,产生了大量优秀书籍,这些书籍在历史的长河中,或多或少都遭到了不同程度的损坏,因此对这些书籍进行数字化存储迫在眉睫;在图书管理领域,书籍内容的快速搜索对于快速定位书籍很有帮助,而由于书籍数量太多,加上早期印刷的图书没有作者的电子文稿,因此纸质书籍的电子化很有必要。光学字符识别软件就是处理这种纸质图书到电子文档转化的利器,其主要利用大量的字符样本,经过复杂网络的学习,生成相应的模型文件,从而达到识别图片中字符的目的。光学字符识别软件主要功能是识别拍摄、扫描图片中的字符,现有技术中在进行图像中文字的识别时,首先需要将图像中的字符串切分开,形成包含单个文字的小图片,然后使用一定的方法对切分后的文字进行识别。而进行文字切分最常用的方法为投影法,即是将图像文字二值化处理后,通过垂直投影法找到两个文字之间的分界线,根据分界线将文字切分开来。然而当图像中的文字之间具有粘连,且图像中包含左右结构的汉字时,简单的投影方法就很难实现较好的切分效果;正是因为这个原因使得切分一直是OCR识别的难点,切分的质量将直接影响到文字的识别效果。此外光学字符识别软件主要功能是识别拍摄、扫描图片中的字符,对于一些特殊字体的扫描件,公章,拍照,比如早期印刷的书籍,政府单位制作的证件等,由于历史原因以及保密与安全需要,其字体往往是特制的,现有的光学字符识别软件主要集中于机器学习的方法,模型运算量大,而且由于训练字体样本没有覆盖到特殊字体,导致特殊字体的识别准确率不高,严重影响纸质文档的电子化。现有技术大多采用神经网络机器学习算法对字符进行识别,需要制作大量的样本,耗费大量的时间进行训练,且生成的模型文件非常庞大,且对于不同字体的字符,识别率不尽相同,对于某些特殊字体字符,识别率比较低,很难满足一些特殊场景下的字符识别。
技术实现思路
本专利技术的目的在于克服现有技术中所存在的上述不足,提供非常见字体的图像文字OCR识别系统,在使用时用户仅需将待识别图像输入系统中,并根据待识别图像选择对应字体,就可以得出识别后的可编辑,可操作的图像文字识别结果。为了实现上述专利技术目的,本专利技术提供了以下技术方案:非常见字体的图像文字OCR识别系统,特征图片生成模块,图像文字切分模块,存储模块和图像文字识别模块;所述特征图片生成模块,根据用户选择的待识别图像文字的字体,制作出对应的字符特征图片,并将制作成的特征图片存储于所述存储模块中;所述图像文字切分模块将待处理图像中的字符进行切分,切分成各个仅包含单个字符的子图片,并将切分后的子图片序列存储于存储模块中;所述图像识别模块,提取存储模块中的子图片,计算子图片与特征图片的符合程度,进而实现子图片字符内容的识别,并将识别结果输入。进一步的,所述图像文字切分模块对文字字符图片的切分包含以下实现过程:A、使用投影法待识别图像文字进行切分,切分成子图片序列;将其中的数字、字母和标点符号标记出来;B、对未标记的子图片进行判断:是否满足L≤M*h,L为子图片字符投影的宽度,M为系数,h为行高;对于不满足条件的子图片进行切分,切分位置根据以下公式进行确定:f(x)=g(x)t(x)重复执行步骤B,直到序列中未标记的子图片均满足条件:L≤M*h;C、对于序列中数字、字母和标点字图片以外的相邻两子图片的总宽度进行判断:是否满足L合≤M*h;如果满足,依序对满足条件的相邻子图片进行合并;重复执行步骤C直到除数字、字母和标点以外的相邻子图片总宽度均不满足L合≤M*h;D、对序列中未标记的子图片进行判断:如果序列中存在三个相邻的子图片,且三个子图片满足:第一子图片和第三子图片的宽度L≤0.5h,且中间子图片的宽度L≥h,则将中间子图片根据公式:f(x)=g(x)t(x)所确定的切分点进行切分;根据确定的切分点,将中间子图片切分成第一中间子图片和第二中间子图片;将第一子图片和第一中间子图片合并;将第二中间子图片和第三子图片合并。进一步的,0.9≤M≤1.3。作为一种优选,M=1.2。进一步的,所述特征图片生成模块,制作字符特征图片的过程如下:对待识别图像文字进行行、列垂直投影,将其中的数字、字母和标点字符切分出来,形成对应的子图片;在每个数字、字母和标点对应的子图片中选择一张子图片,将子图中的字符,分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;根据用户选择的待识别图像文字的字体,生成样本图片;对样本图片中的字符分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片;并对制成的特征图片进行对应的标注。进一步的,所述图像文字识别模块的子图片字符内容识别包含以下实现步骤:所述图像文字识别模块,提取存储于存储模块中的待识别数字、字母和标点的子图片的对应直方图特征与数字、字母和标点的特征图片的直方图特征进行比对;得到对应的识别结果;所述图像文字识别模块,存储于存储模块中的文字字符子图片的对应直方图特征与文字字符的特征图片的直方图特征进行比对,识别出对应子图片对应的文字。进一步的,所述所述图像文字识别模块采用K近邻算法找出与待识别子图片字符距离最小的前K个样本特征图片,统计出现次数最多样本图片,其对应的字符标签即为字符的识别结果。进一步的,K=9。进一步的,所述系统为加载有所述非常见字体的图像文字OCR识别功能程序的计算机或者服务器。与现有技术相比,本专利技术的有益效果:本专利技术提供非常见字体的图像文字OCR识别系统,特别涉及非常见字体的图像文字OCR识别系统;特征图片生成模块,图像文字切分模块,存储模块和图像文字识别模块;特征图片生成模块,根据用户选择的待识别图像文字的字体,制作出对应的字符特征图片,并将制作成的特征图片存储于存储模块中;图像文字切分模块将待处理图像中的字符进行切分,切分成各个仅包含单个字符的子图片存储模块中;所述图像识别模块,提取存储模块中的子图片,计算子图片与特征图片的符合程度,进而实现子图片字符内容的识别,并将识别结果输入。在使用时用户仅需将待识别图像输入系统中,并根据待识别图像选择对应字体,就可以得出识别后的可编辑,可操作的图像文字识别结果;为图像文字识别提供便捷工具。附图说明:图1为本非常见字体的图像文字OCR识别系统的实现步骤图。图2为粘连文字图像样例图。图3为修正值g(x)的分布示意图。图4为图3中字符的幅值分布示意图。图5为所述特征图片生成特征图片的实现过程图。图6为数字模板的制作示意图。图7为文字模板的制作示意图。具体实施方式下面结合试验例及具体实施方式对本专利技术作进一步的详细描述。但不应将此理解为本专利技术上述主题的范围仅限于以下的实施例,凡基于本
技术实现思路
所实现的技术均属于本专利技术的范围。本专利技术系统提供非常见字体的图像文字OCR识别系统如图1所示:包含特征图片生成模块,图像文字切分模块,存储模块和图像文字识别模块;所述特征图片生成模块,根据用户选择的待识别图像文字的字体(根据待识别图像文字的字体,构造对应特征模板,具有更强的本文档来自技高网
...
非常见字体的图像文字OCR识别系统

【技术保护点】
非常见字体的图像文字OCR识别系统,其特征在于,包含特征图片生成模块,图像文字切分模块,存储模块和图像文字识别模块;所述特征图片生成模块,根据用户选择的待识别图像文字的字体,制作出对应的字符特征图片,并将制作成的特征图片存储于所述存储模块中;所述图像文字切分模块将待处理图像中的字符进行切分,切分成各个仅包含单个字符的子图片,并将切分后的子图片序列存储于存储模块中;所述图像文字识别模块,提取存储模块中的子图片,计算子图片与特征图片的符合程度,进而实现子图片字符内容的识别,并将识别结果输入。

【技术特征摘要】
1.非常见字体的图像文字OCR识别系统,其特征在于,包含特征图片生成模块,图像文字切分模块,存储模块和图像文字识别模块;所述特征图片生成模块,根据用户选择的待识别图像文字的字体,制作出对应的字符特征图片,并将制作成的特征图片存储于所述存储模块中;所述图像文字切分模块将待处理图像中的字符进行切分,切分成各个仅包含单个字符的子图片,并将切分后的子图片序列存储于存储模块中;所述图像文字识别模块,提取存储模块中的子图片,计算子图片与特征图片的符合程度,进而实现子图片字符内容的识别,并将识别结果输入。2.如权利要求1所述的系统,其特征在于,所述图像文字切分模块对文字字符图片的切分包含以下实现过程:A、使用投影法待识别图像文字进行切分,切分成子图片序列;将其中的数字、字母和标点符号标记出来;B、对未标记的子图片进行判断:是否满足L≤M*h,L为子图片字符投影的宽度,M为系数,h为行高;对于不满足条件的子图片进行切分,切分位置根据以下公式进行确定:f(x)=g(x)t(x)g(x)=11+e-0.01|x-h|]]>重复执行步骤B,直到序列中未标记的子图片均满足条件:L≤M*h;C、对于序列中数字、字母和标点字图片以外的相邻两子图片的总宽度进行判断:是否满足L合≤M*h;如果满足,依序对满足条件的相邻子图片进行合并;重复执行步骤C直到除数字、字母和标点以外的相邻子图片总宽度均不满足L合≤M*h;D、对序列中未标记的子图片进行判断:如果序列中存在三个相邻的子图片,且三个子图片满足:第一子图片和第三子图片的宽度L≤0.5h,且中间子图片的宽度L≥h,则将中间子图片根据公式:f(x)=g(x)t(x)g(x)=11+e-0.01|x-0.5h|]]>所确定的切分点进行切分;根据确定的切分点,将中间子图片切分...

【专利技术属性】
技术研发人员:景亮刘世林康青杨唐涔轩
申请(专利权)人:成都数联铭品科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1