本发明专利技术提供可以从文字识别难的文字图像中正确并且高速地识别文字的文字识别装置。包括:文字区域分离部分,推定被输入的文字图像的文字宽度,分离出与该文字宽度相当的长度的文字区域;特征抽出部分,抽出被分离的文字区域内的文字图像的特征;标准图案词典,由单个文字标准图案词典和多文字标准图案词典的双方组成;词典核对部分,将用特征抽出部分抽出的文字图案的特征,和词典中的单个文字以及文字列的特征对照,抽出文字图案表示的文字或者文字列的候补。(*该技术在2019年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及将被输入的文字图像作为文字进行识别的文字识别装置。以往,在将被输入的文字图像作为文字进行识别的文字识别装置的领域中,例如OCR(光学式文字读取装置)或者组合图像扫描仪和OCR软件的文字识别装置等在应用领域广泛使用。在以往的OCR用票单中,使用印刷有每单个文字的文字填写框的票单,在使用汉字的系统中文字填写框的大小也采用容易填入汉字那样大小的文字填写框。由此具有对于OCR来说容易正确地识别被填入的文字,对于填写者来说促使其在填写文字时不要和相邻的文字接触的效果。但是,随着OCR利用领域的进一步扩展,对于用一般所使用的通常的票单那样的小的票单不受文字框限制地被填入的文字列,即,在通常的传票等上以不规则的文字间隔、不规则的填入方法填入的相邻文字之间相互接触那样的低品质的手写文字列,也要求有可以以实用的识别精度识别的文字识别装置。另外,在印刷的文字列的情况下,要使用如OCR-B或者多字体等那样只用多个特定的字体精心印刷的OCR票单,但对于被印刷的文字列,也希望一种文字识别装置,其可以从用不特定的印字装置以多样的文字间距印刷的,有多种变形的文字列,例如用文字间距窄的印字装置或者用比例间距印刷的文字列,或者半角文字和全角文字混合存在的文字列等中以实用的识别精度分离文字列。在以往的文字识别装置中的文字分离方式,特别在从自由间距的文字列,即未设定文字框的字段中分离出文字的文字分离方式中,采用对于孤立的黑象素的连接区域求出文字列的高度信息,从其高度信息中求出文字的间距信息,用该值合并或者分离相邻的文字,从而分离出应该作为识别对象的单个文字的方式。或者采用将1行、1字段的文字列投影到与行方向、字段方向垂直的方向上,从文字列的高度信息中求文字的间距信息,用该值从投影直方图中分离出文字位置的方式。当其分离位置不能确定为一种的情况下也可以求多种的分离位置。通常,收集根据预先由不特定的多位书写者确定的笔迹填入的文字,从这些文字中抽出依据识别方式的文字图案的特征用统计的方法等制成标准图案。另外,标准图案,也有从被收集的文字中制成平均图案的。在手写文字的情况下,因为因书写者不同而产生大的文字变形所以对于各种字制成多种标准图案。通常将一种标准图案称为模板,将收集了多种标准图案的词典称为多模板词典。作为词典核对方法,采用从由输入票单中分离出的单个文字中抽出该文字图案的特征,在该特征和标准图案词典的模板的特征之间进行近似度计算或者距离计算,将具有最大近似度的类型或者具有最小的距离的模板的类型作为识别结果求出的方法。作为候补文字列,按照距离小的顺序求例如将8位作为候补文字列。对于印刷文字也可以使用同样的方法求候补文字列。当有多种候补的情况下可以采用用图案之间的类似度评价值,或者用知识处理等的语言处理确定最佳的分离候补的方法。一般,当识别在通常的传票上用如手写输入那样的自由间距填入的文字列,或者用非特定的印字装置印刷的文字列的情况下,多是相邻的文字之间接触,另外在印刷文字列的情况下有半角文字和全角文字混合存在的情况,由于相邻的文字之间大多接触,所以在检出每一个文字识别的方法中,很难判断到什么范围为单个文字,实现在实用中可以容忍的识别精度很难。还有由平假名、片假名,以及在汉字中有偏(汉字的左边)和旁(汉字的左边)原本就分离出的文字区域组成的文字,如果不能正确地识别这些文字区域也就连是用哪种文字写入的都不能判断。在印刷文字列的文字分离中,作为从1行文字列推定各个文字的间距的方法提出了以下的各种方法。第1种方法,将1行文字列的黑象素投影在行方向上求构成行的文字的平均高度。接着,将文字列的黑象素投影在与行方向垂直的方向上将黑象素的行方向的频度作成直方图表示,从其直方图中求频度为0的位置,即文字列被间断切成的位置,或者应该切断的直方图极小点,即接触文字或者重叠文字的切断候补位置。根据该切断候补位置,将根据前面求出的文字列的平均高度准确看出全角文字、半角文字列的位置作为文字分离位置。第两种方法,将1行文字列的黑象素投影在与行方向垂直的方向上将黑象素的行方向的频度制成直方图表示,从该直方图中求频度为0的位置,或者直方图的极小点,对于该文字列求多种被推定为文字分离位置的位置。多种文字分离位置中的某一个是最接近的文字分离位置的判定,靠文字列的类似度评价和识别结果的判断确定。第3种方法,对1行文字列求黑象素的连接区域,对于连接区域的排列小的区域之间合并,大的区域被分成多个段确定单个文字的区域进行文字分离。此时的小区域,大区域的判断根据文字列的高度进行。但是,不论上述哪种方法都分别存在以下的问题。即,在第1种方法中,当1行的文字列全部由全角文字构成的情况下,因为一般认为全角文字的文字宽度和文字高度全部相等,所以可以从平均文字高度正确推定文字宽度,因而,可以正确地分离出每单个文字,但当半角文字和全角文字混合存在的情况下,例如在全角的假名汉字混杂的文字列中混入半角的英文数字或者片假名的情况下,文字位置只偏移半角,半角两个文字被识别为一个文字,不能求得正确的文字分离位置。另外,在第两种方法中,因为对1行的文字列可以得到多种分离结果所以在1行的识别处理中需要多行的处理时间,又因为在接触文字很多的情况下等会出现非常多的分离结果,所以存在识别处理速度显著降低的问题。另外,在第3种方法中,对于接触的文字列部分的分离识别精度上存在很多的问题,进行正确的文字识别很困难。鉴于上述的问题,本专利技术的目的在于,提供一种即使是从文字识别难的文字图像中也可以正确并且高速地识别文字的文字识别装置。实现上述目的的本专利技术的文字识别装置,包括以下部分文字区域分离部分,从被输入的文字图像中推定文字宽度从该文字图像中分离出与文字宽度相当的长度的文字区域;特征抽出部分,抽出被上述文字区域分离部分分离出的文字区域内的文字图案的特征;标准图案词典,由记录了标准文字的单个文字的各种特征的单个文字标准图案词典和记录了排列规定数量的标准文字的文字列的各种特征的多文字标准词典两方组成;词典核对部分,把在上述特征抽出部分中抽出的,文字区域内的文字图案的特征,和被记录在构成上述标准图案词典的上述单个文字图案词典以及上述多文字标准图案词典中的单个文字以及文字列的各种特征对照,抽出该文字区域内的文字图案表示的文字或者文字列的候补。在此,本专利技术的文字识别装置最好具备验证部分,当由上述词典核对部分,抽出把上述文字区域内的文字图案的特征和被记录在上述多文字标准图案词典中的文字列的特征对照的结果文字列的候补的情况下,在上述特征抽出部分中,抽出把抽出文字列的候补的文字区域进一步分割成和构成其文字列的文字数相同的数量的形成的各分割区域的各自的文字图案的特征,在上述词典核对部分中,把上述分割区域各自的文字图案的特征,和被记录在上述单个文字标准图案词典中的单个文字的各种特征对照抽出与上述分割区域的排列对应的文字列的候补,检验该文字列的候补,是否与用上述多文字标准图案词典抽出的文字列的候补一致。另外,上述文字区域分离部分,最好在每偏移和上述规定数相同地分割文字宽度时的一分割长度,从上述文字图像中分离出与上述文字宽度相当的长度的文字区域。另外,上述词典核对部分,最好是对于被上述文字区域分离部分分离出的文字区域在各自本文档来自技高网...
【技术保护点】
一种文字识别装置,其特征在于:包括以下部分, 文字区域分离部分,从被输入的文字图像中推定文字宽度,从该文字图像中分离出与该文字宽度相当的长度的文字区域; 特征抽出部分,抽出被上述文字区域分离部分分离出的文字区域内的文字图像的特征; 标准图案词典,由记录了标准文字单个文字的各种特征的单个文字标准图像词典和记录了以规定数量排列标准文字形成的文字列的各自的特征的多文字标准图像词典两部分组成; 词典核对部分,将用上述特征抽出部分抽出的文字区域内的文字图像的特征,和构成上述标准图像词典的记录在上述单个文字标准图像词典以及上述多文字标准图像词典中的单个文字以及文字列的各自特征对照,抽出该文字区域内的文字图案表示的文字或者文字列的候补。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:伊崎保直,镰田英夫,坂根俊司,井出克美,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。