在字符识别系统中选取候选字符的方法技术方案

技术编号：2936906 阅读：219 留言：0更新日期：2012-04-11 18:40

一种在字符识别系统中选取候选字符的方法，包括：字符特征提取步骤，以字符的串长度信息为基础，提取字符的特征；字符分布提取步骤，在提取的字符特征基础上确定字符的位置信息；字符分类基准数据存储步骤，在存储器中存储作为字符分类基准数据的确定的字符位置信息；以及候选字符选取步骤，选取属于存储在存储器中的与要识别的输入字符的特征相对应的一个具体位置的字符作为输入字符的候选字符。与现有技术相比，依照本发明专利技术，字符识别时间为减少，而字符识别的准确率为增加。（*该技术在2012年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术总的来说涉及，即利用统计的方式识别字符，更具体地说，涉及这样的，它能够在串长(run-lengths)的基础上对组合型字符如朝语，汉语字符通过选取字符特征，迅速准确地选出候选字符。根据现有技术的一种统计字符识别系统中对候选字符的识别是这样的，首先根据所有字符得出基本特征，然后，根据基本特征的相似性将这些字符划分成树形结构。然后，输入要识别的字符，得到输入字符的基本特征，然后在基本特征的基础上，沿着预先存储的树，找出对应于输入字符的候选字符。也就是说，在树上与要识别的输入字符相对应的位置的字符(或字符组)被确定作为输入字符的候选字符。对于根据所有字符获得基本特征以及根据基本特征的相似性将这些字符分成树形结构的方法，下面几种是人所周知的，即利用网格字符分类法，根据字符的象素距离利用平行特征的字符分类法，以及利用时间/频率变换的字符分类法等。参见附图说明图1，这里显示了根据现有技术利用网格对字符分类的方法。如该图所示，每个字符都被n×n个格子形空间所覆盖，这些格子形空间称为网格。包括在单个网格中的每个字符的象素(例如黑色象素)的个数被计算出来。计算出的数值被作为字符的基本特征。在对应的网格单元中即可得出字符的基本特征的相似性。然后，这些字符被划分成如图2所示的在基本特征相似性的基础上形成的树形结构。例如，n×n个网格都标上数字，而且每个字符都被标有数字的n×n个网格所覆盖。根据从1到NN(在n×n个的情形)的每个相同数字的网格的基本特征，计算出不同字符的相似性。在相似性的基础上，将这些字符划分到同一类别的字符中。划分到同一类别的字符再分成从第2个...

【技术保护点】
一种在字符识别系统中选取候选字符的方法，包括：字符特征提取步骤，以字符的串长信息为基础、提取字符的特征；字符分布提取步骤，在提取的字符特征基础上确定字符的位置信息；字符分类基准数据存储步骤，在存储器中存储作为字符分类基准数据的确定的字符位置信息；以及候选字符选取步骤，选取属于存储在存储器中的与要识别的输入字符的特征相对应的一个具体位置的字符作为输入字符的候选字符。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：崔宰均，
申请(专利权)人：株式会社金星社，
类型：发明
国别省市：KR[韩国]

全部详细技术资料下载我是这个专利的主人