字符识别方法技术

技术编号：2936918 阅读：274 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种字符识别方法与系统。抽取字符图象的笔划特征，直接利用笔划特征对字符进行分类和匹配识别。字符的结构词义采用框架形式的知识表达，框架中强调有重要影响的笔划和笔划连接，忽视作用不大的笔划，给出允许畸变的笔划方向以及为辨析相似字所必须的比较条件，十分有利于突出字符间的区别又简化了匹配识别的过程。较之目前通用的字符识别技术具有更高的识别率和适应能力。（*该技术在2012年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种字符识别方法和系统，尤其适用于识别手写体汉字和多字体印刷汉字的识别方法。国内外已经研制的若干字符识别系统，主要采用对字符图象的象元分布抽取特征参量，并以此参量为依据进行分类和匹配识别的字符识别方法。例如，1989年2月8日中国专利审定公告CN1003257B的字符识别系统，1990年11月21日中国专利审定公告CN1010512B所公开的技术。因此，通常的技术有如下的问题1.不能直接反映字符的结构特征，因而忽视了笔划结构作为字符构成的本质特点。2.大字符集的情况下难以达到高的识别率。3.区分形态相似或笔划结构复杂的字符十分困难。4.在手写体字符情况下，字形书写变化很大，所抽取的特征参量分散性大，且需采用高维特征矢量。本专利技术的目的是创造一种字符识别方法，力求准确地抽取字符图象的笔划特征，充分反映字符的结构本质;直接利用字符的笔划结构词义对字符分类和匹配识别;运用知识表达字符的结构词义，达到简化字符的匹配识别过程，提高辨认相似字符的准确性和识别方法的适应能力。本专利技术所涉及的字符识别方法包括对书写有字符的页面扫描获得字符图象为第一步骤;字符图象二值化、字符切分及规格化为第二步骤;抽取字符二值化点阵的笔划结构特征为第三步骤;由结构特征求得分类特征码以确定所属分类为第四步骤;将结构特征与所属分类的字符模型进行匹配并识别之为第五步骤;将识别结果转为可见输出为第六步骤。所述的第三步骤包括1.字符结构模式作为模式整体可以分解为元字符、笔划和笔划元三种子模式。元字符是构造字符的字符。笔划分解为直线段即为笔划元。笔划元是最低级子模式，用作描述字...

【技术保护点】
一种字符识别方法，对书写有字符的页面扫描获得字符图象为第一步骤；字符图象二值化、字符切分及规格化为第二步骤；抽取字符二值化点阵的笔划结构特征为第三步骤；由结构特征求得分类特征码以确定所属分类为第四步骤；将结构特征与所属分类的字符模型进行匹配并识别之为第五步骤；将识别结果转为可见输出为第六步骤，本专利技术的特征是：所述的第三步骤包括：（１）字符结构模式作为模式整体可以分解为元字符、笔划和笔划元三种子模式，元字符是构造字的字符。笔划分解为直线段即为笔划元。笔划元是最低级子模式，用作描字符模式的结构基元，基结构特征包括笔划元中心坐标、长度、方向和连接关系。（２）对字符点阵作一次简单的扫描，检测每一象元在８个方向上与相邻象元的连接情况，将其区分为笔划的始端、终端、连接区或普通笔划元素并标记相应的符号，从而将字符点阵平面（ＣＤＰ）转换成字符象元属性平面（ＣＡＰ）。（３）除属于连接区的象元以外，在ＣＡＰ上处于边缘点的象元，计算其“丨”、“一”、“丿”、“丶”四个方向上连续的象元个数ｅｎ，ｅｎ最大的方向取作该边缘点的纤维主方向。在主方向上的ｅｎ值称作纤维长度，纤维长度上连接的象元赋以主方向相应的权值...

【技术特征摘要】

【专利技术属性】
技术研发人员：杨源远，路浩如，杨震，杨平勇，李璇，
申请(专利权)人：浙江大学，
类型：发明
国别省市：33[中国|浙江]

全部详细技术资料下载我是这个专利的主人