一种点密度非线性归一化文字识别方法和装置制造方法及图纸

技术编号：4039463 阅读：433 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了一种点密度非线性归一化文字识别方法和装置，所述方法包括：针对用户输入的当前文字的手写轨迹，获取该手写轨迹的外接矩形；判断所述外接矩形的宽高比是否在预置比值范围之内；若是，则将外接矩形扩大为正方形，并在该正方形的二维坐标平面内对手写轨迹的各个像素点进行点密度非线性归一化处理，获得各个像素点归一化后的坐标；若否，则直接在所述外接矩形的二维坐标平面内对手写轨迹的各个像素点进行点密度非线性归一化处理，获得各个像素点归一化后的坐标。通过本发明专利技术能够减少文字识别中的变形、失真，提高识别的可靠性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及手写识别
，特别是涉及一种点密度非线性归一化文字识别方法和装置。
技术介绍
在手写识别中，需要对用户输入的汉字进行预处理，由于字符大小不一，为了便于提取字符特征，需要对样本进行大小归一化。归一化可分为线性归一化和非线性归一化两种方法。线性归一化就是将文字图像按照一定的比例系数线性放大或缩小，其中X方向和 Y方向的比例系数可以相同也可以不同。一般的做法是将每一个字符块调节到一个正方形内，即先用一个框将字符块围起来，然后将方框拉伸为正方形，此方法主要是基于汉字为方块字的假设。这种方法采用的算法简单、失真较小，但是无法调整手写汉字的中心位置和笔划密度。“人”是一个标准的方块汉字，一般而言不同的两个人书写出的这个汉字只有大小之分，在做完线性归一化将字符归一化到相同尺寸，比如说100*100的范围，从ζ轴上看它们的重合程度非常大，用一个非常简单的判别算法也能够判断出这两个字是非常相似的。不同人的书写习惯不同，有的人写得胖，有的人写的瘦，经线性归一化后，仍然可以看到很大的重合度。但有些人写字非常拖，一捺拉得很长，一撇只能占到整个字符的三分之一宽度，这时如果经采用线性归一化，再从ζ轴上看，就会发现只有一撇的收笔部分会有些重合。为了解决这个问题，可以采用基于点密度的非线性归一化算法。非线性归一化强调按照手写汉字的特征分布来处理，它是在一个二维平面上，沿着X轴和y轴分别计算每个坐标点上的点密度，然后利用映射函数，可以计算原坐标(X，y) 在平面上新的坐标点(χ’，y’)。这种点密度的非线性归一化算法，能够一定程度上消除不同人...

【技术保护点】
一种点密度非线性归一化文字识别方法，其特征在于，包括：针对用户输入的当前文字的手写轨迹，获取该手写轨迹的外接矩形；判断所述外接矩形的宽高比是否在预置比值范围之内；若是，则将外接矩形扩大为正方形，并在该正方形的二维坐标平面内对手写轨迹的各个像素点进行点密度非线性归一化处理，获得各个像素点归一化后的坐标；若否，则直接在所述外接矩形的二维坐标平面内对手写轨迹的各个像素点进行点密度非线性归一化处理，获得各个像素点归一化后的坐标。

【技术特征摘要】

【专利技术属性】
技术研发人员：李健，张连毅，武卫东，
申请(专利权)人：北京捷通华声语音技术有限公司，
类型：发明
国别省市：11

全部详细技术资料下载我是这个专利的主人