异态汉字识别方法技术

技术编号：10828672 阅读：130 留言：0更新日期：2014-12-26 18:02

本发明专利技术涉及一种异态汉字识别方法，其技术特点包括以下步骤：利用稀疏编码得到基向量和稀疏系数，通过重构图像滤除噪音、处理边缘柔化；利用梯度方向直方图抽取复原图像的汉字边缘梯度特征用以削弱倾斜和光照的影响；将获取的汉字边缘梯度特征送入分类器，进行异态汉字的识别。本发明专利技术设计合理，其采用稀疏编码和梯度方向直方图相结合的方式(SC-HOG方法)实现了复杂图像中的异态汉字识别功能，对于汉字倾斜、光照不均、噪音干扰和边缘柔化等异态情况有较强的鲁棒性，解决了复杂图像中汉字倾斜、光照不均、噪音干扰、边缘柔化等多种异态情况下的汉字识别问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于文字识别
，尤其是一种。
技术介绍
图像中的文字是图像的一种重要语义信息，正确定位和识别这些文字，对基于内容的图像检索及过滤应用有着重要意义。待提取文字的图像可分为文档图像、场景图像和原生数字图像这3大类。早期的图像文字提取研究集中在文档图像方面，其研究内容包括预处理（如二值化、倾斜校正、字符分割等）、字符识别、版面分析、图形符号识别。现有OCR软件主要是处理文档图像，对于场景图像和原生数字图像处理效果不佳。最近的研究则集中在复杂图像文字提取方面（包括场景图像文字提取和原生数字图像文字提取）上：（1)场景图像是指用摄像头所拍摄到的图像，场景中的文字（如路牌、广告牌等）也会作为场景的一部分被拍摄到场景图像中，场景图像中的文字可能夹杂在复杂的背景区域中，也可能存在文本倾斜、光照不均等情况； (2)原生数字图像是指用计算机软件生成并一直以数字形式保存的图像，为了便于在网络传输，原生数字图像具有低分辨率的特点，且通常存在压缩损失和严重的边缘柔化问题。复杂图像文字提取系统的框架如图1所示，包括文本定位、文字分割和文字识别模块。作为复杂图像文字提取的关键步骤之一，文字识别近年来已取得了一些研究成果，但是，目前复杂图像中的文字识别研究还主要集中在英文方面。在汉字识别领域，我国学者在印刷体汉字识别、手写体汉字识别（包括联机和脱机）方面取得了丰硕的成果，例如清华 TH-OCR与汉王OCR在汉字识别方面也已达到很高的性能，能够满足实际应用需求，但是，复杂图像中的汉字识别研究工作还很少，尚...

【技术保护点】
一种异态汉字识别方法，其特征在于包括以下步骤：步骤1、利用稀疏编码得到基向量和稀疏系数，通过重构图像滤除噪音、处理边缘柔化；步骤2、利用梯度方向直方图抽取复原图像的汉字边缘梯度特征用以削弱倾斜和光照的影响；步骤3、将获取的汉字边缘梯度特征送入分类器，进行异态汉字的识别。

【技术特征摘要】
1. 一种异态汉字识别方法，其特征在于包括以下步骤：步骤1、利用稀疏编码得到基向量和稀疏系数，通过重构图像滤除噪音、处理边缘柔化；步骤2、利用梯度方向直方图抽取复原图像的汉字边缘梯度特征用以削弱倾斜和光照的影响；步骤3、将获取的汉字边缘梯度特征送入分类器，进行异态汉字的识别。2. 根据权利要求1所述的异态汉字识别方法，其特征在于：所述步骤1利用稀疏编码得到基向量和稀疏系数是通过以下方法实现的：在训练阶段，根据以下目标函数进行优化问题求解：其中，X=(X1,x2, ^xm)eRkxm表示训练集中的m幅汉字图像减去各自的平均灰度值后得到的m个k维向量集合，k为每幅图像的像素数；B=O^b2，…，bn) ^浐?表示经稀疏编码计算得到的η个k维基向量；S=[\]nXmeRnxm表示稀疏系数矩阵，每一列Si = (Sil，si2，…，sin)为一幅图像的η维稀疏系数向量；β是一个常量，用来平衡重构误差与系数的稀疏性；Φ(SiP表示非线性的稀疏惩罚函数，该惩罚函数表示为：丄彡(?. ) =(4+勺2 以上述目标函数为优化目标，基于整幅汉字图像求取所有的基向量B和对应的稀疏系数S。3. 根据权利要求2所述的异态汉字识别方法，其...

【专利技术属性】
技术研发人员：王恺，
申请(专利权)人：南开大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人