当前位置: 首页 > 专利查询>重庆大学专利>正文

基于八邻域特征的数字识别方法技术

技术编号:14817079 阅读:307 留言:0更新日期:2017-03-15 11:30
本发明专利技术公开了一种基于八邻域特征的数字识别方法,包括步骤:1)获取手写体数字的原图;2)对原图进行预处理;3)对预处理后的图像进行分割,以获得单个字符;4)获取单个字符在八邻域方向上的激活频次和激活率;5)特征向量的提取;6)特征向量的优化;7)相似性度量。本发明专利技术基于八邻域特征提取,只提取了图像数量的有用信息,减少了输入模型数据的数量,从而提高了算法的执行速率;字符距离特征用相对距离表示,从而消除了字符大小对识别结果的影响,达到了优化特征值的目的,提高了特征值对字符的表征程度;字符识别算法采用的是欧几里得度量,算法简单且结果明显;本发明专利技术能实现对手写体数字的高效和高准确率识别。

【技术实现步骤摘要】

本专利技术涉及图像识别
,特别涉及一种手写体数字的识别方法。
技术介绍
人类的进步推动科学技术的发展,技术的进度又不断给人类提出新的挑战。随着网络技术的诞生,人们的生活变得越来越便利,也让人们越来越依赖网络。近几年掀起的电子商务狂潮,以及人们在网络上的通讯和娱乐使人们在网络上的交互变得越来越频繁,从而使人们的信息和隐私的安全受到威胁,网络安全日渐成为时下关注的热点问题。验证码的出现正是为了解决网络安全问题。在过去的几十年,随着数字化、信息化在社会生活方方面面的推广及普及,手写体的识别成为模式识别的研究热点。数字手写体多用于邮政编码、统计报表、财务报表、银行票据等方面,人们的关注焦点也越来越集中到手写体数字的识别上。但是很多方法只是停留在理论研究之中,实际生活中手写体数字因个人书写风格的不同而存在字符变形多样的问题,造成现有算法在手写体识别中识别率低、稳定性差、鲁棒性不足等多方面的问题。研究高性能的手写体数字识别算法仍然是一个具有相当挑战性的课题。卷积神经网络(CNN)在数字识别中已得到广泛应用,它的优点是用完整图像作为模型的输入,避免了特征提取的过程。在一定程度上降低了网络模型的复杂度,减少了权值的数量。但是,卷积神经网络算法用图像作为模型输入,这在算法的运行时间上就不够理想,并且识别的字符受到训练集的影响,所以卷积神经算法在一定程度上对数字识别的效果还不够理想,所以有必要研究减少输入模型的数据量并且运行效率高的算法。
技术实现思路
有鉴于此,本专利技术的目的是提供一种基于八邻域特征的数字识别方法,以实现对手写体数字的高效和准确识别。本专利技术基于八邻域特征的数字识别方法,包括以下步骤:1)获取手写体数字的原图;2)对原图进行预处理第一步,将彩色原图进行灰度化;第二步,将灰度化后的图像再进行二值化;第三步,对二值图像进行去噪声处理,得到预处理后的图像;3)对预处理后的图像进行分割,以获得单个字符;4)获取单个字符在八邻域方向上的激活频次和激活率;所述八邻域方向:即某一像素点周围八个相邻的像素点构成了它的八邻域,八邻域与该像素点的相对位置构成了该像素的八邻域方向;某一像素点的八邻域方向包括:0度、45度、90度、135度、180度、225度、270度、315度;激活点:在二值图像中,如果一个像素的值为1,而且其八邻域中有一个值为0的像素点,则称该点为激活点,表示该点包含了八邻域特征;所述激活频次:激活点的某一邻域上的值为0,表明该点在这一邻域方向被激活一次;某一邻域方向的激活频次即为所有激活点在此邻域方向被激活的总次数,0度方向、45度方向、90度方向、135度方向、180度方向、225度方向、270度方向、315度方向的激活频次依次记为f1,f2,f3,f4,f5,f6,f7,f8;激活频率:某一邻域方向的激活频率即为此邻域的激活频次在激活总频次的占比,记为:其中,i为第i个方向,i={1,2,3,…8本文档来自技高网...
基于八邻域特征的数字识别方法

【技术保护点】
基于八邻域特征的数字识别方法,其特征在于:包括以下步骤:1)获取手写体数字的原图;2)对原图进行预处理第一步,将彩色原图进行灰度化;第二步,将灰度化后的图像再进行二值化;第三步,对二值图像进行去噪声处理,得到预处理后的图像;3)对预处理后的图像进行分割,以获得单个字符;4)获取单个字符在八邻域方向上的激活频次和激活率;所述八邻域方向:即某一像素点周围八个相邻的像素点构成了它的八邻域,八邻域与该像素点的相对位置构成了该像素的八邻域方向;某一像素点的八邻域方向包括:0度、45度、90度、135度、180度、225度、270度、315度;激活点:在二值图像中,如果一个像素的值为1,而且其八邻域中有一个值为0的像素点,则称该点为激活点,表示该点包含了八邻域特征;所述激活频次:激活点的某一邻域上的值为0,表明该点在这一邻域方向被激活一次;某一邻域方向的激活频次即为所有激活点在此邻域方向被激活的总次数,0度方向、45度方向、90度方向、135度方向、180度方向、225度方向、270度方向、315度方向的激活频次依次记为f1,f2,f3,f4,f5,f6,f7,f8;激活频率:某一邻域方向的激活频率即为此邻域的激活频次在激活总频次的占比,记为:Pi=fiΣj=18fj]]>其中,i为第i个方向,i={1,2,3,…8}。5)将二值图像分为五个象限,计算每一个象限激活点占比I=[i(1),i(2),i(3),i(4),i(5)];第一到第四象限激活点重心角度A=[a(1),a(2),a(3),a(4),a(5)];激活点重心到中心点的距离D=[d(1),d(2),d(3),d(4),d(5)];从而得到分割出的字符特征向量W=(P,I,A,D);6)特征向量的提取第一步,通过公式Xj=1nΣi=1nxiYj=1nΣi=1nyi]]>提取每个象限的重心点坐标,n为第i个象限重心点的激活点个数,xi为激活点的横坐标,yi为激活点的纵坐标;Xj为第j个象限重心点横坐标,Yj第j个象限重心点纵坐标第二步,根据公式α(i)=i-12π+(-1)i-1×sin-1(|p(i-1)-centerpx|/r)]]>计算激活点重心角度,P(i,1)为第i个象限的重心点纵坐标,centerpx为图像中心点纵坐标;第三步,根据公式r=d(i)=(xi-X)2+(yi-Y)2]]>计算第i个象限重心点到图片中心点的距离;图像中心的横坐标为X=w/2,纵坐标为Y=h/2;h、w分别为图像的高和宽;7)特征向量的优化第一步,细化操作a)对数字图形进行预腐蚀,将所有腐蚀可去除的像素点标明,但不立即去除;b)以第一步标注的可去除像素点为基础,选择消除那些消除后不会破坏字符连通性的点,并保留其他点,以确保字符图像的拓扑结构;第一步,调整特征值a)激活率I=[i(1),i(2),i(3),i(4),i(5)]以百分制表示,增加激活率的量级;b)调整距离特征值D=[d(1),d(2),d(3),d(4),d(5)],通过公式d(i)=(xi-XX)2+(yi-YY)2]]>计算激活点重心到二值图像中心点的距离,xi为第i个象限的重心点的横坐标,yi为第i个象限的重心点的纵坐标,X为图像中心点的横坐标,同时也为图像宽的1/2,Y为图像中心点的纵坐标,同时也为图像高的1/2;8)相似性度量第一步,选取0,1,2,3,4,5,6,7,8,9这九个书写标准的手写体数字,用前述步骤4)至6)所述的方法分别提取各数字的特征向量W=(P,I,A,D),并将这10个数字的特征向量存为数字的标准特征,作为待识别字符特征向量比较的标准;第二步,采用欧几里得度量计算标准数字特征与待识别字符特征的相似性,通过比较相似性的大小判断待识别字符。...

【技术特征摘要】
1.基于八邻域特征的数字识别方法,其特征在于:包括以下步骤:1)获取手写体数字的原图;2)对原图进行预处理第一步,将彩色原图进行灰度化;第二步,将灰度化后的图像再进行二值化;第三步,对二值图像进行去噪声处理,得到预处理后的图像;3)对预处理后的图像进行分割,以获得单个字符;4)获取单个字符在八邻域方向上的激活频次和激活率;所述八邻域方向:即某一像素点周围八个相邻的像素点构成了它的八邻域,八邻域与该像素点的相对位置构成了该像素的八邻域方向;某一像素点的八邻域方向包括:0度、45度、90度、135度、180度、225度、270度、315度;激活点:在二值图像中,如果...

【专利技术属性】
技术研发人员:卓颋朱征宇殷荣华马乔刘洪明
申请(专利权)人:重庆大学北京软云神州科技有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1