手写图像识别方法技术

技术编号:22220052 阅读:28 留言:0更新日期:2019-09-30 01:51
本发明专利技术涉及一种手写图像识别方法,对数据集中随机选取数据进行预处理后送入BP神经网络进行训练,训练后BP神经网络对数据进行图像识别,以BP神经网络为核心,针对BP网络进行改进,在大大降低网络复杂度的同时还能增加其判别能力,从而大大增强了分类器的分辨能力,通过改进结构后的算法对手写数字进行识别,极大的降低由于人员经验不足与疏忽大意所造成的诊断失误,从而提高了检测的准确率,减少误判和漏判问题的发生。

Handwritten Image Recognition Method

【技术实现步骤摘要】
手写图像识别方法
本专利技术涉及一种图像识别技术,特别涉及一种手写图像识别方法。
技术介绍
手写数字识别是符号识别的一个分支,虽然只是识别简单的10个数字,但却有着非常大的实用价值。在我们的日常生活中,每天都要进行大量的文档处理工作,税单、银行支票、汇款单、信用卡账单的处理,以及邮局信函的分检等等,如何利用计算机字符识别和文档处理技术,使人们从这些繁重的手工劳动中解放出来已成为一个迫切需要解决的问题。手写数字虽然只有10个种类,但很多情况下对识别的精度要求非常高,而且每个人都有不同的字迹,要做到准确地识别还是有一定难度的。况且在实际应用中,手写数字识别的精确度要求要比汉字严格的多,因为数字识别经常用在财务、金融等领域。
技术实现思路
本专利技术是针对手写数字识别的问题,提出了一种手写图像识别方法,设计一个增强型的全新模型来实现手写数字的辅助识别,避免由于人员经验不足与疏忽大意,以及字体模糊不清,难以识别所造成的诊断失误,从而提高了检测的诊断率,减少误判和漏判问题的发生。本专利技术的技术方案为:一种手写图像识别方法,具体包括如下步骤:1)从数据集之中,随机选取数据中6万张图片作为训练集,剩余1万组作为测试集,训练集中包含0至9这10个手写数字图片各6千张,测试集10个手写数字图片各1000张,数据集中的图片图像大小为28*28;2)、对选取的图像进行二值化处理,将待识别图像转换为二进制图像,再将图像大小进行缩放,统一缩放为大小10*10的图像,最后再将此10*10的图像进行重新排列,将其转换为1*100的维度数组;3)、将训练集经过步骤2)处理后的6万个1*100的维度数组打乱顺序后带入BP神经网络进行训练,利用BP神经网络对此数组进行分类;将训练好的神经网络输入测试集经过步骤2)处理后的1万个1*100的维度数组进行检测,检测训练好的神经网络的识别正确率,正确率达到要求,此训练后神经网络可直接用于识别分类,如正确率达不到要求,则增加测试集重新进行神经网络训练。所述步骤3)中BP神经网络中BP算法改进方法如下:3.1)原BP算法中计算第i层到第i+1层的计算公式为:式中Hi+1表示第i+1层的值,Hi表示第i层的值,ωi(i+1)表示第i层到i+1层的连接权值,ai+1表示第i层到i+1层的连接阈值,n为第i+1层的神经元个数,f为激活函数定义为:3.2)对连接权值ωi(i+1)进行改进,改进方式如下;3.2.1)首先定义一个数组矩阵mi(i+1),这个矩阵与ωi(i+1)的行数与列数相同;3.2.2)再利用均匀随机分布函数,在矩阵mi(i+1)中随机生成[0,1]区间的数据;3.2.3)最后利用分类函数g(x)对矩阵mi(i+1)中的数据进行分类,将mi(i+1)有一个[0,1]区间的矩阵转换成一个由0和1组成的矩阵,g(x)分类函数如下:3.2.4)将生成的0,1矩阵mi(i+1)与BP中的连接权值ωi(i+1)进行点乘,生成一个新的数组矩阵,我们将其定义为Si(i+1),其生成公式为:Si(i+1)=mi(i+1)·ωi(i+1)3.2.5)这样我们就得到新的第i层到第i+1层的计算公式,其公式为:本专利技术的有益效果在于:本专利技术手写图像识别方法,以BP(backpropagation)神经网络为核心,针对BP网络进行改进,在大大降低网络复杂度的同时还能增加其判别能力,从而大大增强了分类器的分辨能力,通过改进结构后的算法对手写数字进行识别,极大的降低由于人员经验不足与疏忽大意所造成的诊断失误,从而提高了检测的准确率,减少误判和漏判问题的发生。附图说明图1为本专利技术手写图像识别方法流程示意图;图2为本专利技术改进的BP算法的流程示意图。具体实施方式如图1所示手写图像识别方法流程示意图,具体包括如下步骤:1、从数据集之中,随机选取数据中6万张图片作为训练集,剩余1万组作为测试集,训练集中包含0至9这10个手写数字图片各6千张,测试集10个手写数字图片各1000张。数据集中的图片图像大小为28*28。2、对选取的图像进行二值化处理,将待识别图像转换为二进制图像。再将图像大小进行缩放,统一缩放为大小10*10的图像,最后再将此10*10的图像进行重新排列,将其转换为1*100的维度数组。3、将训练集经过步骤2处理后的6万个1*100的维度数组带入BP神经网络进行训练,利用BP神经网络对此数组进行直接分类。在此过程中我们将0-9的图像打乱顺序后全部带入神经网络中。进行训练,将训练好的神经网络输入测试集经过步骤2处理后的1万个1*100的维度数组进行检测,检测训练好的神经网络的识别正确率,正确率达到要求,此训练后神经网络可直接用于识别分类,如正确率达不到要求,则增加测试集重新进行神经网络训练。如图2所示改进的BP算法的流程示意图,实现如下:3.1对于原有的BP网络进行改进,原BP算法中计算第i层到第i+1层的计算公式为:式中Hi+1表示第i+1层的值,Hi表示第i层的值,ωi(i+1)表示第i层到i+1层的连接权值,ai+1表示第i层到i+1层的连接阈值,n为第i+1层的神经元个数,f为激活函数定义为:x为第i层所得到的结果,作为输入;3.2对上式中的连接权值ωi(i+1)进行改进,在大大降低网络复杂度的同时还能增加其判别能力,从而大大增强了分类器的分辨能力,改进方式如下;3.2.1、首先定义一个数组矩阵mi(i+1),这个矩阵与ωi(i+1)的行数与列数相同;3.2.2、再利用均匀随机分布函数,在矩阵mi(i+1)中随机生成[0,1]区间的数据;3.2.3、最后利用分类函数g(x)对矩阵mi(i+1)中的数据进行分类,将mi(i+1)有一个[0,1]区间的矩阵转换成一个由0和1组成的矩阵,g(x)分类函数如下:3.2.4、将生成的0,1矩阵mi(i+1)与BP中的连接权值ωi(i+1)进行点乘,生成一个新的数组矩阵,我们将其定义为Si(i+1),其生成公式为:Si(i+1)=mi(i+1)·ωi(i+1)3.2.5、这样我们就得到新的第i层到第i+1层的计算公式,其公式为:本文档来自技高网...

【技术保护点】
1.一种手写图像识别方法,其特征在于,具体包括如下步骤:1)从数据集之中,随机选取数据中6万张图片作为训练集,剩余1万组作为测试集,训练集中包含0至9这10个手写数字图片各6千张,测试集10个手写数字图片各1000张,数据集中的图片图像大小为28*28;2)、对选取的图像进行二值化处理,将待识别图像转换为二进制图像,再将图像大小进行缩放,统一缩放为大小10*10的图像,最后再将此10*10的图像进行重新排列,将其转换为1*100的维度数组;3)、将训练集经过步骤2)处理后的6万个1*100的维度数组打乱顺序后带入BP神经网络进行训练,利用BP神经网络对此数组进行分类;将训练好的神经网络输入测试集经过步骤2)处理后的1万个1*100的维度数组进行检测,检测训练好的神经网络的识别正确率,正确率达到要求,此训练后神经网络可直接用于识别分类,如正确率达不到要求,则增加测试集重新进行神经网络训练。

【技术特征摘要】
1.一种手写图像识别方法,其特征在于,具体包括如下步骤:1)从数据集之中,随机选取数据中6万张图片作为训练集,剩余1万组作为测试集,训练集中包含0至9这10个手写数字图片各6千张,测试集10个手写数字图片各1000张,数据集中的图片图像大小为28*28;2)、对选取的图像进行二值化处理,将待识别图像转换为二进制图像,再将图像大小进行缩放,统一缩放为大小10*10的图像,最后再将此10*10的图像进行重新排列,将其转换为1*100的维度数组;3)、将训练集经过步骤2)处理后的6万个1*100的维度数组打乱顺序后带入BP神经网络进行训练,利用BP神经网络对此数组进行分类;将训练好的神经网络输入测试集经过步骤2)处理后的1万个1*100的维度数组进行检测,检测训练好的神经网络的识别正确率,正确率达到要求,此训练后神经网络可直接用于识别分类,如正确率达不到要求,则增加测试集重新进行神经网络训练。2.根据权利要求1所述手写图像识别方法,其特征在于,所述步骤3)中BP神经网络中BP算法改进方法如下:3.1...

【专利技术属性】
技术研发人员:常敏陈果
申请(专利权)人:上海理工大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1