本发明专利技术提供一种手写汉字识别方法及系统,其中,方法包括:将待识别图像输入汉字识别融合模型中;基于多个不同的神经网络,确定不同的神经网络对应输出的多个待识别手写汉字的识别结果;基于所述多个待识别手写汉字的识别结果,确定待识别手写汉字的目标识别结果;其中,所述待识别图像包括所述待识别手写汉字的图像信息;所述汉字识别融合模型包括多个不同的神经网络。相比于使用单一的神经网络模型的方法,本发明专利技术结合不同神经网络提取和识别特征的优势,能够有效地提高汉字识别的精度。并且无需通过增加网络层数的方法提高网络提取特征的能力,提高手写汉字识别效率。提高手写汉字识别效率。提高手写汉字识别效率。
【技术实现步骤摘要】
手写汉字识别方法及系统
[0001]本专利技术涉及计算机
,尤其涉及一种手写汉字识别方法及系统。
技术介绍
[0002]手写体汉字的识别是光学字符识别领域中的热点问题,研究持续了已有半个世纪的历史。由于汉字类别数较大,汉字之间相似度较大,不同汉字字体结构繁多,存在大量相似汉字,并且书写习惯不同导致手写汉字结构形体更是因人而异,千差万别,汉字手写体识别困难。目前汉字手写体识别的准确率仍小于人类的识别准确率。
[0003]目前手写体的汉字识别可以分为脱机识别与联机识别两种。联机识别指的是通过触控笔、手写板等工具书写,计算机根据书写的笔画走向等信息进行识别,相对较易,准确度高。脱机识别针对静止的二维图像中的汉字进行识别,根据图片特征提取文字,识别更为复杂困难,准确度难以提高。手写汉字的脱机识别一直是当前业界研究的热点及难点。
[0004]现有技术中脱机识别手写汉字的方案中,基于传统机器学习算法进行识别,存在汉字特征提取不准确,识别效果差的问题。基于深度学习进行识别的方法,存在由于较深的网络层数导致模型泛化能力差,调优参数多、网络收敛缓慢和存储模型空间较大的问题。两种方法均存在识别速度快时,识别精度降低。识别精度高时,所需的识别时间长,无法使识别效率和识别准确性达到均衡最优解。
[0005]因此,如何提供一种手写汉字识别方法及系统,在保证手写汉字高准确率识别的基础上,提高手写汉字识别效率,成为亟待解决的问题。
技术实现思路
[0006]本专利技术提供的手写汉字识别方法及系统,用于解决现有技术中存在的上述问题,在保证手写汉字高准确率识别的基础上,提高手写汉字识别效率。
[0007]本专利技术提供的一种手写汉字识别方法,包括:
[0008]将待识别图像输入汉字识别融合模型中;
[0009]基于多个不同的神经网络,确定不同的神经网络对应输出的多个待识别手写汉字的识别结果;
[0010]基于所述多个待识别手写汉字的识别结果,确定待识别手写汉字的目标识别结果;
[0011]其中,所述待识别图像包括所述待识别手写汉字的图像信息;所述汉字识别融合模型包括多个不同的神经网络。
[0012]根据本专利技术提供的一种手写汉字识别方法,所述多个不同的神经网络包括:第一神经网络和第二神经网络;
[0013]所述汉字识别融合模型包括:第一神经网络层、第二神经网络层和识别结果融合层;
[0014]所述基于多个不同的神经网络,确定不同的神经网络对应输出的多个待识别手写
汉字的识别结果,具体包括:
[0015]将所述待识别图像输入所述第一神经网络层中,根据所述第一神经网络,确定第一识别结果;
[0016]将所述待识别图像输入所述第二神经网络层中,根据所述第二神经网络,确定第二识别结果;
[0017]所述基于所述多个待识别手写汉字的识别结果,确定待识别手写汉字的目标识别结果,具体包括:
[0018]将所述第一识别结果和所述第二识别结果输入所述识别结果融合层中,根据第一神经网络识别能力向量和第二神经网络识别能力向量,确定目标识别结果;
[0019]其中,所述第一神经网络识别能力向量用于表示训练好的所述第一神经网络识别不同汉字的能力;所述第二神经网络识别能力用于表示训练好的所述第二神经网络识别不同汉字的能力。
[0020]根据本专利技术提供的一种手写汉字识别方法,所述将所述第一识别结果和所述第二识别结果输入所述识别结果融合层中,根据第一神经网络识别能力向量和第二神经网络识别能力向量,确定目标识别结果,具体包括:
[0021]将所述第一识别结果输入所述识别结果融合层中,确定第一汉字识别分类得分向量;其中,所述第一汉字识别分类得分向量包括所述第一神经网络层确定的待识别汉字的得分;
[0022]将所述第二识别结果,输入所述识别结果融合层中,确定第二汉字识别分类得分向量;其中,所述第二汉字识别分类得分向量包括所述第二神经网络层确定的待识别汉字的得分;
[0023]将所述第一汉字识别得分向量与所述第一神经网络识别能力点乘,确定第一目标识别得分向量;
[0024]将所述第二汉字识别得分向量与所述第二神经网络识别能力点乘,确定第二目标识别得分向量;
[0025]基于所述第一目标识别得分向量和所述第二目标识别得分向量,根据可信度累积,确定目标识别结果。
[0026]根据本专利技术提供的一种手写汉字识别方法,在所述将待识别图像输入汉字识别融合模型中的步骤之前,还包括:确定所述第一神经网络识别能力向量和第二神经网络识别能力向量;
[0027]所述确定所述第一神经网络识别能力向量和第二神经网络识别能力向量,具体包括:
[0028]基于所述第一神经网络,根据识别能力向量计算公式,确定第一神经网络识别能力向量;
[0029]基于所述第二神经网络,根据识别能力向量计算公式,确定第二神经网络识别能力向量;
[0030]其中,所述识别能力向量计算公式为:
[0031]式中,c
i
表示第i种汉字被识别正确的次数,n
i
代表第i种汉字在样本汉字图像集出
现的总次数,N为汉字种类总数。
[0032]根据本专利技术提供的一种手写汉字识别方法,所述第一神经网络为YOLO卷积神经网络;所述第二神经网络为深度置信网络。
[0033]根据本专利技术提供的一种手写汉字识别方法,在所述将待识别图像输入汉字识别融合模型中,还包括:训练所述YOLO卷积神经网络;
[0034]所述训练所述YOLO卷积神经网络,具体包括:
[0035]利用所述带标签的样本汉字图像集,训练所述YOLO卷积神经网络;
[0036]基于目标损失函数,对所述YOLO卷积神经网络的网络参数进行更新,并基于更新后的网络参数对所述YOLO卷积神经网络进行迭代训练直至所述YOLO卷积神经网络收敛;
[0037]其中,所述目标损失函数是基于交叉熵函数和最大熵正则化方法确定的。
[0038]根据本专利技术提供的一种手写汉字识别方法,在所述训练所述YOLO卷积神经网络的步骤之前,还包括:确定所述YOLO卷积神经网络的网络结构;
[0039]所述确定所述YOLO卷积神经网络的网络结构,具体包括:
[0040]在YOLO
‑
9000网络结构的基础上减少瓶颈结构的卷积,删除两层1
×
1卷积,在每个最大池层后应用dropout层,确定所述YOLO卷积神经网络的网络结构。
[0041]本专利技术还提供一种手写汉字识别系统,包括:待识别图像输入单元、手写汉字识别单元和识别结果融合单元;
[0042]所述待识别图像输入单元,用于将待识别图像输入汉字识别融合模型中;
[0043]所述手写汉字识别单元,用于基于多个不同的神经网络,确定不同的神经网络对应输出的多个待识别手写汉字的识别结果;
[0044]所述识别结果融合本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种手写汉字识别方法,其特征在于,包括:将待识别图像输入汉字识别融合模型中;基于多个不同的神经网络,确定不同的神经网络对应输出的多个待识别手写汉字的识别结果;基于所述多个待识别手写汉字的识别结果,确定待识别手写汉字的目标识别结果;其中,所述待识别图像包括所述待识别手写汉字的图像信息;所述汉字识别融合模型包括多个不同的神经网络。2.根据权利要求1所述的手写汉字识别方法,其特征在于,所述多个不同的神经网络包括:第一神经网络和第二神经网络;所述汉字识别融合模型包括:第一神经网络层、第二神经网络层和识别结果融合层;所述基于多个不同的神经网络,确定不同的神经网络对应输出的多个待识别手写汉字的识别结果,具体包括:将所述待识别图像输入所述第一神经网络层中,根据所述第一神经网络,确定第一识别结果;将所述待识别图像输入所述第二神经网络层中,根据所述第二神经网络,确定第二识别结果;所述基于所述多个待识别手写汉字的识别结果,确定待识别手写汉字的目标识别结果,具体包括:将所述第一识别结果和所述第二识别结果输入所述识别结果融合层中,根据第一神经网络识别能力向量和第二神经网络识别能力向量,确定目标识别结果;其中,所述第一神经网络识别能力向量用于表示训练好的所述第一神经网络识别不同汉字的能力;所述第二神经网络识别能力用于表示训练好的所述第二神经网络识别不同汉字的能力。3.根据权利要求2所述的手写汉字识别方法,其特征在于,所述将所述第一识别结果和所述第二识别结果输入所述识别结果融合层中,根据第一神经网络识别能力向量和第二神经网络识别能力向量,确定目标识别结果,具体包括:将所述第一识别结果输入所述识别结果融合层中,确定第一汉字识别分类得分向量;其中,所述第一汉字识别分类得分向量包括所述第一神经网络层确定的待识别汉字的得分;将所述第二识别结果,输入所述识别结果融合层中,确定第二汉字识别分类得分向量;其中,所述第二汉字识别分类得分向量包括所述第二神经网络层确定的待识别汉字的得分;将所述第一汉字识别得分向量与所述第一神经网络识别能力点乘,确定第一目标识别得分向量;将所述第二汉字识别得分向量与所述第二神经网络识别能力点乘,确定第二目标识别得分向量;基于所述第一目标识别得分向量和所述第二目标识别得分向量,根据可信度累积,确定目标识别结果。4.根据权利要求2所述的手写汉字识别方法,其特征在于,在所述将待识别图像输入汉
字识别融合模型中的步骤之前,还包括:确定所述第一神经网络识别能力向量和第二神经网络识别能力向量;所述确定所述第一神经网络识别能力向量和第二神经网络识别能力向量,具体包括:基于所述第一神经网络,...
【专利技术属性】
技术研发人员:张湛梅,张晓川,谭丽丽,陈智扬,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。