手写字符识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:23705750 阅读:31 留言:0更新日期:2020-04-08 11:20
一种手写字符识别方法,应用于计算机技术领域,包括:获取待识别的手写字符图片,生成与该待识别的手写字符图片字符相同的模板字符图片,将该模板字符图片输入给深度匹配神经网络,以使该深度匹配神经网络提取该模板字符图片的模板字符特征,将该待识别的手写字符图片输入给该深度匹配神经网络,以使深度匹配神经网络根据模板字符特征识别待识别的手写字符图片。本申请还公开了一种手写字符识别装置、电子设备及存储介质,可有效识别手写字符。

【技术实现步骤摘要】
手写字符识别方法、装置、电子设备及存储介质
本申请涉及计算机
,尤其涉及一种手写字符识别方法、装置、电子设备及存储介质。
技术介绍
由于在拍照文档、支票、表单表格、证件、邮政信封、票据、手稿文书等光学字符识别图像识别系统以及手写文字输入设备中的广泛应用场景,自上世纪80年代以来,手写汉字识别一直是一个重要的研究领域。传统的单字识别系统主要包括:预处理,特征提取和分类,提取人工设计的特征,如结构特征和统计特征等,利用改进的二次判决函数等分类器来提高模型的精度,但仍然远远落后于人类的性能。近年来,深度卷积神经网络得益于计算能力的蓬勃发展、海量的训练数据和更好的训练技术,在许多计算机视觉任务中都取得了显著的进步。目前,基于深度卷积神经网络的方法成为解决手写汉字识别问题的新技术。大多数汉字识别方法都集中在一个平衡的数据集上,该数据集包含GB2312-80标准一级集中常用的3755个字符,每个字符都有数百个样本。在训练过程中,所有的测试字符都被显示出来,这被称为一个闭集识别问题。然而,一个更完整的集合将包含约7000个字符的现代中文文本。历史文献和学术文献的字符数超过54000个,对应一个开放集识别问题。为了获得满意的识别性能,每个字符的训练样本必须足够,特别是对于基于深度卷积神经网络的方法。因此,目前的方法只能满意地处理有限数量的文字,这严重制约了手写汉字识别的应用范围。
技术实现思路
本申请的主要目的在于提供一种手写字符识别方法、装置、电子设备及存储介质,旨在解决现有技术中。为实现上述目的,本申请实施例第一方面提供一种字符识别方法,包括:获取待识别的手写字符图片;生成与所述待识别的手写字符图片字符相同的模板字符图片;将所述模板字符图片输入给深度匹配神经网络,以使所述深度匹配神经网络提取所述模板字符图片的模板字符特征;将所述待识别的手写字符图片输入给所述深度匹配神经网络,以使所述深度匹配神经网络根据所述模板字符特征识别所述待识别的手写字符图片。进一步地,所述将所述模板字符图片输入给深度匹配神经网络之前,包括:构建一个深度卷积神经网络;将样本集输入至所述深度卷积神经网络,采用随机梯度下降法,通过反向传播交叉熵损失梯度来训练所述深度卷积神经网络,所述样本集包括所有模板字符图片的子集和批大小为N的手写字符图片;当样本集中的模板字符图片和手写字符图片之间的误差收敛时,终止所述深度卷积神经网络的训练,得到所述深度匹配神经网络,并保存所述深度匹配神经网络中各个层的参数;利用所有模板字符图片和批大小为N手写字符图片,更新所述深度匹配神经网络中Softmax分类层的参数。进一步地,所述利用所有模板字符图片和批大小为N手写字符图片,更新所述深度匹配神经网络中Softmax分类层的参数包括:将所有模板字符图片输入给所述深度匹配神经网络,提取所有模板字符图片的特征,并对所述特征进行L2正则化,得到模板特征;将批大小为N的手写字符图片输入给所述深度匹配神经网络,提取手写字符图片的特征,得到手写特征;根据所述模板特征和所述手写特征,更新所述深度匹配神经网络中Softmax分类层的参数;其中,令所述模板特征为φ(tj),所述手写特征为φ(xj),所述深度匹配神经网络中Softmax分类层的参数为M,则:M=φ(tj)Tφ(xj)。进一步地,所述深度卷积神经网络包括卷积层、最大池化层、全连接层和Softmax分类层;所述卷积层的卷积核大小均为3×3,卷积的步长为1,卷积方式设为SAME,采用ReLU作为激活函数,并均不使用批标准化;所述最大池化层池化核的大小为3×3,步长为2;所述全连接层的通道数为128,在从手写字符图片中提取特征后在全连接层后添加dropout以避免过拟合。进一步地,所述深度卷积神经网络的权重共享。本申请实施例第二方面提供一种手写字符识别装置,包括:获取模块,用于获取待识别的手写字符图片;生成模块,用于生成与所述待识别的手写字符图片字符相同的模板字符图片;输入模块,用于将所述模板字符图片输入给深度匹配神经网络,以使所述深度匹配神经网络提取所述模板字符图片的模板字符特征;识别模块,用于将所述待识别的手写字符图片输入给所述深度匹配神经网络,以使所述深度匹配神经网络根据所述模板字符特征识别所述待识别的手写字符图片。进一步地,所述装置还包括:构建模块,用于构建一个深度卷积神经网络;训练模块,用于将样本集输入至所述深度卷积神经网络,采用随机梯度下降法,通过反向传播交叉熵损失梯度来训练所述深度卷积神经网络,所述样本集包括所有模板字符图片的子集和批大小为N的手写字符图片;保存模块,用于当在模板字符图片和手写字符图片之间的误差收敛时,终止所述深度卷积神经网络的训练,得到所述深度匹配神经网络,并保存所述深度匹配神经网络中各个层的参数;更新模块,用于利用所有模板字符图片和批大小为N手写字符图片,更新所述深度匹配神经网络中Softmax分类层的参数。进一步地,所述更新模块包括:第一提取子模块,用于将所有模板字符图片输入给所述深度匹配神经网络,提取所有模板字符图片的特征,并对所述特征进行L2正则化,得到模板特征;第二提取子模块,用于将批大小为N的手写字符图片输入给所述深度匹配神经网络,提取手写字符图片样本的特征,得到手写特征;更新子模块,用于根据所述模板特征和所述手写特征,更新所述深度匹配神经网络中Softmax分类层的参数;其中,令所述模板特征为φ(tj),所述手写特征为φ(xj),所述深度匹配神经网络中Softmax分类层的参数为M,则:M=φ(tj)Tφ(xj)。本申请实施例第三方面提供了一种电子设备,包括:存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现本申请实施例第一方面提供的手写字符识别方法。本申请实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例第一方面提供的手写字符识别方法。从上述本申请实施例可知,本申请提供的手写字符识别方法、装置、电子设备及存储介质,可实现以下有益效果:1、对未经过学习字符具有较好的泛化能力,对不同的训练字符子集具有较强的鲁棒性,在随机选取500个汉字样本生成相应的字符集和数据集进行训练时,对未经学习的新汉字的识别准确率达到了约71.5%,1000个时达到约83.5%,2000个时达到约91.6%。2、在使用不同风格的汉字模板时都具有相似且优异的性能,对各种模板样式具有很高的鲁棒性。3、匹配网络在精度损失仅为0.17%的情况下达到了与基于CNN的分类器类似的性能。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现本文档来自技高网...

【技术保护点】
1.一种手写字符识别方法,其特征在于,包括:/n获取待识别的手写字符图片;/n生成与所述待识别的手写字符图片字符相同的模板字符图片;/n将所述模板字符图片输入给深度匹配神经网络,以使所述深度匹配神经网络提取所述模板字符图片的模板字符特征;/n将所述待识别的手写字符图片输入给所述深度匹配神经网络,以使所述深度匹配神经网络根据所述模板字符特征识别所述待识别的手写字符图片。/n

【技术特征摘要】
1.一种手写字符识别方法,其特征在于,包括:
获取待识别的手写字符图片;
生成与所述待识别的手写字符图片字符相同的模板字符图片;
将所述模板字符图片输入给深度匹配神经网络,以使所述深度匹配神经网络提取所述模板字符图片的模板字符特征;
将所述待识别的手写字符图片输入给所述深度匹配神经网络,以使所述深度匹配神经网络根据所述模板字符特征识别所述待识别的手写字符图片。


2.根据权利要求1所述的手写字符识别方法,其特征在于,所述将所述模板字符图片输入给深度匹配神经网络之前,包括:
构建一个深度卷积神经网络;
将样本集输入至所述深度卷积神经网络,采用随机梯度下降法,通过反向传播交叉熵损失梯度来训练所述深度卷积神经网络,所述样本集包括所有模板字符图片的子集和批大小为N的手写字符图片;
当样本集中的模板字符图片和手写字符图片之间的误差收敛时,终止所述深度卷积神经网络的训练,得到所述深度匹配神经网络,并保存所述深度匹配神经网络中各个层的参数;
利用所有模板字符图片和批大小为N手写字符图片,更新所述深度匹配神经网络中Softmax分类层的参数。


3.根据权利要求2所述的手写字符识别方法,其特征在于,所述利用所有模板字符图片和批大小为N手写字符图片,更新所述深度匹配神经网络中Softmax分类层的参数包括:
将所有模板字符图片输入给所述深度匹配神经网络,提取所有模板字符图片的特征,并对所述特征进行L2正则化,得到模板特征;
将批大小为N的手写字符图片输入给所述深度匹配神经网络,提取手写字符图片的特征,得到手写特征;
根据所述模板特征和所述手写特征,更新所述深度匹配神经网络中Softmax分类层的参数;
其中,令所述模板特征为φ(tj),所述手写特征为φ(xj),所述深度匹配神经网络中Softmax分类层的参数为M,则:
M=φ(tj)Tφ(xj)。


4.根据权利要求1至3任意一项所述的手写字符识别方法,其特征在于,所述深度卷积神经网络包括卷积层、最大池化层、全连接层和Softmax分类层;
所述卷积层的卷积核大小均为3×3,卷积的步长为1,卷积方式设为SAME,采用ReLU作为激活函数,并均不使用批标准化;
所述最大池化层池化核的大小为3×3,步长为2;
所述全连接层的通道数为128,在从手写字符图片中提取特征后在全连接层后添加dropout以避免过拟合。


5.根据权利要求1至3任意一项所述的手...

【专利技术属性】
技术研发人员:刘毅李志远郭晓洲龚国良鲁华祥边昳
申请(专利权)人:中国科学院半导体研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1