手写字符识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：23705750 阅读：31 留言：0更新日期：2020-04-08 11:20

一种手写字符识别方法，应用于计算机技术领域，包括：获取待识别的手写字符图片，生成与该待识别的手写字符图片字符相同的模板字符图片，将该模板字符图片输入给深度匹配神经网络，以使该深度匹配神经网络提取该模板字符图片的模板字符特征，将该待识别的手写字符图片输入给该深度匹配神经网络，以使深度匹配神经网络根据模板字符特征识别待识别的手写字符图片。本申请还公开了一种手写字符识别装置、电子设备及存储介质，可有效识别手写字符。

全部详细技术资料下载

【技术实现步骤摘要】
手写字符识别方法、装置、电子设备及存储介质
本申请涉及计算机
，尤其涉及一种手写字符识别方法、装置、电子设备及存储介质。
技术介绍
由于在拍照文档、支票、表单表格、证件、邮政信封、票据、手稿文书等光学字符识别图像识别系统以及手写文字输入设备中的广泛应用场景，自上世纪80年代以来，手写汉字识别一直是一个重要的研究领域。传统的单字识别系统主要包括：预处理，特征提取和分类，提取人工设计的特征，如结构特征和统计特征等，利用改进的二次判决函数等分类器来提高模型的精度，但仍然远远落后于人类的性能。近年来，深度卷积神经网络得益于计算能力的蓬勃发展、海量的训练数据和更好的训练技术，在许多计算机视觉任务中都取得了显著的进步。目前，基于深度卷积神经网络的方法成为解决手写汉字识别问题的新技术。大多数汉字识别方法都集中在一个平衡的数据集上，该数据集包含GB2312-80标准一级集中常用的3755个字符，每个字符都有数百个样本。在训练过程中，所有的测试字符都被显示出来，这被称为一个闭集识别问题。然而，一个更完整的集合将包含约7000个字符的现代中文文本。历史文献和学术文献的字符数超过54000个，对应一个开放集识别问题。为了获得满意的识别性能，每个字符的训练样本必须足够，特别是对于基于深度卷积神经网络的方法。因此，目前的方法只能满意地处理有限数量的文字，这严重制约了手写汉字识别的应用范围。
技术实现思路
本申请的主要目的在于提供一种手写字符识别方法、装置、电子设备及存储介质，旨在解决现有技术中。为实现...

【技术保护点】
1.一种手写字符识别方法，其特征在于，包括：/n获取待识别的手写字符图片；/n生成与所述待识别的手写字符图片字符相同的模板字符图片；/n将所述模板字符图片输入给深度匹配神经网络，以使所述深度匹配神经网络提取所述模板字符图片的模板字符特征；/n将所述待识别的手写字符图片输入给所述深度匹配神经网络，以使所述深度匹配神经网络根据所述模板字符特征识别所述待识别的手写字符图片。/n

【技术特征摘要】
1.一种手写字符识别方法，其特征在于，包括：
获取待识别的手写字符图片；
生成与所述待识别的手写字符图片字符相同的模板字符图片；
将所述模板字符图片输入给深度匹配神经网络，以使所述深度匹配神经网络提取所述模板字符图片的模板字符特征；
将所述待识别的手写字符图片输入给所述深度匹配神经网络，以使所述深度匹配神经网络根据所述模板字符特征识别所述待识别的手写字符图片。

2.根据权利要求1所述的手写字符识别方法，其特征在于，所述将所述模板字符图片输入给深度匹配神经网络之前，包括：
构建一个深度卷积神经网络；
将样本集输入至所述深度卷积神经网络，采用随机梯度下降法，通过反向传播交叉熵损失梯度来训练所述深度卷积神经网络，所述样本集包括所有模板字符图片的子集和批大小为N的手写字符图片；
当样本集中的模板字符图片和手写字符图片之间的误差收敛时，终止所述深度卷积神经网络的训练，得到所述深度匹配神经网络，并保存所述深度匹配神经网络中各个层的参数；
利用所有模板字符图片和批大小为N手写字符图片，更新所述深度匹配神经网络中Softmax分类层的参数。

3.根据权利要求2所述的手写字符识别方法，其特征在于，所述利用所有模板字符图片和批大小为N手写字符图片，更新所述深度匹配神经网络中Softmax分类层的参数包括：
将所有模板字符图片输入给所述深度匹配神经网络，提取所有模板字符图片的特征，并对所述特征进行L2正则化，得到模板特征；
将批大小为N的手写字符图片输入给所述深度匹配神经网络，提取手写字符图片的特征，得到手写特征；
根据所述模板特征和所述手写特征，更新所述深度匹配神经网络中Softmax分类层的参数；
其中，令所述模板特征为φ(tj)，所述手写特征为φ(xj)，所述深度匹配神经网络中Softmax分类层的参数为M，则：
M＝φ(tj)Tφ(xj)。

4.根据权利要求1至3任意一项所述的手写字符识别方法，其特征在于，所述深度卷积神经网络包括卷积层、最大池化层、全连接层和Softmax分类层；
所述卷积层的卷积核大小均为3×3，卷积的步长为1，卷积方式设为SAME，采用ReLU作为激活函数，并均不使用批标准化；
所述最大池化层池化核的大小为3×3，步长为2；
所述全连接层的通道数为128，在从手写字符图片中提取特征后在全连接层后添加dropout以避免过拟合。

5.根据权利要求1至3任意一项所述的手...

【专利技术属性】
技术研发人员：刘毅，李志远，郭晓洲，龚国良，鲁华祥，边昳，
申请(专利权)人：中国科学院半导体研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人