一种基于复杂度分组的手写汉字识别方法技术

技术编号:36214491 阅读:24 留言:0更新日期:2023-01-04 12:11
本发明专利技术公开了一种基于复杂度分组的手写汉字识别方法,包括:S1、进行复杂度划分并打上相应的标签,构建出手写汉字复杂度分组数据集;S2、训练手写汉字复杂度分类器;S3、从原始数据集中读取手写汉字图片,使用复杂度分类器确定汉字复杂度;S4、根据汉字复杂度,将其输入本方法设计的多分支并行网络中相适应的分支进行特征提取;S5、采用AM

【技术实现步骤摘要】
一种基于复杂度分组的手写汉字识别方法


[0001]本专利技术属于计算机视觉
,具体涉及一种基于复杂度分组的手写汉字识别方法。

技术介绍

[0002]手写汉字的识别一直是手写体识别中的难点,首先是由于汉字数量多,其次是因为不同汉字的复杂度差异很大。在目前现有的方法中,一般是将训练集中的所有汉字放入一个独立的网络模型中进行训练;这就导致了模型的复杂度难以调整,从而影响识别效果。与此同时,相似汉字识别也一直是手写汉字识别中的难点,也是总体识别率上不去的一个重要影响因素。现有的依赖上下文的识别方法虽然对相似汉字识别率较高,但在出现病句或少数汉字识别错误时会引起连锁反应,导致大片的汉字识别错误,鲁棒性较差。

技术实现思路

[0003]本专利技术的目的是提供基于复杂度分组的手写汉字识别方法用于解决现有技术中无法根据汉字复杂程度调整识别所需的计算量,因此无法在提高模型的识别精度的同时保证模型的识别速度的技术问题。
[0004]所述的一种基于复杂度分组的手写汉字识别方法,包括下列步骤:
[0005]S1、对原有的手写汉字数据集进行复杂度划分并打上相应的标签,构建出手写汉字复杂度分组数据集;
[0006]S2、通过步骤S1构建出的分组数据集训练手写汉字复杂度分类器;
[0007]S3、从原始数据集中读取手写汉字图片,使用步骤S2中训练出的分类器确定汉字复杂度;
[0008]S4、根据步骤S3中得出的汉字复杂度,将其输入本方法设计的多分支并行网络中相适应的分支进行特征提取;<br/>[0009]S5、采用AM

softmax函数进行汉字识别,并使用交叉熵损失函数对识别结果进行训练;
[0010]S6、获取实际手写体文本图片,先对其中汉字进行分割,再通过训练好的手写汉字识别网络进行识别。
[0011]优选的,所述步骤S1包含以下具体步骤:
[0012]S11、对数据集中的每个汉字进行笔画拆分,分别数出每个汉字的基本笔画数P1和派生笔画数P2;其中,笔画的方向在书写过程中自始至终没有变化的称为基本笔画,笔画方向在书写过程发生变化的称为派生笔画;
[0013]S12、设定基本笔画的权重W1、派生笔画的权重为W2;根据公式C=(P1
×
W1)+(P2
×
W2)计算每个汉字的复杂度C;
[0014]S13、设置汉字的复杂度阈值数组为[a,b];也即是复杂度C<a的汉字判定为简单汉字,复杂度C≥a且C≤b的汉字判定为中等汉字,复杂度C>b的汉字判定为复杂汉字,由此
对汉字进行复杂度分类。
[0015]优选的,所述步骤S2中设计的分类器网络结构包含三个卷积层和两个池化层,利用步骤S1构建的汉字复杂度数据集对设计的分类网络进行训练。
[0016]优选的,所述步骤S4获取步骤S3中分类器得出的汉字复杂度,按照简单、中等、复杂三种情况分别输入到并行多分支特征提取网络的第一、二、三条分支进行特征提取,得出对应的特征向量,所述分支即用于处理不同复杂度汉字的子网络,设于复杂度分类器的后面到识别器的前面。
[0017]优选的,第一条分支使用的是嵌入了CBAM的AlexNet网络,分别在AlexNet网络中的第一层卷积层和第四层卷积层之后嵌入了CBAM;第二条分支在第一条分支的基础上加入了一个InceptionA模块,特征数据经InceptionA模块处理后再由CBAM处理;第三条分支在第一条分支的基础上加入了一个InceptionB模块,特征数据经InceptionB模块处理后再由CBAM处理;InceptionA模块和InceptionB模块将原本大卷积核分解成了多个串联的小卷积核,同时将其中每条分支的最上层卷积核进行了非对称分解,通过这两种分解有效降低了模块的参数量。
[0018]优选的,所述InceptionA模块包括四个分支:第一分支包含1个卷积核大小为1
×
1的卷积层;第二分支依次包含1个卷积核大小为3
×
3的卷积层和1个卷积核大小为1
×
1的卷积层;第三分支依次包含1个卷积核大小为1
×
1的卷积层,之后再分别连接到一个卷积核大小为3
×
1的卷积层和另一卷积核大小为1
×
3的卷积层;第四分支依次包含1个卷积核大小为1
×
1的卷积层和1个卷积核大小为3
×
3的卷积层,之后再分别连接到一个卷积核大小为3
×
1的卷积层和另一卷积核大小为1
×
3的卷积层;上述分支的输出最终均连接到Filter Concat层。
[0019]优选的,所述InceptionB模块在InceptionA模块的基础上增加了一条更长的第五分支,第五分支依次包含1个卷积核大小为1
×
1的卷积层和2个卷积核大小为3
×
3的卷积层,之后再分别连接到一个卷积核大小为3
×
1的卷积层和另一卷积核大小为1
×
3的卷积层,第五分支的输出最终连接到Filter Concat层。
[0020]优选的,所述步骤S5中使用AM

softmax函数对步骤S4得到的特征向量进行分类,然后使用交叉熵损失函数对分类结果进行训练,其中AM

softmax函数如下式所示:
[0021][0022]n为样本数量,x为待分类的特征向量,W
T
为附加在x向量上的权重矩阵,为W
T
中的第j行,并且j∈[1,c],c为类别总数,j对应着第j类,为x和这两个向量之间的夹角余弦值,y
i
代表样本的真实类别,cosθ
j
为x和这两个向量之间的夹角余弦值。m是一个需要根据具体场景的需要进行调整的超参数;具体来说,如果分类界限明显,则增大m值,不明显,则减小m值。s是一个常量,用于放大类间距离,使差异更加明显,提高网络收敛速度,e为自然常数。
[0023]本专利技术具有以下优点:针对汉字种类多且不同复杂度的汉字差异大的特点,设计了不同复杂度汉字识别的卷积神经网络,计算量针对汉字复杂度不同而不同。相比复杂汉字减少了对复杂度简单和中等汉字的计算量,而相比复杂度简单的汉字又能通过较多的计
算量保证复杂度中等或复杂的汉字能被较好地识别;并采用改进的Inception结构对复杂汉字进行多级特征提取,使得较为复杂的汉字的特征提取更加完整,并控制计算量。采用注意力模块对特征提取子网络进行改进;同时采用AM

softmax函数代替标准的softmax函数,有效提高了模型对相似汉字的识别精度和模型的收敛速度,整体模型在速度和精度之间达到了平衡,能对手写汉字中的相似汉字准确识别。
附图说明
[0024]图1为本专利技术一种基于复杂度分组的手写汉字识别方法的流程示意图。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于复杂度分组的手写汉字识别方法,其特征在于:包括下列步骤:S1、对原有的手写汉字数据集进行复杂度划分并打上相应的标签,构建出手写汉字复杂度分组数据集;S2、通过步骤S1构建出的分组数据集训练手写汉字复杂度分类器;S3、从原始数据集中读取手写汉字图片,使用步骤S2中训练出的分类器确定汉字复杂度;S4、根据步骤S3中得出的汉字复杂度,将其输入本方法设计的多分支并行网络中相适应的分支进行特征提取;S5、采用AM

softmax函数进行汉字识别,并使用交叉熵损失函数对识别结果进行训练;S6、获取实际手写体文本图片,先对其中汉字进行分割,再通过训练好的手写汉字识别网络进行识别。2.根据权利要求1所述的一种基于复杂度分组的手写汉字识别方法,其特征在于:所述步骤S1包含以下具体步骤:S11、对数据集中的每个汉字进行笔画拆分,分别数出每个汉字的基本笔画数P1和派生笔画数P2;其中,笔画的方向在书写过程中自始至终没有变化的称为基本笔画,笔画方向在书写过程发生变化的称为派生笔画;S12、设定基本笔画的权重W1、派生笔画的权重为W2;根据公式C=(P1
×
W1)+(P2
×
W2)计算每个汉字的复杂度C;S13、设置汉字的复杂度阈值数组为[a,b];也即是复杂度C<a的汉字判定为简单汉字,复杂度C≥a且C≤b的汉字判定为中等汉字,复杂度C>b的汉字判定为复杂汉字,由此对汉字进行复杂度分类。3.根据权利要求2所述的一种基于复杂度分组的手写汉字识别方法,其特征在于:所述步骤S2中设计的分类器网络结构包含三个卷积层和两个池化层,利用步骤S1构建的汉字复杂度数据集对设计的分类网络进行训练。4.根据权利要求1所述的一种基于复杂度分组的手写汉字识别方法,其特征在于:所述步骤S4获取步骤S3中分类器得出的汉字复杂度,按照简单、中等、复杂三种情况分别输入到并行多分支特征提取网络的第一、二、三条分支进行特征提取,得出对应的特征向量,所述分支即用于处理不同复杂度汉字的子网络,设于复杂度分类器的后面到识别器的前面。5.根据权利要求4所述的一种基于复杂度分组的手写汉字识别方法,其特征在于:第一条分支使用的是嵌入了CBAM的AlexNet网络,分别在AlexNet网络中的第一层卷积层和第四层卷积层之后嵌入了CBAM;第二条分支在第一条分支的基础上加入了一个InceptionA模块,特征数据经InceptionA模块处理后再由CBAM处理;第三条分支在第一条分支的基础上加入了一个InceptionB模块,特征数据经InceptionB模块处理后再由CBAM处理;InceptionA模块和InceptionB模块将原本大卷积核分解成了多...

【专利技术属性】
技术研发人员:单强达冯子亮刘恒宇吕丹亚张宇张海强赵正文
申请(专利权)人:芜湖职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1