基于深度学习的手写中文字体识别方法技术

技术编号:37606594 阅读:15 留言:0更新日期:2023-05-18 11:58
本申请公开了基于深度学习的手写中文字体识别方法,包括:建立笔画识别模型;采用训练集对笔画识别模型进行训练;利用训练完成的笔画识别模型对待识别的手写中文进行笔画识别,获得相应的笔画以及笔画顺序;将识别得到的笔画与对比库中的打印文字的笔画进行对比,确定匹配的候选打印文字;将识别得到的笔画顺序和候选打印文字的笔画顺序进行对比,确定最终的识别结果。本申请通过笔画和笔画顺序对手写中文进行识别,在文字复杂度不高时识别速度快,而且基于笔画和笔画顺序的识别方法能够适应不同的人的手写习惯,提高识别的准确率。提高识别的准确率。提高识别的准确率。

【技术实现步骤摘要】
基于深度学习的手写中文字体识别方法


[0001]本申请涉及图像识别
,特别涉及基于深度学习的手写中文字体识别方法。

技术介绍

[0002]手写汉字是大多数国内人员每天都会接触到的,很多相关行业的从业人员需要通过手写汉字的方式进行文件签署、信息记录等,而在手写完成后通常还需要通过扫描的方式将纸质的文件转换为电子文件,以方便保存和查阅。
[0003]一般地,电子文件需要对其内容进行识别,以方便复制,例如采用手写的方式记录会议内容后需要尽快将其转换为电子文件,且对电子文件中的手写汉字进行识别以转换为正确的打印文字,以方便更多的人阅读和理解,因此需要采用到手写汉字的识别技术。目前,很多手写汉字的识别技术都采用神经网络,通过具有大量手写文字的训练集对神经网络进行训练后,采用训练完成的神经网络对待识别的手写汉字进行识别,确定手写汉字对应的打印文字,例如CN114581922A和CN111652332A。然而,这些现有的识别技术都是对手写汉字进行整体的识别,并根据识别的相似概率进行结果的推送,由于手写汉字在不同人书写时差异极大,因此不同人的不同手写汉字可能存在较高的相似度,因此很容易被误识别,导致识别的准确率不够高。

技术实现思路

[0004]本申请实施例提供了基于深度学习的手写中文字体识别方法,用以解决现有技术中对手写汉字进行整体识别的方式存在识别准确率不够高的问题。
[0005]一方面,本申请实施例提供了基于深度学习的手写中文字体识别方法,包括:
[0006]建立笔画识别模型;r/>[0007]采用训练集对笔画识别模型进行训练;
[0008]利用训练完成的笔画识别模型对待识别的手写中文进行笔画识别,获得相应的笔画以及笔画顺序;
[0009]将识别得到的笔画与对比库中的打印文字的笔画进行对比,确定匹配的候选打印文字;
[0010]将识别得到的笔画顺序和候选打印文字的笔画顺序进行对比,确定最终的识别结果。
[0011]在一种可能的实现方式中,笔画识别模型采用卷积神经网络,采用训练集对笔画识别模型进行训练包括:获取手写中文训练图像;对手写中文训练图像对应的打印文字进行标注;将带有标注的手写中文训练图像输入卷积神经网络,输出相应的训练识别结果;根据标注和训练识别结果的误差对卷积神经网络的参数进行调整,并再次将带有标注的手写中文训练图像输入调整后的卷积神经网络,直到达到设定的训练次数,获得训练完成的笔画识别模型。
[0012]在一种可能的实现方式中,手写中文训练图像包括背景图像和叠加在背景图像上的前景手写文字,获取手写中文训练图像包括:获取多组手写中文图像和多个背景图像;提取手写中文图像中的手写中文,获得前景手写文字;将前景手写文字和背景图像进行组合,并将组合中的前景手写文字叠加在背景图像中,获得手写中文训练图像。
[0013]在一种可能的实现方式中,利用训练完成的笔画识别模型对待识别的手写中文进行笔画识别,获得相应的笔画以及笔画顺序,包括:将手写中文中独立的区域进行拆分,获得多个笔画区域;对每个笔画区域按照笔画趋势进行拆分,获得多个笔画;记录各个笔画的位置关系;按照设定的方向以及各个笔画的位置关系对笔画进行排序,获得笔画顺序。
[0014]在一种可能的实现方式中,将手写中文中独立的区域进行拆分,获得多个笔画区域,包括:对手写中文的空间结构进行分析,确定是否可以划分为两个或以上的主笔画区域,如果可以,将手写中文划分为两个或以上的主笔画区域,并记录各个主笔画区域的位置关系;对每个主笔画区域的空间结构进行分析,确定是否可以划分为两个或以上的子笔画区域,如果可以,将主笔画区域划分为两个或以上的子笔画区域,并记录各个子笔画区域的位置关系。
[0015]在一种可能的实现方式中,在对每个笔画区域进行拆分获得多个笔画后,还按照笔画要求对多个存在连接关系的笔画进行组合,确定组合后的笔画是否为基本笔画,如果是则保留组合后的笔画。
[0016]在一种可能的实现方式中,识别得到的笔画包括每个笔画的编号和每个笔画的数量,对比库中的打印文字也包括每个笔画的编号和每个笔画的数量,将识别得到的笔画与对比库中的打印文字的笔画进行对比,确定匹配的候选打印文字,包括:将笔画的总数量与对比库中打印文字的总笔画数量进行对比,保留对比库中总笔画数量与笔画的总数量相同的打印文字;将保留的打印文字的笔画编号与笔画的编号进行对比,保留笔画编号与笔画的编号匹配的打印文字,作为候选打印文字。
[0017]在一种可能的实现方式中,将识别得到的笔画顺序和候选打印文字的笔画顺序进行对比,确定最终的识别结果,包括:将笔画的编号按照笔画顺序排序,获得笔画编号顺序;将候选打印文字的笔画编号按照顺序排序,获得打印文字编号顺序;将笔画编号顺序与打印文字编号顺序进行对比,保留打印文字编号顺序与笔画编号顺序匹配的候选打印文字,作为识别结果。
[0018]本申请中的基于深度学习的手写中文字体识别方法,具有以下优点:
[0019]通过笔画和笔画顺序对手写中文进行识别,在文字复杂度不高时识别速度快,而且基于笔画和笔画顺序的识别方法能够适应不同的人的手写习惯,提高识别的准确率。
附图说明
[0020]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1为本申请实施例提供的基于深度学习的手写中文字体识别方法的流程图。
具体实施方式
[0022]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0023]图1为本申请实施例提供的基于深度学习的手写中文字体识别方法的流程图。本申请实施例提供了基于深度学习的手写中文字体识别方法,包括:
[0024]S100,建立笔画识别模型。
[0025]示例性地,笔画识别模型采用卷积神经网络,卷积神经网络简称CNN(Convolutional Neural Network),其广泛应用在计算机视觉处理中。该神经网络包括输入层、卷积层、池化层、全连接层和输出层,其在使用该神经网络之前,需要对其各个参数进行初始化。本申请采用卷积神经网络可以对各种手写中文的特征进行深度学习,进而有效提高识别结果的准确率。
[0026]S110,采用训练集对笔画识别模型进行训练。
[0027]示例性地,S110具体包括:获取手写中文训练图像;对手写中文训练图像对应的打印文字进行标注;将带有标注的手写中文训练图像输入卷积神经网络,输出相应的训练识别结果;根据标注和训练识别结果的误差对卷积神经网络本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于深度学习的手写中文字体识别方法,其特征在于,包括:建立笔画识别模型;采用训练集对所述笔画识别模型进行训练;利用训练完成的笔画识别模型对待识别的手写中文进行笔画识别,获得相应的笔画以及笔画顺序;将识别得到的笔画与对比库中的打印文字的笔画进行对比,确定匹配的候选打印文字;将识别得到的笔画顺序和所述候选打印文字的笔画顺序进行对比,确定最终的识别结果。2.根据权利要求1所述的基于深度学习的手写中文字体识别方法,其特征在于,所述笔画识别模型采用卷积神经网络,所述采用训练集对所述笔画识别模型进行训练包括:获取手写中文训练图像;对所述手写中文训练图像对应的打印文字进行标注;将带有标注的所述手写中文训练图像输入所述卷积神经网络,输出相应的训练识别结果;根据所述标注和训练识别结果的误差对所述卷积神经网络的参数进行调整,并再次将带有标注的所述手写中文训练图像输入调整后的所述卷积神经网络,直到达到设定的训练次数,获得训练完成的笔画识别模型。3.根据权利要求2所述的基于深度学习的手写中文字体识别方法,其特征在于,所述手写中文训练图像包括背景图像和叠加在所述背景图像上的前景手写文字,所述获取手写中文训练图像包括:获取多组手写中文图像和多个背景图像;提取所述手写中文图像中的手写中文,获得所述前景手写文字;将所述前景手写文字和背景图像进行组合,并将组合中的所述前景手写文字叠加在所述背景图像中,获得所述手写中文训练图像。4.根据权利要求1所述的基于深度学习的手写中文字体识别方法,其特征在于,所述利用训练完成的笔画识别模型对待识别的手写中文进行笔画识别,获得相应的笔画以及笔画顺序,包括:将所述手写中文中独立的区域进行拆分,获得多个笔画区域;对每个所述笔画区域按照笔画趋势进行拆分,获得多个笔画;记录各个笔画的位置关系;按照设定的方向以及各个笔画的位置关系对所述笔画进行排序,获得所述笔画顺序。5.根据权利要求4所述的基于深...

【专利技术属性】
技术研发人员:孙世芳
申请(专利权)人:宁波极科信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1