一种基于人工智能的手写字体去除方法技术

技术编号:32115513 阅读:42 留言:0更新日期:2022-01-29 19:00
一种基于人工智能的手写字体去除方法,属于人工智能领域,对于含有手写字体的印刷字体文档图片,可以去除手写字体,保留印刷字体。本发明专利技术方法包括:提出了一种制作含有手写字体、印刷字体、背景的训练样本方法;建立以全卷积神经网络为主的人工智能模型,用人工智能模型对训练样本进行训练;获取需要去除手写字体的图片,图片经过转正、去阴影得到预处理好的图片,把预处理好的图片输入训练好的人工智能模型进行检测,得到像素级分类结果图,根据分类结果,把手写字体类别替换为背景,可得到去除了手写字体的图片。由于是像素级分类,该方法对于手写字体与印刷体有重叠的地方也可以处理。理。理。

【技术实现步骤摘要】
一种基于人工智能的手写字体去除方法


[0001]本专利技术涉及一种基于人工智能的手写字体去除方法,属于人工智能视觉领域。

技术介绍

[0002]手写字体去除在办公、学习等很多方面都应用需求,比如:(1)手写字体提取;(2)手写字体分离;(3)手写字体识别;(4)去除手写字体起到美化的作用;(5)学生学习的时候,需要收集错题以便再次练习,需要去除之前的手写。人工智能是近年来非常热门的技术,在图像分割、语义分割、图像识别、语音识别、语音合成、视频分析等很多领域得到成功的应用。语义分割是对图像中的每个像素进行分类。语义分割在遥感影像、无人驾驶、医学影像分析、机器视觉等领域都有广泛应用。

技术实现思路

[0003]本专利技术为实现手写字体去除目的采用如下技术方案。
[0004]一种基于人工智能的手写字体去除方法,步骤如下。
[0005]步骤1:训练样本准备。
[0006]由于目前缺乏公开的手写字体、印刷体分类的数据集,本专利技术提出以下制作样本方法。包括如下步骤。
[0007](1)准备只有印刷体的纸张,要求纸张背景为白色,字体为黑色,用拍照设备对纸张拍照,再用程序对图片转正、去阴影等预处理,得到照片1,照片1包括印刷字体和背景这2个类别,转正和去阴影算法可以采用现有的方法。
[0008](2)通过人工手动用笔在(1)所述的纸张上写字,拍照,经过图片转正、去阴影等预处理,得到照片2,照片2包括印刷字体、手写字体和背景这3个类别。
[0009](3)用算法程序对照片1和照片2进行处理,得到照片2每个像素的类别,记为照片mask3。
[0010](4)其中(3)的算法如下。
[0011]①
照片1和照片2放缩到相同的长宽,得到的结果分别记为矩阵c和矩阵d。
[0012]②
把矩阵d减去矩阵c,再删除小面积区域,得到手写字体部分,记为矩阵e。
[0013]③
把矩阵d减去矩阵e,得到印刷体部分,记为矩阵f。
[0014]④
这样就把手写字体、印刷字体与背景三个类别区分开了。区分开之后,就可以把背景的像素用0表示,印刷字体的像素用1表示,手写字体的像素用2表示。从而实现手写字体、印刷字体、背景的像素级标注。
[0015]⑤
如果图片较大,需要把照片1分割为小图片,对应的mask3也要分割为同样大小。
[0016]步骤2:建立人工智能模型,主要是图像语义分割领域的人工智能模型,该人工智能模型可以是全卷积神经网络(Fully Convolutional Networks,FCN),空洞卷积(dilated convolutions),也可以是SegNet网络,或者U

Net网络等。同样的模型有多种设计方式,为了使手写字体、印刷字体、背景像素级分类效果更好,经过试验发现采用较大卷积核的效果
更好,比如11
×
11. 模型的层级结构尽量不要太复杂,比如可以采用一个卷积层、池化、两个空洞卷积、池化、两个空洞卷积、反卷积,这样的模型结构。
[0017]步骤3:模型训练,把训练样本输入模型进行训练,包括如下步骤。
[0018](1)训练样本的输入。
[0019]把照片2作为训练样本的输入,输入到人工智能模型。
[0020](2)训练样本的输出。
[0021]把照片mask3作为训练样本的目标输出。照片mask3包括3个类别,分别记为:印刷体记为1,手写字体记为2,背景记为0。
[0022](3)准备好了模型和训练样本就可以训练模型了,模型的训练可以在个人电脑上训练,也可以在CPU服务器上或者GPU服务器上训练。如果样本量很大,最好在GPU服务器上训练。训练好模型之后要保存模型。同时还需要用检测样本对模型进行检测,检测模型的分类准确率,如果分类准确率较高则可以用于实际应用。
[0023]步骤(4):获取需要去除手写字体的图片,包括如下步骤。
[0024](1)对需要去除手写字体的纸张进行拍照,或者是已经拍照好得到的图片,记为照片4。
[0025](2)对照片4用程序进行预处理,包括图片转正、去阴影等,记为照片5。
[0026]步骤(5):把需要去除手写字体的图片输入模型检测得到像素级分类结果图,包括如下步骤。
[0027](1)加载训练好的模型。
[0028](2)把照片5分割为N个小图片,比如可以取N=4。分割为小图片是为了提高检测速度。
[0029](3)把每个小图片输入模型检测,可以通过多线程方法并行计算,得到分类结果。
[0030]步骤(6):根据分类结果,把手写字体类别替换为背景类别得到去除手写字体的图片本专利技术与现有技术相比的有益效果。
[0031](1)本专利技术有两个方面创新,包括训练样本制作、人工智能模型构建。集合在一起构成一个新的手写字体去除方法。
[0032](2)训练样本制作方案设计巧妙,解决了难以获取训练样本标注信息的难题,可以较为快速、大量制作训练样本。
[0033](3)人工智能模型选取方面,采用语义分割模型,简单实用,计算速度较快。模型构建方面,提出采用较大的卷积核,检测效果更佳。
附图说明
[0034]图1为本专利技术流程图。
[0035]图2 深度学习模型。
[0036]图3 有手写字体的样本图片。
[0037]图4 提取出的手写字体图片。
[0038]图5 印刷字体图片。
[0039]图6带有手写字体的图片。
[0040]图7经过模型检测输出手写字体去除后的图片。
具体实施方式
[0041]下面结合附图对本专利技术的具体实施方式进行进一步的详细描述。
[0042]如图1所示,本专利技术提出的一种基于人工智能的手写字体去除方法,步骤如下。
[0043]步骤1:训练样本准备。
[0044](1)准备只有印刷体的纸张,要求纸张背景为白色,字体为黑色,用拍照设备对纸张拍照,再用程序对图片转正、去阴影等预处理,得到照片1,照片1包括印刷字体和背景这2个类别,转正和去阴影算法可以采用现有的方法。
[0045](2)通过人工手动用笔在(1)所述的纸张上写字,拍照,如图3所示。经过图片转正、去阴影等预处理,得到照片2,照片2包括印刷字体、手写字体和背景这3个类别。
[0046](3)用算法程序对照片1和照片2进行处理,得到照片2每个像素的类别,记为照片mask3。
[0047](4)其中(3)的算法如下。
[0048]①
照片1和照片2放缩到相同的长宽,得到的结果分别记为矩阵c和矩阵d。
[0049]②
把矩阵d减去矩阵c,再删除小面积区域,得到手写字体部分,记为矩阵e,如图4所示。
[0050]③
把矩阵d减去矩阵e,得到印刷体部分,记为矩阵f,如图5所示。
[0051本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的手写字体去除方法,其特征在于:包括如下步骤:(1)训练样本制作,制作包含手写字体、印刷字体的训练样本数据集;(2)建立人工智能模型;(3)模型训练;(4)获取需要去除手写字体的图片;(5)对图片预处理;(6)图片输入模型检测得到像素级分类结果图;(8)对检测结果处理得到去除手写字体的图片。2.根据权利要求1所述的一种基于人工智能的手写字体去除方法,其特征在于:步骤(1)制作训练样本数据集,包括如下步骤:(2.1)准备只有印刷体的纸张,要求纸张背景为白色,字体为黑色,用拍照设备对纸张拍照,再用程序对图片转正、去阴影等预处理,得到照片1,照片1包括印刷字体和背景这2个类别,转正和去阴影算法可以采用现有的方法;(2.2)通过人工手动用笔在(2.1)所述的纸张上写字,拍照,经过图片转正、去阴影等预处理,得到照片2,照片2包括印刷字体、手写字体和背景这3个类别;(2.3)用算法程序对照片1和照片2进行处理,得到照片2每个像素的类别,记为照片mask3;(2.4)其中(2.3)的算法如下:

照片1和照片2放缩到相同的长宽,得到的结果分别记为矩阵c和矩阵d;

把矩阵d减去矩阵c,再删除小面积区域,得到手写字体部分,记为矩阵e;

把矩阵d减去矩阵e,得到印刷体部分,记为矩阵f;

这样就把手写字体、印刷字体与背景三个类别区分开了,区分开之后,就可以把背景的像素用0表示,印刷字体的像素用1表示,手写字体的像素用2表示,从而实现手写字体、印刷字体、背景的像素级标注;

如果图片较大,需要把照片1分割为小图片,对应的mask3也要分割为同样大小。3.根据权利要求1所述的一种基于人工智能的手写字体去除方法,其特征在于:步骤(2)建立人工智能模型,主要是图像语义分割领域的人工智能模型,该人工智能模型可以是全卷积神经网络(Fully Convolutional Networks,FCN),空洞卷积(dilated convolutions)...

【专利技术属性】
技术研发人员:方海泉
申请(专利权)人:浙江星算科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1