一种基于人工智能的手写字体去除方法技术

技术编号：32115513 阅读：60 留言：0更新日期：2022-01-29 19:00

一种基于人工智能的手写字体去除方法，属于人工智能领域，对于含有手写字体的印刷字体文档图片，可以去除手写字体，保留印刷字体。本发明专利技术方法包括：提出了一种制作含有手写字体、印刷字体、背景的训练样本方法；建立以全卷积神经网络为主的人工智能模型，用人工智能模型对训练样本进行训练；获取需要去除手写字体的图片，图片经过转正、去阴影得到预处理好的图片，把预处理好的图片输入训练好的人工智能模型进行检测，得到像素级分类结果图，根据分类结果，把手写字体类别替换为背景，可得到去除了手写字体的图片。由于是像素级分类，该方法对于手写字体与印刷体有重叠的地方也可以处理。理。理。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于人工智能的手写字体去除方法

[0001]本专利技术涉及一种基于人工智能的手写字体去除方法，属于人工智能视觉领域。

技术介绍

[0002]手写字体去除在办公、学习等很多方面都应用需求，比如：（1）手写字体提取；（2）手写字体分离；（3）手写字体识别；（4）去除手写字体起到美化的作用；（5）学生学习的时候，需要收集错题以便再次练习，需要去除之前的手写。人工智能是近年来非常热门的技术，在图像分割、语义分割、图像识别、语音识别、语音合成、视频分析等很多领域得到成功的应用。语义分割是对图像中的每个像素进行分类。语义分割在遥感影像、无人驾驶、医学影像分析、机器视觉等领域都有广泛应用。

技术实现思路

[0003]本专利技术为实现手写字体去除目的采用如下技术方案。
[0004]一种基于人工智能的手写字体去除方法，步骤如下。
[0005]步骤1：训练样本准备。
[0006]由于目前缺乏公开的手写字体、印刷体分类的数据集，本专利技术提出以下制作样本方法。包括如下步骤。
[0007]（1）准备只有印刷体的纸张，要求纸张背景为白色，字体为黑色，用拍照设备对纸张拍照，再用程序对图片转正、去阴影等预处理，得到照片1，照片1包括印刷字体和背景这2个类别，转正和去阴影算法可以采用现有的方法。
[0008]（2）通过人工手动用笔在（1）所述的纸张上写字，拍照，经过图片转正、去阴影等预处理，得到照片2，照片2包括印刷字体、手写字体和背景这3个类别。
[0009]（3）用算法程序对照...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的手写字体去除方法，其特征在于：包括如下步骤：（1）训练样本制作，制作包含手写字体、印刷字体的训练样本数据集；（2）建立人工智能模型；（3）模型训练；（4）获取需要去除手写字体的图片；（5）对图片预处理；（6）图片输入模型检测得到像素级分类结果图；（8）对检测结果处理得到去除手写字体的图片。2.根据权利要求1所述的一种基于人工智能的手写字体去除方法，其特征在于：步骤（1）制作训练样本数据集，包括如下步骤：（2.1）准备只有印刷体的纸张，要求纸张背景为白色，字体为黑色，用拍照设备对纸张拍照，再用程序对图片转正、去阴影等预处理，得到照片1，照片1包括印刷字体和背景这2个类别，转正和去阴影算法可以采用现有的方法；（2.2）通过人工手动用笔在（2.1）所述的纸张上写字，拍照，经过图片转正、去阴影等预处理，得到照片2，照片2包括印刷字体、手写字体和背景这3个类别；（2.3）用算法程序对照片1和照片2进行处理，得到照片2每个像素的类别，记为照片mask3；（2.4）其中（2.3）的算法如下：
①
照片1和照片2放缩到相同的长宽，得到的结果分别记为矩阵c和矩阵d；
②
把矩阵d减去矩阵c，再删除小面积区域，得到手写字体部分，记为矩阵e；
③
把矩阵d减去矩阵e，得到印刷体部分，记为矩阵f；
④
这样就把手写字体、印刷字体与背景三个类别区分开了，区分开之后，就可以把背景的像素用0表示，印刷字体的像素用1表示，手写字体的像素用2表示，从而实现手写字体、印刷字体、背景的像素级标注；
⑤
如果图片较大，需要把照片1分割为小图片，对应的mask3也要分割为同样大小。3.根据权利要求1所述的一种基于人工智能的手写字体去除方法，其特征在于：步骤（2）建立人工智能模型，主要是图像语义分割领域的人工智能模型，该人工智能模型可以是全卷积神经网络（Fully Convolutional Networks，FCN），空洞卷积（dilated convolutions）...

【专利技术属性】
技术研发人员：方海泉，
申请(专利权)人：浙江星算科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人