本申请涉及一种文字图像处理识别方法、装置、计算机设备和存储介质。方法包括:生成文字图像,读取文字图像,预处理文字图像;对处理后的文字图像进行图像切分,形成单一文字图片;提取单一文字图片的文字特征,文字特征包括统计特征和结构特征;结合统计特征和结构特征,计算文字匹配度,识别单一文字图片对应的模板文字。本发明专利技术对待识别图像进行的特殊的预处理算法,有效提取出图像中的所有单个字符并切分成单个图像,从而降低特征提取算法的难度,并能提高文字识别的精度。能提高文字识别的精度。能提高文字识别的精度。
【技术实现步骤摘要】
一种文字图像处理识别方法、装置、计算机设备和存储介质
[0001]本申请涉及文字识别
,特别是涉及一种文字图像处理识别方法、装置、计算机设备和存储介质。
技术介绍
[0002]汉字是由笔画组成的文字、且笔画复杂多样,相对于由字母组成的英文图像识别的难度要大得多。而企业办公自动化的主要业务场景之一就是借助计算机来处理各式各样的文字以替代重复的线下手工办公活动,随着手写体汉字识别的能力在办公自动化过程中显得日益重要,企业非常迫切地需要针对手写体汉字识别精度高、速度快的算法。
[0003]手写体汉字由于字形变化太大,而汉字图像识别的实质是根据方块汉字的图形提取出特征后再做模式匹配,所以字形的变化对识别效率有非常大的影响。针对本专利技术中待处理的手写体汉字使用目前业界主流的汉字图像识别服务供应商API对大数据量样本测试后发现识别率均不到20%,因识别率太低而无法应用于企业业务系统。。
技术实现思路
[0004]本专利技术旨在解决如何文字图像识别的问题。基于此,有必要针对上述技术问题,提供一种能够过前期预处理将图像中的单个文字切分出来,然后再提取出每个文字的特征,根据文字特征做模式匹配从而准确分析出单个图像对应的文字图像处理识别方法、装置、计算机设备和存储介质。
[0005]一种文字图像处理识别方法,所述方法包括:
[0006]生成文字图像,读取所述文字图像,预处理所述文字图像;
[0007]对处理后的文字图像进行图像切分,形成单一文字图片;
[0008]提取所述单一文字图片的文字特征,所述文字特征包括统计特征和结构特征;
[0009]结合所述统计特征和结构特征,计算文字匹配度,识别所述单一文字图片对应的模板文字。
[0010]在其中一个实施例,所述预处理所述文字图像,包括:
[0011]二值化处理所述文字图像,得到文字图片;
[0012]计算所述文字图片中所有文字的平均高度和平均宽度,所述平均高度通过所述文字图片的图片像素在垂直y轴方向的投影计算得到,所述平均宽度通过所述文字图片的图片像素在水平x轴方向的投影以及预输入的文字数据计算得到;
[0013]遍历所述文字图片的噪声部位的所有像素,根据预设过滤条件对所述文字图片去噪,所述过滤条件包括:所述噪声部位的有效面积的大小、所述噪声部位的有效高度或有效宽度与所述平均高度或所述平均宽度的差异、所述噪声部位有效像素的占比和/或所述噪声部位是否包含复杂笔画。
[0014]在其中一个实施例,所二值化处理所述文字图像,得到文字图片,包括:
[0015]识别所述文字图像的文字色和背景色,设定阈值,遍历所述文字图像的每一个像
素,若该像素的RGB三原色均小于所述阈值,则置为黑色,否则置为白色,得到文字图片,所述文字图片为黑白图片。
[0016]在其中一个实施例,所述对处理后的文字图像进行图像切分,形成单一文字图片,包括,
[0017]获取所述黑白图片,加载所述黑白图片为像素矩阵;
[0018]第一次扫描,从所述像素矩阵最左侧的第一个像素点开始,从左至右逐列遍历,每一列沿垂直方向从上至下遍历,确定第一个黑色像素点为第一边缘点,结束所述第一次扫描,所述第一边缘点所在列为左边缘;
[0019]第二次扫描,从所述第一边缘点开始,在所述第一边缘点所在行沿水平方向向右遍历,连续遍历白色像素点的数量超过预定阈值或到达所述像素矩阵的最右侧,确定最后一个白色像素点为第二边缘点,结束所述第二次扫描,以所述第一边缘点和第二边缘点之间的距离为单一文字图片的宽度,并标记所述第一边缘点和第二边缘点所在行,所述第二边缘点所在列为右边缘;
[0020]第三次扫描,从所述标记行开始,逐行向上遍历每一行的有效像素,连续遍历不含有效像素的空白行的数量超过预定阈值或到达所述像素矩阵的最上侧,结束所述第三次扫描,遍历的最后一行为上边缘;
[0021]第四次扫描,从所述标记行开始,逐行向下遍历每一行的有效像素,连续遍历不含有效像素的空白行的数量超过预定阈值或到达所述像素矩阵的最下侧,结束所述第四次扫描,遍历的最后一行为下边缘;
[0022]根据所述左边缘、右边缘、上边缘以及下边缘,切分出所述文字,形成单一文字图片,并将所述像素矩阵中切分所述文字的位置全部置为白色像素点;
[0023]判断是否将所有文字均形成单一文字图片,若是,则结束切分过程,若否,则重复第一次至第四次扫描过程,直到将所有文字均形成单一文字图片。
[0024]在其中一个实施例,所述提取所述单一文字图片的文字特征,所述文字特征包括统计特征和结构特征,具体为,提取所述单一文字图片的统计特征和结构特征,所述统计特征是通过将所述文字切分成四个象限时,各象限内的黑/白像素点数量比联合后形成的空间的一个数值向量;所述结构特征是通过将所述文字的较粗的笔画细化成单一的细线后,取得所述文字的笔划端点和交叉点的数量、位置、以及笔划段;所述统计特征和结构特征是识别所述文字的两个维度依据。
[0025]在其中一个实施例,所述结合所述统计特征和结构特征,计算文字匹配度,识别所述单一文字图片对应的模板文字,包括:
[0026]对所述统计特征和结构特征分别赋予权重;
[0027]加载所述单一文字图片的待识别文字和文字模板库中所有模板文字的所述统计特征和结构特征;
[0028]将所述待识别文字与所述文字模板库中的所有模板文字逐一对比,计算所述待识别文字与每个所述模板文字的所述统计特征的第一匹匹配值,以及所述待识别文字与每个所述模板文字的所述结构特征的第二匹配值;
[0029]计算所述第一匹配值和所述第二匹配值之和为文字匹配度,所述和越小,所述文字匹配度越高,排序所述文字匹配度;
[0030]确定最高所述文字匹配度对应的模板文字为待识别文字,完成对所述单一文字图片的识别。
[0031]在其中一个实施例,通过文字中心沿水平方向和垂直方向切分得到的象限计算所述第一匹配值,计算方法为,
[0032][0033]其中,n表示切分象限的数目4,x
i
表示所述待识别文字的第i个象限的有效像素占比,y
i
表示所述模板文字的第i个象限的有效像素占比;
[0034]通过文字笔画的有效长度和位置计算所述第二匹配值,所述文字笔画包括横、竖、撇、捺4类,计算方法为,
[0035][0036]其中,m表示笔画分类的数目4,s
j
表示所述待识别文字的第j笔画的有效长度,t
j
表示所述模板文字的第j类笔画的有效长度,p
j
表示所述待识别文字的第j类笔画的起始坐标相对左上角的距离,q
j
表示所述模板文字的第j类笔画的起始坐标相对左上角的距离。
[0037]一种文字图像处理识别装置,所述装置包括:
[0038]处理单元,用于生成文字图像,读取所述文字图像,预处理所述文字图像;
...
【技术保护点】
【技术特征摘要】
1.一种文字图像处理识别方法,其特征在于,所述方法包括:生成文字图像,读取所述文字图像,预处理所述文字图像;对处理后的文字图像进行图像切分,形成单一文字图片;提取所述单一文字图片的文字特征,所述文字特征包括统计特征和结构特征;结合所述统计特征和结构特征,计算文字匹配度,识别所述单一文字图片对应的模板文字。2.根据权利要求1所述的方法,其特征在于,所述预处理所述文字图像,包括:二值化处理所述文字图像,得到文字图片;计算所述文字图片中所有文字的平均高度和平均宽度,所述平均高度通过所述文字图片的图片像素在垂直y轴方向的投影计算得到,所述平均宽度通过所述文字图片的图片像素在水平x轴方向的投影以及预输入的文字数据计算得到;遍历所述文字图片的噪声部位的所有像素,根据预设过滤条件对所述文字图片去噪,所述过滤条件包括:所述噪声部位的有效面积的大小、所述噪声部位的有效高度或有效宽度与所述平均高度或所述平均宽度的差异、所述噪声部位有效像素的占比和/或所述噪声部位是否包含复杂笔画。3.根据权利要求2所述的方法,其特征在于,所二值化处理所述文字图像,得到文字图片,包括:识别所述文字图像的文字色和背景色,设定阈值,遍历所述文字图像的每一个像素,若该像素的RGB三原色均小于所述阈值,则置为黑色,否则置为白色,得到文字图片,所述文字图片为黑白图片。4.根据权利要求3所述的方法,其特征在于,所述对处理后的文字图像进行图像切分,形成单一文字图片,包括,获取所述黑白图片,加载所述黑白图片为像素矩阵;第一次扫描,从所述像素矩阵最左侧的第一个像素点开始,从左至右逐列遍历,每一列沿垂直方向从上至下遍历,确定第一个黑色像素点为第一边缘点,结束所述第一次扫描,所述第一边缘点所在列为左边缘;第二次扫描,从所述第一边缘点开始,在所述第一边缘点所在行沿水平方向向右遍历,连续遍历白色像素点的数量超过预定阈值或到达所述像素矩阵的最右侧,确定最后一个白色像素点为第二边缘点,结束所述第二次扫描,以所述第一边缘点和第二边缘点之间的距离为单一文字图片的宽度,并标记所述第一边缘点和第二边缘点所在行,所述第二边缘点所在列为右边缘;第三次扫描,从所述标记行开始,逐行向上遍历每一行的有效像素,连续遍历不含有效像素的空白行的数量超过预定阈值或到达所述像素矩阵的最上侧,结束所述第三次扫描,遍历的最后一行为上边缘;第四次扫描,从所述标记行开始,逐行向下遍历每一行的有效像素,连续遍历不含有效像素的空白行的数量超过预定阈值或到达所述像素矩阵的最下侧,结束所述第四次扫描,遍历的最后一行为下边缘;根据所述左边缘、右边缘、上边缘以及下边缘,切分出所述文字,形成单一文字图片,并将所述像素矩阵中切分所述文字的位置全部置为白色像素点;
判断是否将所有文字均形成单一文字图片,若是,则结束切分过程,若否,则重复第一次至第四次扫描过程,直到将所有文字均形成单一文字图片。5.根据权利要求4所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:康李巍,李宁,
申请(专利权)人:苏宁云计算有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。