分割字符的方法及装置制造方法及图纸

技术编号:10806662 阅读:107 留言:0更新日期:2014-12-24 13:09
本公开是关于分割字符的方法及装置,用于提高分割字符的准确性,方法包括:从图像中检测出单个字符区域,根据检测出的单个字符区域确定待分割字符所在区域的上下边界,去除图像中上下边界之外的区域,得到目标区域;检测目标区域中连通域边界,根据边界确定各个连通域在多个位置处的笔画宽度;根据连通域在多个位置处的笔画宽度间偏差判断连通域是否为噪音区域,将判定为噪音区域的连通域从目标区域中去除;将目标区域的前景像素进行水平投影,获得水平投影直方图,利用水平投影直方图确定分割字符的分割点,从分割点处进行分割。本公开能够将图像中干扰的连通域去除,减少分割出的字符区域中包含多个字符的概率,提高分割字符的准确性。

【技术实现步骤摘要】
【专利摘要】本公开是关于分割字符的方法及装置,用于提高分割字符的准确性,方法包括:从图像中检测出单个字符区域,根据检测出的单个字符区域确定待分割字符所在区域的上下边界,去除图像中上下边界之外的区域,得到目标区域;检测目标区域中连通域边界,根据边界确定各个连通域在多个位置处的笔画宽度;根据连通域在多个位置处的笔画宽度间偏差判断连通域是否为噪音区域,将判定为噪音区域的连通域从目标区域中去除;将目标区域的前景像素进行水平投影,获得水平投影直方图,利用水平投影直方图确定分割字符的分割点,从分割点处进行分割。本公开能够将图像中干扰的连通域去除,减少分割出的字符区域中包含多个字符的概率,提高分割字符的准确性。【专利说明】分割字符的方法及装置
本公开涉及图像处理
,尤其涉及分割字符的方法及装置。
技术介绍
相关技术中,0CR(0ptical Character Recognit1n,光学字符识别)的字符检测与分割技术主要基于连通域分析和直方图。相关技术中的分割字符方法包括:对图像进行预处理,例如进行二值化、平滑、去噪等;然后进行连通域分析,根据连通域分析结果去除背景;再获得图像的直方图,根据直方图分割字符。 图像中可能存在干扰的连通域,例如充值卡的卡片中存在涂层、背景中有条形码,条形码和未被完全刮除的涂层可能会被判定为连通域。相关技术中,仅通过连通域分析去除背景,并利用直方图分割字符,图像中去除背景后的区域中仍然可能包含干扰的连通域,如此造成分割字符困难,并降低了分割字符的准确性。
技术实现思路
为克服相关技术中存在的问题,本公开实施例提供分割字符的方法及装置,用于提高分割字符的准确性。 根据本公开实施例的第一方面,提供一种分割字符的方法,包括: 利用字符识别算法从图像中检测出单个字符区域,根据检测出的单个字符区域确定待分割字符所在区域的上下边界,去除所述图像中所述上下边界之外的区域,得到目标区域; 利用边界识别算法检测所述目标区域中连通域边界,根据所述边界确定各个连通域在多个位置处的笔画宽度; 根据连通域在多个位置处的笔画宽度间偏差判断所述连通域是否为噪音区域,将判定为噪音区域的连通域从目标区域中去除; 将所述目标区域的前景像素进行水平投影,获得水平投影直方图,利用水平投影直方图确定分割字符的分割点,从分割点处进行分割。 在一实施例中,所述利用字符识别算法从图像中检测出单个字符区域之前,所述方法还可包括: 对所述图像进行预处理。 在一实施例中,所述根据检测出的单个字符区域确定待分割字符所在区域的上下边界,可包括: 对于各个单个字符区域,确定所述单个字符区域的上边界和下边界; 对所述上边界和所述下边界分别进行样本采样,并分别计算采样的样本间偏差; 当采样的样本间偏差没有在第一预设偏差范围内时,重新进行样本采样,直到采样的样本间偏差在第一预设偏差范围内为止; 当上边界或下边界的样本间偏差在第一预设偏差范围内时,确定待分割字符所在区域的上边界或下边界的值为采样的样本的平均值。 在一实施例中,所述根据所述边界确定各个连通域在多个位置的笔画宽度,可包括: 对于各个连通域,在所述连通域边界的一条边上取多个边界点; 对于每个边界点,在所述边界点的梯度方向上查找到位于所述连通域边界的另一条边上的另一边界点,确定所述边界点与所述另一边界点间距离为所述连通域在所述边界点处的笔画宽度。 在一实施例中,所述根据连通域在多个位置的笔画宽度间偏差判断所述连通域是否为噪音区域,可包括: 计算连通域在多个位置处的笔画宽度的均值和方差; 当所述方差与所述均值的比值大于第一预设阈值时,判定所述连通域为噪音区域。 在一实施例中,所述利用水平投影直方图确定分割字符的分割点,可包括: 将水平投影直方图在水平轴上的投影像素值小于第二预设阈值的位置,确定为分割点; 将位于水平轴上连续空白区域中的分割点合并。 在一实施例中,所述方法还可包括: 根据目标区域中连通域的边界确定所述连通域的区域宽度和区域高度,选取区域宽高比在预设范围内的连通域,根据选取的连通域的区域宽度确定字符参考宽度; 所述从分割点处进行分割之后,还包括: 根据所述字符参考宽度判断分割后所得的各个字符区域中是否包含多个字符; 当分割后所得字符区域中包含多个字符时,根据所述字符区域的水平投影直方图和字符参考宽度,分割所述字符区域。 在一实施例中,所述根据所述字符区域的水平投影直方图和字符参考宽度,分割所述字符区域,可包括: 选取所述字符区域中多处位置作为单侧边界点,对于各个单侧边界点,根据所述字符参考宽度进行分割,获得多个分割方式; 对于各个分割方式,计算分割区域的内部与边界处的、水平投影直方图在水平轴上的投影像素值的比值; 按所述比值最大的分割方式,对所述字符区域进行分割。 在一实施例中,所述将所述目标区域的前景像素进行水平投影,获得水平投影直方图之后,还可包括: 在水平投影直方图中,对于利用字符识别算法检测出的单个字符区域,增强所述单个字符区域的中央部分,抑制所述单个字符区域的边界部分。 在一实施例中,所述对于利用字符识别算法检测出的单个字符区域,增强所述单个字符区域的中央部分,抑制所述单个字符区域的边界部分,可包括 对于利用字符识别算法检测出的、与目标区域的上下边界的偏差在第二预设偏差范围内的单个字符区域,增强所述单个字符区域的中央部分,抑制所述单个字符区域的边界部分。 在一实施例中,所述将判定为噪音区域的连通域从目标区域中去除之后,所述方法还可包括: 确定所述各个连通域的上边界和下边界,根据所述上边界和所述下边界重新确定待分割字符所在区域的上下边界,去除所述图像中在重新确定的上下边界之外的区域,得到新的目标区域。 根据本公开实施例的第三方面,提供一种分割字符的装置,包括: 目标区域确定模块,用于利用字符识别算法从图像中检测出单个字符区域,根据检测出的单个字符区域确定待分割字符所在区域的上下边界,去除所述图像中所述上下边界之外的区域,得到目标区域; 笔画宽度确定模块,用于利用边界识别算法检测所述目标区域中连通域边界,根据所述边界确定各个连通域在多个位置处的笔画宽度; 噪音区域去除模块,用于根据连通域在多个位置处的笔画宽度间偏差判断所述连通域是否为噪音区域,将判定为噪音区域的连通域从目标区域中去除; 字符分割模块,用于将所述目标区域的前景像素进行水平投影,获得水平投影直方图,利用水平投影直方图确定分割字符的分割点,从分割点处进行分割。 在一实施例中,所述装置还可包括: 图像预处理模块,用于对所述图像进行预处理。 在一实施例中,所述目标区域确定模块,可包括: 字符边界确定子模块,用于对于各个单个字符区域,确定所述单个字符区域的上边界和下边界; 偏差计算子模块,用于对所述上边界和所述下边界分别进行样本采样,并分别计算采样的样本间偏差; 样本采样子模块,用于当采样的样本间偏差没有在第一预设偏差范围内时,重新进行样本采样,直到采样的样本间偏差在第一预设偏差范围内为止; 区域边界确定子模块,用于当上边界或下边界的样本间偏差在第一预设偏差范围内时,确定待本文档来自技高网...
分割字符的方法及装置

【技术保护点】
一种分割字符的方法,其特征在于,包括:利用字符识别算法从图像中检测出单个字符区域,根据检测出的单个字符区域确定待分割字符所在区域的上下边界,去除所述图像中所述上下边界之外的区域,得到目标区域;利用边界识别算法检测所述目标区域中连通域边界,根据所述边界确定各个连通域在多个位置处的笔画宽度;根据连通域在多个位置处的笔画宽度间偏差判断所述连通域是否为噪音区域,将判定为噪音区域的连通域从目标区域中去除;将所述目标区域的前景像素进行水平投影,获得水平投影直方图,利用水平投影直方图确定分割字符的分割点,从分割点处进行分割。

【技术特征摘要】

【专利技术属性】
技术研发人员:徐晓舟陈志军王琳
申请(专利权)人:小米科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1