当前位置: 首页 > 专利查询>北京大学专利>正文

一种字符去粘连的方法及系统技术方案

技术编号:11478880 阅读:62 留言:0更新日期:2015-05-20 09:43
本发明专利技术涉及一种字符去粘连的方法及系统,首先设定待处理字符图像的先验知识集,对待处理字符图像进行连通域分析,并计算字符高度H和字符宽度W,确定连通域分析结果中需要进行拆分的连通域;之后对需要进行拆分的连通域进行拆分点定位,得到所有的拆分方案,再采用所有的拆分方案分别对需要进行拆分的连通域进行拆分,对每种拆分方案对应的字符拆分结果进行OCR识别,得到图像的字符识别结果,最后根据先验知识评价函数对每种拆分方案对应的字符识别结果进行评价,将评价最匹配的字符识别结果作为去粘连后的识别结果。采用本发明专利技术所述的方法不但能够解决粘连个数未知的情况下多个字符粘连的问题,而且可以取得较好的去粘连效果。

【技术实现步骤摘要】

【技术保护点】
一种字符去粘连的方法,包括以下步骤:(1)设定待处理字符图像的先验知识集;所述的先验知识集是指待处理图像中字符的属性特征的集合;(2)对待处理字符图像进行连通域分析,并计算字符高度H和字符宽度W,确定连通域分析结果中需要进行拆分的连通域;(3)对需要进行拆分的连通域进行拆分点定位,得到所有的拆分方案;(4)采用所有的拆分方案分别对需要进行拆分的连通域进行拆分,对每种拆分方案对应的字符拆分结果进行OCR识别,得到图像的字符识别结果;(5)根据先验知识评价函数对每种拆分方案对应的字符识别结果进行评价,将评价最匹配的字符识别结果作为去粘连后的识别结果;所述的先验知识评价函数是根据先验知识集构造的用于评价字符识别结果是否符合先验知识集中字符属性特征的函数。

【技术特征摘要】

【专利技术属性】
技术研发人员:李平立史培培
申请(专利权)人:北京大学方正国际软件北京有限公司方正国际软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1