【技术实现步骤摘要】
【技术保护点】
一种字符去粘连的方法,包括以下步骤:(1)设定待处理字符图像的先验知识集;所述的先验知识集是指待处理图像中字符的属性特征的集合;(2)对待处理字符图像进行连通域分析,并计算字符高度H和字符宽度W,确定连通域分析结果中需要进行拆分的连通域;(3)对需要进行拆分的连通域进行拆分点定位,得到所有的拆分方案;(4)采用所有的拆分方案分别对需要进行拆分的连通域进行拆分,对每种拆分方案对应的字符拆分结果进行OCR识别,得到图像的字符识别结果;(5)根据先验知识评价函数对每种拆分方案对应的字符识别结果进行评价,将评价最匹配的字符识别结果作为去粘连后的识别结果;所述的先验知识评价函数是根据先验知识集构造的用于评价字符识别结果是否符合先验知识集中字符属性特征的函数。
【技术特征摘要】
【专利技术属性】
技术研发人员:李平立,史培培,
申请(专利权)人:北京大学,方正国际软件北京有限公司,方正国际软件有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。