本发明专利技术提供一种单字检测方法及装置,其中,该方法包括:基于第一图片,获取单字热力图和字相关热力图;基于单字热力图和字相关热力图,对第一图片进行截图处理,获取至少一幅第二图片;基于字相关热力图,分别对每一幅第二图片进行单字切割,获取每一幅第二图片中的单字;其中,单字热力图,用于指示第一图片中各单字的位置信息;字相关热力图,用于指示第一图片中相邻单字之间的连接关系信息
【技术实现步骤摘要】
单字检测方法及装置
[0001]本专利技术涉及计算机
,尤其涉及一种单字检测方法及装置
。
技术介绍
[0002]单字检测,是指检测图片中的每个单字
(
即单一文字
)
,即将图片中的文字以单字为单位进行剪切并输出
。
单字检测方法的应用场景可以包括但不限于:检测图片或者海报中的错别字后进行替换矫正;获取图片中某个字的字体类型
。
[0003]目前,现有单字检测方法一般是先对待检测的图片进行文本行检测,然后再对每个文本行对应的区域图片进行分割,从而得到各个单字检测框
。
但现有单字检测方法的准确性较低,无法很好地检测出单字,在实际应用中常常需要用户手动进行框选或者拼接,以选择单字
。
技术实现思路
[0004]本专利技术提供一种单字检测方法及装置,用以解决现有技术中单字检测的准确性较低的缺陷,实现更准确
、
更好地检测出单字
。
[0005]本专利技术提供一种单字检测方法,包括:
[0006]基于第一图片,获取单字热力图和字相关热力图;
[0007]基于所述单字热力图和所述字相关热力图,对所述第一图片进行截图处理,获取至少一幅第二图片;
[0008]基于所述字相关热力图,分别对每一幅所述第二图片进行单字切割,获取每一幅所述第二图片中的单字;
[0009]其中,所述单字热力图,用于指示所述第一图片中各单字的位置信息;所述字相关热力图,用于指示所述第一图片中相邻单字之间的连接关系信息
。
[0010]根据本专利技术提供的一种单字检测方法,所述基于所述字相关热力图,分别对每一幅所述第二图片进行单字切割,获取每一幅所述第二图片中的单字,包括:
[0011]针对每一幅所述第二图片执行以下处理:
[0012]对所述第二图片进行二值化处理,获取第三图片;
[0013]基于所述字相关热力图,确定所述第三图片中的第一目标点,并基于投影分割法,确定所述第三图片中的第二目标点;
[0014]基于所述第三图片的背景颜色
、
所述第三图片中文字的颜色
、
所述第一目标点和所述第二目标点对所述第三图片进行单字切割,获取所述单字
。
[0015]根据本专利技术提供的一种单字检测方法,所述基于所述第三图片的背景颜色
、
所述第三图片中文字的颜色
、
所述第一目标点和所述第二目标点对所述第三图片进行单字切割,获取所述单字,包括:
[0016]基于所述第一目标点和所述第二目标点,确定分割界限;
[0017]基于所述分割界限,对所述第三图片进行单字切割,基于所述第三图片的背景颜
色和所述第三图片中文字的颜色,获取所述单字
。
[0018]根据本专利技术提供的一种单字检测方法,所述基于所述第一目标点和所述第二目标点,确定分割界限,包括:
[0019]针对每一所述第一目标点执行以下处理:
[0020]在以所述第一目标点为圆心
、
且以第一距离为半径的第一圆内存在所述第二目标点的情况下,将所述第一圆内的所述第二目标点确定为所述分割界限;
[0021]在所述第一圆内不存在所述第二目标点的情况下,将所述第一目标点确定为所述分割界限
。
[0022]根据本专利技术提供的一种单字检测方法,所述基于所述字相关热力图,确定所述第三图片中的第一目标点,并基于投影分割法,确定所述第三图片中的第二目标点,包括:
[0023]获取所述第三图片中与所述字相关热力图中的圆心对应的点,作为所述第一目标点;
[0024]基于所述投影分割法,获取所述第三图片中用于指示相邻单字之间的分割界限的点,作为所述第二目标点
。
[0025]根据本专利技术提供的一种单字检测方法,所述对所述第二图片进行二值化处理,获取第三图片之后,还包括:
[0026]获取所述第三图片整幅图片的第一黑白占比和所述第三图片边缘部分的第二黑白占比;
[0027]基于所述第一黑白占比和所述第二黑白占比,确定所述第三图片的背景颜色和所述第三图片中文字的颜色
。
[0028]根据本专利技术提供的一种单字检测方法,所述基于第一图片,获取单字热力图和字相关热力图,包括:
[0029]获取所述第一图片中各像素点处于字符中心的概率以及所述各像素点处于字符间隙的概率;
[0030]基于所述各像素点处于字符中心的概率,获取所述单字热力图,并基于所述各像素点处于字符间隙的概率,获取所述字相关热力图
。
[0031]根据本专利技术提供的一种单字检测方法,所述基于所述单字热力图和所述字相关热力图,对所述第一图片进行截图处理,获取至少一幅第二图片,包括:
[0032]对二值化处理后的所述单字热力图和二值化处理后的所述字相关热力图进行逻辑操作,获取第四图片;
[0033]基于所述第四图片,获取第一位置信息;
[0034]基于所述第一位置信息,对所述第一图片进行截图处理,获取至少一幅所述第二图片
。
[0035]根据本专利技术提供的一种单字检测方法,所述基于所述第四图片,获取第一位置信息,包括:
[0036]对所述第四图片进行轮廓查找,获取查找到的轮廓最小的外接矩形框;
[0037]获取所述外接矩形框的位置信息,作为所述第一位置信息
。
[0038]本专利技术还提供一种单字检测装置,包括:
[0039]获取模块,用于基于第一图片,获取单字热力图和字相关热力图;
[0040]截图模块,用于基于所述单字热力图和所述字相关热力图,对所述第一图片进行截图处理,获取至少一幅第二图片;
[0041]切割模块,用于基于所述字相关热力图,分别对每一幅所述第二图片进行单字切割,获取每一幅所述第二图片中的单字;
[0042]其中,所述单字热力图,用于指示所述第一图片中各单字的位置信息;所述字相关热力图,用于指示所述第一图片中相邻单字之间的连接关系信息
。
[0043]根据本专利技术提供的一种单字检测装置,所述切割模块,包括:
[0044]二值化单元,用于对所述第二图片进行二值化处理,获取第三图片;
[0045]点确定单元,用于基于所述字相关热力图,确定所述第三图片中的第一目标点,并基于投影分割法,确定所述第三图片中的第二目标点;
[0046]切割单元,用于基于所述第三图片的背景颜色
、
所述第三图片中文字的颜色
、
所述第一目标点和所述第二目标点对所述第三图片进行单字切割,获取所述单字
。
[0047]根据本专利技术提供的一种单字检测装置,所述切割单元,包括:
[0048]界限确定子单元,用于基于所述第一目标点和所述第二目标点,确定分割界限;
[0049]切割子本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种单字检测方法,其特征在于,包括:基于第一图片,获取单字热力图和字相关热力图;基于所述单字热力图和所述字相关热力图,对所述第一图片进行截图处理,获取至少一幅第二图片;基于所述字相关热力图,分别对每一幅所述第二图片进行单字切割,获取每一幅所述第二图片中的单字;其中,所述单字热力图,用于指示所述第一图片中各单字的位置信息;所述字相关热力图,用于指示所述第一图片中相邻单字之间的连接关系信息
。2.
根据权利要求1所述的单字检测方法,其特征在于,所述基于所述字相关热力图,分别对每一幅所述第二图片进行单字切割,获取每一幅所述第二图片中的单字,包括:针对每一幅所述第二图片执行以下处理:对所述第二图片进行二值化处理,获取第三图片;基于所述字相关热力图,确定所述第三图片中的第一目标点,并基于投影分割法,确定所述第三图片中的第二目标点;基于所述第三图片的背景颜色
、
所述第三图片中文字的颜色
、
所述第一目标点和所述第二目标点对所述第三图片进行单字切割,获取所述单字
。3.
根据权利要求2所述的单字检测方法,其特征在于,所述基于所述第三图片的背景颜色
、
所述第三图片中文字的颜色
、
所述第一目标点和所述第二目标点对所述第三图片进行单字切割,获取所述单字,包括:基于所述第一目标点和所述第二目标点,确定分割界限;基于所述分割界限,对所述第三图片进行单字切割,基于所述第三图片的背景颜色和所述第三图片中文字的颜色,获取所述单字
。4.
根据权利要求3所述的单字检测方法,其特征在于,所述基于所述第一目标点和所述第二目标点,确定分割界限,包括:针对每一所述第一目标点执行以下处理:在以所述第一目标点为圆心
、
且以第一距离为半径的第一圆内存在所述第二目标点的情况下,将所述第一圆内的所述第二目标点确定为所述分割界限;在所述第一圆内不存在所述第二目标点的情况下,将所述第一目标点确定为所述分割界限
。5.
根据权利要求2所述的单字检测方法,其特征在于,所述基于所述字相关热力图,确定所述第三图片中的第一目标点,并基于投影分割法,确定所述第...
【专利技术属性】
技术研发人员:林文松,
申请(专利权)人:北京金山办公软件股份有限公司武汉金山办公软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。