【技术实现步骤摘要】
场景文字的轮廓拟合和校正方法、电子设备及存储介质
[0001]本申请涉及场景文字识别领域,尤其是涉及一种场景文字的轮廓拟合和校正方法、电子设备及存储介质。
技术介绍
[0002]文字在人类生活中被广泛应用,它能准确传达丰富的信息,使得其在许多视觉应用领域发挥重要作用。自然场景文字的识别是地理定位、智能检测、工业自动化、机器人导航等应用的基础。其中,任意形状场景文字的检测和识别是一个富有挑战的问题,由于文字的大小,长宽比,形状等富于变化,要求场景文字检测、识别方法具有表达复杂形状的能力。
[0003]近年来基于分割的文字检测方法,因其能输出像素精度的轮廓来表示任意文本形状,而受到广泛研究。基于分割的文字检测方法输出的是由像素点组成的文字区域轮廓,为实现端到端文字识别,当前主流的方法是求取检测文字轮廓的最小旋转矩形,然后用仿射变换采样该矩形区域的图像进行后续的文字识别。
[0004]但是专利技术人认为上述相关技术存在不能实现任意形状文字的高精度识别的问题。
技术实现思路
[0005]为了提高基于分割的文字检测器在实现端到端任意形状文字识别的精度,本申请提供一种场景文字的轮廓拟合和校正方法、电子设备及存储介质。
[0006]第一方面,本申请提供的一种场景文字的轮廓拟合和校正方法采用如下的技术方案:
[0007]一种场景文字的轮廓拟合和校正方法,包括以下步骤:
[0008]对场景文字的边界进行拟合,获得文字区域多边形;
[0009]对文字区域多边形对应的图像进行 ...
【技术保护点】
【技术特征摘要】
1.一种场景文字的轮廓拟合和校正方法,其特征在于,包括以下步骤:对场景文字的边界进行拟合,获得文字区域多边形;对文字区域多边形对应的图像进行校正,获得包含文字的矩形区域图像,用于场景文字识别。2.根据权利要求1所述的场景文字的轮廓拟合和校正方法,其特征在于:所述的对场景文字的边界进行拟合,获得文字区域多边形,包括:对场景文字的整体轮廓拟合一个最小旋转矩形作为初始矩形;根据所述的最小旋转矩形,将文字轮廓分为左右两部分,然后通过递归调用分别求取两部分的拟合多边形;将获得的两个拟合多边形合并为单个多边形,进而得到文字区域多边形。3.根据权利要求2所述的场景文字的轮廓拟合和校正方法,其特征在于:根据所述的最小旋转矩形,将文字轮廓分为左右两部分,然后通过递归调用分别求取两部分的拟合多边形,具体包括:(a)设初始递归深度T=1,场景文字的整体轮廓点集C
T
=C,当前轮廓在其父轮廓中的位置Pos∈{None,Left,Right},初始Pos=None,参考点数组为从父轮廓分割时得到的顶边和底边参考点,分别为初始均为空;(b)根据当前轮廓C
T
的最小旋转矩形rbox
T
,提取其四个边界顶点并使左上边界顶点为第一个点,得到其顶点集合若存在参考点数组则根据当前轮廓在父轮廓中的位置对边界顶点集合P
T
中的顶点进行重新排序:若Pos=Left,则使矩形的右边到参考点数组中两点的距离和最小;若Pos=Right,则使矩形的左边到参考点数组中两点的距离和最小;(c)取L为rbox
T
的上下边中点的连线,用中线L将C
T
一分为二得到左右两部分记L与C
T
的所有交点集合为R
T
;将R
T
中距离rbox
T
的上边最近和最远的点作为新的参考点数组(d)对左边部分递归使用步骤(b)~(c)进行拟合,初始条件为:T=T+1,轮廓点集为Pos=Left,参考点数组为得到左边的拟合多边形顶点数目为2ml;(e)同理,对右边部分进行递归拟合得到右边的拟合多边形顶点数目为2mr。4.根据权利要求3所述的场景文字的轮廓拟合和校正方法,其特征在于,以下任一条件满足则递归拟合过程终止:当前轮廓的拟合精度超过预设的第一阈值w1;当前轮廓的拟合精度超过预设的第二阈值w2,w2<w1,且宽高比小于1;当前递归的深度达到预设的最大递归深度T_max;当前轮廓的面积小于预设的最小面积Area_min。
5.根据权利要求2所述的场景文字的轮廓拟合和校正方法,其特征在于:...
【专利技术属性】
技术研发人员:田泽康,蒋文,邓卉,陈搏,
申请(专利权)人:易视腾科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。