【技术实现步骤摘要】
一种字符偏移检测方法及系统
本专利技术涉及计算机视觉
,特别是涉及一种字符偏移检测方法及系统。
技术介绍
文本是人类信息的重要载体,是人类生活中不可缺少的一部分,它广泛存在于各类生活场景中。近年来,随着数字媒体技术的发展,各类场景的图片已然成为了信息交流的主要载体。同时,根据图像中的文本信息对图像进行分析的需求越来越广泛。对于各类文本图像研究而言,现有的检测方法主要在于文本行的分析与研究,各类场景的文本检测基本止步于文本词条,主要任务是定位出一个文本行,但并未对字符进行分析。目前对字符分析也是极为重要的,特别是在各类表单中,印章或拓本的内容对整个表单信息将会产生极大的影响。对表单中印章类图像区域内的文本分布是存在一致性的,具体包括字体大小一致性及位置分布的一致性,分析该区域内的字符可以对这类图像的鉴伪提供有效的参考,但目前还没有具体技术方案公开如何对字符偏移进行分析。
技术实现思路
本专利技术的目的在于提供一种字符偏移检测方法及系统,以实现对字符偏移进行检测。实现本专利技术目的的技术解决方案为:一种字符偏移检测方法,所述方法包括:步骤S1:获取文本图像;步骤S2:基于所述文本图像进行字符分离,获得字符文本区域;步骤S3:计算所述字符文本区域中各矩形框的中心点,获得中心点集合;步骤S4:基于所述中心点集合确定最优拟合曲线;步骤S5:基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果。可选的,所述基于所述中心点集合确定最优拟合曲线 ...
【技术保护点】
1.一种字符偏移检测方法,其特征在于,所述方法包括:/n步骤S1:获取文本图像;/n步骤S2:基于所述文本图像进行字符分离,获得字符文本区域;/n步骤S3:计算所述字符文本区域中各矩形框的中心点,获得中心点集合;/n步骤S4:基于所述中心点集合确定最优拟合曲线;/n步骤S5:基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果。/n
【技术特征摘要】
1.一种字符偏移检测方法,其特征在于,所述方法包括:
步骤S1:获取文本图像;
步骤S2:基于所述文本图像进行字符分离,获得字符文本区域;
步骤S3:计算所述字符文本区域中各矩形框的中心点,获得中心点集合;
步骤S4:基于所述中心点集合确定最优拟合曲线;
步骤S5:基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果。
2.根据权利要求1所述的字符偏移检测方法,其特征在于,所述基于所述中心点集合确定最优拟合曲线,具体包括:
步骤S41:从所述中心点集合中选取起始点、终止点和中间某一点;
步骤S42:连接所述起始点和所述终止点获得第一直线,连接所述起始点和中间某一点获得第二直线;
步骤S43:确定所述第一直线和所述第二直线之间的夹角余弦;
步骤S44:基于所述夹角余弦寻找最优拟合曲线;
步骤S45:求取起始点、终止点和中间某一点分别到所述最优拟合曲线的距离,并选取距离最大值对应的点为特异点。
3.根据权利要求2所述的字符偏移检测方法,其特征在于,所述基于所述夹角余弦寻找最优拟合曲线,具体包括:
步骤S441:判断所述夹角余弦是否大于角度阈值;如果所述夹角余弦大于角度阈值,则说明某一字符所在位置相对整个文本区域发生了偏离,则执行步骤S442;如果所述夹角余弦小于或等于角度阈值,则将初始拟合曲线作为最优拟合曲线;
步骤S442:获取初始拟合曲线;
步骤S443:基于所述初始拟合曲线确定损失函数值;
步骤S444:判断所述损失函数值是否小于设定值;如果所述损失函数值小于设定值,则将所述初始拟合曲线作为最优拟合曲线;如果所述损失函数值大于或等于设定值,则更新所述初始拟合曲线中的斜率和偏移量,并将更新后的拟合曲线作为所述初始拟合曲线,并执行步骤S443。
4.根据权利要求1所述的字符偏移检测方法,其特征在于,所述基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果,具体包括:
步骤S51:基于所述最优拟合曲线进行字符垂直偏移分析;
步骤S511:计算所述中心点集合中各中心点到所述最优拟合曲线的距离,获得第一距离;
步骤S512:计算所述第一距离与所述矩形框的高度的比值,获得第一结果;
步骤S513:如果所述第一结果大于第二设定阈值;则说明该中心点对应的字符在垂直方向上相对于所述最优拟合曲线发生了偏移;
步骤S52:基于所述最优拟合曲线进行字符水平偏移分析;
步骤S521:将所述中心点集合中各中心点分别向所述最优拟合曲线作垂线,获得多个投影点;
步骤S522:确定所述起始投影点与所述终止投影点之间的距离,获得第二距离;
步骤S523:根据所述第二距离确定相邻两个投影点之间的预测距离;
步骤S524:确定相邻两个投影点之间的实际距离;
步骤S525:计算所述实际距离与所述预测距离的比值,获得第二结果;所述第二结果越偏离1,则该中心点对应的字符在水平方向上相对于所述最优拟合曲线发生的偏移概率越大;
步骤S53:基于所述最优拟合曲线进行字符大小偏差分析;
步骤S531:计算所述字符文本区域中各矩形框的面积,选取最大面积和最小面积;
步骤S532:将所述最大面积和所述最小面积进行比值,获得第三结果;如果所述第三结果大于或等于1.5,则说明存在字符大小的风格差异;如果所述第三结果小于1.5,则说明不存在字符大小的风格差异。
5.根据权利要求...
【专利技术属性】
技术研发人员:李泽超,李煌,唐金辉,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。