一种字符偏移检测方法及系统技术方案

技术编号:25691272 阅读:35 留言:0更新日期:2020-09-18 21:02
本发明专利技术公开了一种字符偏移检测方法及系统,所述方法包括:获取文本图像;基于所述文本图像进行字符分离,获得字符文本区域;计算所述字符文本区域中各矩形框的中心点,获得中心点集合;基于所述中心点集合确定最优拟合曲线;基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果。所述系统包括获取模块、中心点集合确定模块、最优拟合曲线确定模块和偏移结果确定模块。本发明专利技术基于曲线拟合实现对字符偏移检测,提高检测的准确性。

【技术实现步骤摘要】
一种字符偏移检测方法及系统
本专利技术涉及计算机视觉
,特别是涉及一种字符偏移检测方法及系统。
技术介绍
文本是人类信息的重要载体,是人类生活中不可缺少的一部分,它广泛存在于各类生活场景中。近年来,随着数字媒体技术的发展,各类场景的图片已然成为了信息交流的主要载体。同时,根据图像中的文本信息对图像进行分析的需求越来越广泛。对于各类文本图像研究而言,现有的检测方法主要在于文本行的分析与研究,各类场景的文本检测基本止步于文本词条,主要任务是定位出一个文本行,但并未对字符进行分析。目前对字符分析也是极为重要的,特别是在各类表单中,印章或拓本的内容对整个表单信息将会产生极大的影响。对表单中印章类图像区域内的文本分布是存在一致性的,具体包括字体大小一致性及位置分布的一致性,分析该区域内的字符可以对这类图像的鉴伪提供有效的参考,但目前还没有具体技术方案公开如何对字符偏移进行分析。
技术实现思路
本专利技术的目的在于提供一种字符偏移检测方法及系统,以实现对字符偏移进行检测。实现本专利技术目的的技术解决方案为:一种字符偏移检测方法,所述方法包括:步骤S1:获取文本图像;步骤S2:基于所述文本图像进行字符分离,获得字符文本区域;步骤S3:计算所述字符文本区域中各矩形框的中心点,获得中心点集合;步骤S4:基于所述中心点集合确定最优拟合曲线;步骤S5:基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果。可选的,所述基于所述中心点集合确定最优拟合曲线,具体包括:步骤S41:从所述中心点集合中选取起始点、终止点和中间某一点;步骤S42:连接所述起始点和所述终止点获得第一直线,连接所述起始点和中间某一点获得第二直线;步骤S43:确定所述第一直线和所述第二直线之间的夹角余弦;步骤S44:基于所述夹角余弦寻找最优拟合曲线。可选的,所述基于所述夹角余弦寻找最优拟合曲线,具体包括:步骤S441:判断所述夹角余弦是否大于角度阈值;如果所述夹角余弦大于角度阈值,则说明某一字符所在位置相对整个文本区域发生了偏离,则执行“步骤S442”;如果所述夹角余弦小于或等于角度阈值,则将初始拟合曲线作为最优拟合曲线;步骤S442:获取初始拟合曲线;步骤S443:基于所述初始拟合曲线确定损失函数值;步骤S444:判断所述损失函数值是否小于设定值;如果所述损失函数值小于设定值,则将所述初始拟合曲线作为最优拟合曲线;如果所述损失函数值大于或等于设定值,则更新所述初始拟合曲线中的斜率和偏移量,并将更新后的拟合曲线作为所述初始拟合曲线,并执行“步骤S443”。可选的,所述基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果,具体包括:步骤S51:基于所述最优拟合曲线进行字符垂直偏移分析;步骤S52:基于所述最优拟合曲线进行字符水平偏移分析;步骤S53:基于所述最优拟合曲线进行字符大小偏差分析。可选的,所述基于所述最优拟合曲线进行字符垂直偏移分析,具体包括:步骤S511:计算所述中心点集合中各中心点到所述最优拟合曲线的距离,获得第一距离;步骤S522:计算所述第一距离与所述矩形框的高度的比值,获得第一结果;步骤S533:如果所述第一结果大于第二设定阈值;则说明该中心点对应的字符在垂直方向上相对于所述最优拟合曲线发生了偏移。可选的,所述基于所述最优拟合曲线进行字符水平偏移分析,具体包括:步骤S521:将所述中心点集合中各中心点分别向所述最优拟合曲线作垂线,获得多个投影点;步骤S522:确定所述起始投影点与所述终止投影点之间的距离,获得第二距离;步骤S523:根据所述第二距离确定相邻两个投影点之间的预测距离;步骤S524:确定相邻两个投影点之间的实际距离;步骤S525:计算所述实际距离与所述预测距离的比值,获得第二结果;所述第二结果越偏离1,则该中心点对应的字符在水平方向上相对于所述最优拟合曲线发生的偏移概率越大。可选的,所述基于所述最优拟合曲线进行字符大小偏差分析,具体包括:步骤S531:计算所述字符文本区域中各矩形框的面积,选取最大面积和最小面积;步骤S532:将所述最大面积和所述最小面积进行比值,获得第三结果;如果所述第三结果大于或等于1.5,则说明存在字符大小的风格差异;如果所述第三结果小于1.5,则说明不存在字符大小的风格差异。本专利技术还提供一种字符偏移检测系统,所述系统包括:获取模块,用于获取文本图像;字符文本区域确定模块,用于基于所述文本图像进行字符分离,获得字符文本区域;中心点集合确定模块,用于计算所述字符文本区域中各矩形框的中心点,获得中心点集合;最优拟合曲线确定模块,用于基于所述中心点集合确定最优拟合曲线;偏移结果确定模块,用于基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果。可选的,所述最优拟合曲线确定模块,具体包括:选取单元,用于从所述中心点集合中选取起始点、终止点和中间某一点;直线确定单元,用于连接所述起始点和所述终止点获得第一直线,连接所述起始点和中间某一点获得第二直线;夹角余弦确定单元,用于确定所述第一直线和所述第二直线之间的夹角余弦;最优拟合曲线确定单元,用于基于所述夹角余弦寻找最优拟合曲线。可选的,所述最优拟合曲线确定单元,具体包括:第一判断子单元,用于判断所述夹角余弦是否大于角度阈值;如果所述夹角余弦大于角度阈值,则说明某一字符所在位置相对整个文本区域发生了偏离,则执行“获取子单元”;如果所述夹角余弦小于或等于角度阈值,则将初始拟合曲线作为最优拟合曲线;获取子单元,用于获取初始拟合曲线;损失函数值确定子单元,基于所述初始拟合曲线确定损失函数值;第二判断子单元,用于判断所述损失函数值是否小于设定值;如果所述损失函数值小于设定值,则将所述初始拟合曲线作为最优拟合曲线;如果所述损失函数值大于或等于设定值,则更新所述初始拟合曲线中的斜率和偏移量,并将更新后的拟合曲线作为所述初始拟合曲线,并执行“损失函数值确定子单元”。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:相较于传统的文本行的整体分析,本专利技术更着重于文本内字符的相关信息的分析;通过对文本图像内的字符的定位分析,细化了文本内部的相关信息,对文本行的区分及字符的区分起到了更为有利的作用。另一方面,基于曲线拟合实现了对字符的偏移检测,提高了检测的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例字符偏移检测方法流程图。图2为本专利技术实施例字符偏本文档来自技高网...

【技术保护点】
1.一种字符偏移检测方法,其特征在于,所述方法包括:/n步骤S1:获取文本图像;/n步骤S2:基于所述文本图像进行字符分离,获得字符文本区域;/n步骤S3:计算所述字符文本区域中各矩形框的中心点,获得中心点集合;/n步骤S4:基于所述中心点集合确定最优拟合曲线;/n步骤S5:基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果。/n

【技术特征摘要】
1.一种字符偏移检测方法,其特征在于,所述方法包括:
步骤S1:获取文本图像;
步骤S2:基于所述文本图像进行字符分离,获得字符文本区域;
步骤S3:计算所述字符文本区域中各矩形框的中心点,获得中心点集合;
步骤S4:基于所述中心点集合确定最优拟合曲线;
步骤S5:基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果。


2.根据权利要求1所述的字符偏移检测方法,其特征在于,所述基于所述中心点集合确定最优拟合曲线,具体包括:
步骤S41:从所述中心点集合中选取起始点、终止点和中间某一点;
步骤S42:连接所述起始点和所述终止点获得第一直线,连接所述起始点和中间某一点获得第二直线;
步骤S43:确定所述第一直线和所述第二直线之间的夹角余弦;
步骤S44:基于所述夹角余弦寻找最优拟合曲线;
步骤S45:求取起始点、终止点和中间某一点分别到所述最优拟合曲线的距离,并选取距离最大值对应的点为特异点。


3.根据权利要求2所述的字符偏移检测方法,其特征在于,所述基于所述夹角余弦寻找最优拟合曲线,具体包括:
步骤S441:判断所述夹角余弦是否大于角度阈值;如果所述夹角余弦大于角度阈值,则说明某一字符所在位置相对整个文本区域发生了偏离,则执行步骤S442;如果所述夹角余弦小于或等于角度阈值,则将初始拟合曲线作为最优拟合曲线;
步骤S442:获取初始拟合曲线;
步骤S443:基于所述初始拟合曲线确定损失函数值;
步骤S444:判断所述损失函数值是否小于设定值;如果所述损失函数值小于设定值,则将所述初始拟合曲线作为最优拟合曲线;如果所述损失函数值大于或等于设定值,则更新所述初始拟合曲线中的斜率和偏移量,并将更新后的拟合曲线作为所述初始拟合曲线,并执行步骤S443。


4.根据权利要求1所述的字符偏移检测方法,其特征在于,所述基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果,具体包括:
步骤S51:基于所述最优拟合曲线进行字符垂直偏移分析;
步骤S511:计算所述中心点集合中各中心点到所述最优拟合曲线的距离,获得第一距离;
步骤S512:计算所述第一距离与所述矩形框的高度的比值,获得第一结果;
步骤S513:如果所述第一结果大于第二设定阈值;则说明该中心点对应的字符在垂直方向上相对于所述最优拟合曲线发生了偏移;
步骤S52:基于所述最优拟合曲线进行字符水平偏移分析;
步骤S521:将所述中心点集合中各中心点分别向所述最优拟合曲线作垂线,获得多个投影点;
步骤S522:确定所述起始投影点与所述终止投影点之间的距离,获得第二距离;
步骤S523:根据所述第二距离确定相邻两个投影点之间的预测距离;
步骤S524:确定相邻两个投影点之间的实际距离;
步骤S525:计算所述实际距离与所述预测距离的比值,获得第二结果;所述第二结果越偏离1,则该中心点对应的字符在水平方向上相对于所述最优拟合曲线发生的偏移概率越大;
步骤S53:基于所述最优拟合曲线进行字符大小偏差分析;
步骤S531:计算所述字符文本区域中各矩形框的面积,选取最大面积和最小面积;
步骤S532:将所述最大面积和所述最小面积进行比值,获得第三结果;如果所述第三结果大于或等于1.5,则说明存在字符大小的风格差异;如果所述第三结果小于1.5,则说明不存在字符大小的风格差异。


5.根据权利要求...

【专利技术属性】
技术研发人员:李泽超李煌唐金辉
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1