【技术实现步骤摘要】
一种适用于文本图像的图像对齐方法
[0001]本专利技术涉及图像处理
,具体提供一种适用于文本图像的图像对齐方法。
技术介绍
[0002]随着信息技术的普及,数字办公成为必然,数字信息具备的便捷、共享和快速检索的优势越来越显著。在日常生产工作中,海量的票据、文档等被积累下来,其中包括大量的图片数据,有效的对这些图片数据进行自动化的内容提取、结构化和入库归档,成为业界的诉求。
[0003]目前对于票据等具备特定格式的图像内容提取多基于模板和文字识别(OCR技术)的方式进行处理,此种方式依赖于准确的图像对齐技术,即:将待解析图像与模板图像进行对应位置对准,传统的对齐方式多基于特征点的方式,在实际应用中,手机拍摄的图像受拍摄环境的影响,存在着畸变、扭曲等问题,致使配对的特征点存在误差,难以得到理想的对齐效果。
技术实现思路
[0004]本专利技术是针对上述现有技术的不足,提供一种实用性强的适用于文本图像的图像对齐方法。
[0005]本专利技术解决其技术问题所采用的技术方案是:
[0006]一种适用于文本图像的图像对齐方法,首先,字段特征提取,分别提取模板图和待对齐图中的字段特征,其次,同义字段对齐,计算模板图与待对齐图中两两字段特征之间的相似度,定位模板图和带对齐图的同名同含义字段,得到配对的字段对,最后,精确配对位置对齐及配对点优选,进而完成图像对齐。
[0007]进一步的,在字段特征提取中,进一步包括:
[0008]S101、提取字段检测框在图像上的相对位置 ...
【技术保护点】
【技术特征摘要】
1.一种适用于文本图像的图像对齐方法,其特征在于,首先,字段特征提取,分别提取模板图和待对齐图中的字段特征,其次,同义字段对齐,计算模板图与待对齐图中两两字段特征之间的相似度,定位模板图和带对齐图的同名同含义字段,得到配对的字段对,最后,精确配对位置对齐及配对点优选,进而完成图像对齐。2.根据权利要求1所述的一种适用于文本图像的图像对齐方法,其特征在于,在字段特征提取中,进一步包括:S101、提取字段检测框在图像上的相对位置作为位置特征;S102、提取字段中文本内容作为内容特征;S103、提取字段邻域内文本框个数及内容作为领域特征。3.根据权利要求2所述的一种适用于文本图像的图像对齐方法,其特征在于,完成图像位置特征、内容特征和领域特征构建后,则图像的字段特征记为:F={f1,f2,...,f
n
},f
n
表示图像中第一个字段的特征,f
n
={text
pos
,text
rec
,text
nerb
},获得模板图和待对齐的字段特征,分别记为:f
temp
和f
eval
。4.根据权利要求2所述的一种适用于文本图像的图像对齐方法,其特征在于,在步骤S101中,文本框位置特征,记为text
pos
,由文本检测算法获取,通过文本检测算法,将获取图像中各个字段的文本包围框坐标;进一步的将包围框坐标转换为相对位置,将图像分为四个区域,左上、右上、右下、左下,分别记为[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1],相对位置表示当前坐标框在图像中所处的位置。5.根据权利要求2或4所述的一种适用于文本图像的图像对齐方法,其特征在于,在步骤S102中,文本框内容特征,记为text
rec
,由文本识别算法获取,其内容为文本框中的文字识别结果。6.根据权利要求5所述的一种适用于文本图像的图像对齐方法,其特征在于,在步骤S103中,邻域信息,记为text
nerb
,计算当前文本框邻域内文本框的个数及其文字信息,邻域定义为两个字段文本框之间的像素点个数。7.根据权利要求6所述的一种适用于文本图像的图像对齐方法,其特征在于,在同义字段对齐中,进一步包括:S201...
【专利技术属性】
技术研发人员:伊文超,朱利霞,李明明,
申请(专利权)人:浪潮云信息技术股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。