图像的矫正方法、装置和计算机可读存储介质制造方法及图纸

技术编号:25951017 阅读:21 留言:0更新日期:2020-10-17 03:43
本公开涉及一种图像的矫正方法、装置和计算机可读存储介质,涉及计算机技术领域。该方法包括:确定模板图像中的字段信息及其对应的第一定位区域;对待处理图像进行文本识别,确定各文本信息;将字段信息与各文本信息进行匹配,确定与字段信息匹配的文本信息;根据匹配结果,在待处理图像中确定与第一定位区域匹配的第二定位区域;根据第一定位区域中各第一定位点与匹配的第二定位区域中各第二定位点的特征向量距离,确定各第一定位点和各第二定位点的对应关系;根据对应关系,计算透视变换矩阵用于对待处理图像进行矫正。

【技术实现步骤摘要】
图像的矫正方法、装置和计算机可读存储介质
本公开涉及计算机
,特别涉及一种图像的矫正方法、图像的矫正装置和计算机可读存储介质。
技术介绍
由于图片获取的环境和条件等影响,获取的图片可能存在变形的情况。因此,需要对获取的图片进行图像矫正。例如,OCR(OpticalCharacterRecognition,光学字符识别)技术中的自定义模版文字识别技术,可以对各种票据、卡证中的各字段及其对应数据进行提取。这种技术需要根据模板图片与获取的待识别图片上各区域的对应关系,对待识别图片中的文字进行识别。这就需要对待识别图片进行图像矫正。在相关技术中,在待识别图片的各定位点中,寻找模板图片的各定位点的对应点,从而完成图像矫正。
技术实现思路
本公开的专利技术人发现上述相关技术中存在如下问题:定位点的匹配成功率低,导致图像校正的性能差。鉴于此,本公开提出了一种图像的矫正技术方案,能够提高定位点的匹配成功率,从而提高图像矫正的性能。根据本公开的一些实施例,提供了一种图像的矫正方法,包括:确定模板图像中的字段信息及其对应的第一定位区域;对待处理图像进行文本识别,确定各文本信息;将字段信息与各文本信息进行匹配,确定与字段信息匹配的文本信息;根据匹配结果,在待处理图像中确定与第一定位区域匹配的第二定位区域;根据第一定位区域中各第一定位点与匹配的第二定位区域中各第二定位点的特征向量距离,确定各第一定位点和各第二定位点的对应关系;根据对应关系,计算透视变换矩阵用于对待处理图像进行矫正。<br>在一些实施例中,对待处理图像进行文本识别,确定各文本信息及其对应的第二定位区域包括:以待处理图像中的整行文本为识别单位,利用机器学习模型进行文本识别以确定各文本信息,机器学习模型能够根据整行文本中各字符的上下文关系进行文本识别。在一些实施例中,将字段信息与各文本信息进行匹配,确定与字段信息匹配的文本信息包括:根据字段信息与各文本信息的文本距离进行模糊匹配,确定与字段信息匹配的文本信息。在一些实施例中,根据字段信息与各文本信息的文本距离进行模糊匹配,确定与字段信息匹配的文本信息包括:计算字段信息与各文本信息的编辑距离;在编辑距离小于编辑阈值的情况下,将相应的文本信息确定为匹配的文本信息。在一些实施例中,确定各第一定位点和各第二定位点的对应关系包括:计算任一个第一定位点与各第二定位点之间的特征向量距离;根据各特征向量距离的排序,确定该第一定位点的对应第二定位点。在一些实施例中,根据各特征向量距离的排序,确定该第一定位点的对应第二定位点包括:在第二小的特征向量距离与第一小的特征向量距离之间的差异大于距离阈值的情况下,将第一小的特征向量距离对应的第二定位点确定为该第一定位点的对应第二定位点。在一些实施例中,该方法还包括:根据各第一定位点的分散程度,对透视变换矩阵进行评估;根据评估结果,确定是否重新选取各第一定位点用于重新计算透视变换矩阵。在一些实施例中,分散程度根据下面中的至少一项确定:根据各第一定位点的共线程度,确定各第一定位点的分散程度;根据以各第一定位点为顶点的多边形面积是否大于面积阈值,确定各第一定位点的分散程度。在一些实施例中,根据对应关系,计算透视变换矩阵包括:选取多对具有对应关系的第一定位点和第二定位点,计算透视变换矩阵。在一些实施例中,该方法还包括:将第一定位区域中未用于计算透视变换矩阵的各第一定位点确定为第一评估定位点;根据对应关系,在矫正后的待处理图像中确定与各第一评估定位点对应的第二评估定位点;根据各第一评估定位点与对应的第二评估定位点的位置差异,对透视变换矩阵进行评估;根据评估结果,确定是否对矫正后的待处理图进行重新矫正。根据本公开的另一些实施例,提供一种图像的矫正装置,包括:确定单元,用于确定模板图像中的字段信息及其对应的第一定位区域,对待处理图像进行文本识别,确定各文本信息,根据匹配结果,在待处理图像中确定与第一定位区域匹配的第二定位区域;匹配单元,用于将字段信息与各文本信息进行匹配,确定与字段信息匹配的文本信息;对应单元,用于根据第一定位区域中各第一定位点与匹配的第二定位区域中各第二定位点的特征向量距离,确定各第一定位点和各第二定位点的对应关系;计算单元,用于根据对应关系,计算透视变换矩阵用于对待处理图像进行矫正。在一些实施例中,确定单元以待处理图像中的整行文本为识别单位,利用机器学习模型进行文本识别以确定各文本信息,机器学习模型能够根据整行文本中各字符的上下文关系进行文本识别。在一些实施例中,匹配单元根据字段信息与各文本信息的文本距离进行模糊匹配,确定与字段信息匹配的文本信息。在一些实施例中,匹配单元计算字段信息与各文本信息的编辑距离;在编辑距离小于编辑阈值的情况下,将相应的文本信息确定为匹配的文本信息。在一些实施例中,对应单元计算任一个第一定位点与各第二定位点之间的特征向量距离;根据各特征向量距离的排序,确定该第一定位点的对应第二定位点。在一些实施例中,对应单元在第二小的特征向量距离与第一小的特征向量距离之间的差异大于距离阈值的情况下,将第一小的特征向量距离对应的第二定位点确定为该第一定位点的对应第二定位点。在一些实施例中,该装置还包括评估单元,用于根据各第一定位点的分散程度,对透视变换矩阵进行评估,以便根据评估结果,确定是否重新选取各第一定位点用于重新计算透视变换矩阵。在一些实施例中,计算单元选取多对具有对应关系的第一定位点和第二定位点,计算透视变换矩阵。在一些实施例中,评估单元,用于将第一定位区域中未用于计算透视变换矩阵的各第一定位点确定为第一评估定位点,根据对应关系,在矫正后的待处理图像中确定与各第一评估定位点对应的第二评估定位点,根据各第一评估定位点与对应的第二评估定位点的位置差异,对透视变换矩阵进行评估,以便根据评估结果,确定是否对矫正后的待处理图进行重新矫正。根据本公开的又一些实施例,提供一种图像的矫正装置,包括:存储器;和耦接至存储器的处理器,处理器被配置为基于存储在存储器装置中的指令,执行上述任一个实施例中的图像的矫正方法。根据本公开的再一些实施例,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一个实施例中的图像的矫正方法。在上述实施例中,根据字段信息与文本信息的匹配结果,在相应的区域进行定位点匹配。这样,可以准确地缩小对应定位点的匹配范围,提升匹配成功率,从而提高图像矫正的性能。附图说明构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。参照附图,根据下面的详细描述,可以更加清楚地理解本公开:图1示出本公开的图像的矫正方法的一些实施例的流程图;图2示出本公开的图像的矫正方法的另一些实施例的流程图;图3示出本公开的图像的矫正方法的一些实施例的示意图;图4示出本公开的图像的矫正装置的一些实施例的框图;本文档来自技高网...

【技术保护点】
1.一种图像的矫正方法,包括:/n确定模板图像中的字段信息及其对应的第一定位区域;/n对待处理图像进行文本识别,确定各文本信息;/n将所述字段信息与所述各文本信息进行匹配,确定与所述字段信息匹配的文本信息;/n根据匹配结果,在所述待处理图像中确定与所述第一定位区域匹配的第二定位区域;/n根据所述第一定位区域中各第一定位点与所述匹配的第二定位区域中各第二定位点的特征向量距离,确定所述各第一定位点和所述各第二定位点的对应关系;/n根据所述对应关系,计算透视变换矩阵用于对所述待处理图像进行矫正。/n

【技术特征摘要】
1.一种图像的矫正方法,包括:
确定模板图像中的字段信息及其对应的第一定位区域;
对待处理图像进行文本识别,确定各文本信息;
将所述字段信息与所述各文本信息进行匹配,确定与所述字段信息匹配的文本信息;
根据匹配结果,在所述待处理图像中确定与所述第一定位区域匹配的第二定位区域;
根据所述第一定位区域中各第一定位点与所述匹配的第二定位区域中各第二定位点的特征向量距离,确定所述各第一定位点和所述各第二定位点的对应关系;
根据所述对应关系,计算透视变换矩阵用于对所述待处理图像进行矫正。


2.根据权利要求1所述的矫正方法,其中,所述对待处理图像进行文本识别,确定各文本信息及其对应的第二定位区域包括:
以所述待处理图像中的整行文本为识别单位,利用机器学习模型进行文本识别以确定所述各文本信息,所述机器学习模型能够根据整行文本中各字符的上下文关系进行文本识别。


3.根据权利要求1所述的矫正方法,其中,所述将所述字段信息与所述各文本信息进行匹配,确定与所述字段信息匹配的文本信息包括:
根据所述字段信息与所述各文本信息的文本距离进行模糊匹配,确定与所述字段信息匹配的文本信息。


4.根据权利要求3所述的矫正方法,其中,所述根据所述字段信息与所述各文本信息的文本距离进行模糊匹配,确定与所述字段信息匹配的文本信息包括:
计算所述字段信息与所述各文本信息的编辑距离;
在编辑距离小于编辑阈值的情况下,将相应的文本信息确定为所述匹配的文本信息。


5.根据权利要求1所述的矫正方法,其中,所述确定所述各第一定位点和所述各第二定位点的对应关系包括:
计算任一个第一定位点与所述各第二定位点之间的特征向量距离;
根据各特征向量距离的排序,确定该第一定位点的对应第二定位点。


6.根据权利要求5所述的矫正方法,其中,所述根据各特征向量距离的排序,确定该第一定位点的对应第二定位点包括:
在第二小的特征向量距离与第一小的特征向量距离之间的差异大于距离阈值的情况下,将所述第一小的特征向量距离对应的第二定位点确定为该第一定位点的对应第二定位点。


7.根据权利要求1-6任一项所述的矫正方法,还包括:
根据各第一定位点的分散程度,对所述透视变换矩阵进行评估;
根据评估结果,确定是否重新选取各第一定位点用于重新计算透视变换矩阵。


8.根据权利要求7所述的矫正方法,其中,
所述分散程度根据下面中的至少一项确定:
根据所述各第一定位点的共线程度,确定所述各第一定位点的分散程度;

【专利技术属性】
技术研发人员:张建虎梅涛
申请(专利权)人:北京沃东天骏信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1