本发明专利技术公开了一种融入FFT的综合评价的碎纸片纵横切拼接复原算法。首先通过对图像碎片进行编码,将其转化为灰度矩阵并对其进行二值化处理。利用FFT快速傅立叶变化,进行频域转化,进行频域分析。之后分成两种情况,对于中文,行的划分依据是汉字的中心纵坐标;对于英文,行的划分依据是字母的下端基线。然后,利用行匹配将所有的碎片行分类。利用FFT处理后边缘矩阵的互相关系数大小和直接匹配法的匹配成功率进行综合评价,用每个碎片的左右两个边分别与左右边缘的两边进行匹配,选取其中匹配度最高的完成匹配,重复直至完成行匹配。对其结果进行人工干预。之后进行间排序,此处依旧利用上述的综合评价法实现,之后对结果再进行一次人工检查与干预,完成碎片的复原。
【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种融入FFT的综合评价的碎纸片纵横切拼接复原算法。首先通过对图像碎片进行编码,将其转化为灰度矩阵并对其进行二值化处理。利用FFT快速傅立叶变化,进行频域转化,进行频域分析。之后分成两种情况,对于中文,行的划分依据是汉字的中心纵坐标;对于英文,行的划分依据是字母的下端基线。然后,利用行匹配将所有的碎片行分类。利用FFT处理后边缘矩阵的互相关系数大小和直接匹配法的匹配成功率进行综合评价,用每个碎片的左右两个边分别与左右边缘的两边进行匹配,选取其中匹配度最高的完成匹配,重复直至完成行匹配。对其结果进行人工干预。之后进行间排序,此处依旧利用上述的综合评价法实现,之后对结果再进行一次人工检查与干预,完成碎片的复原。【专利说明】融入FFT的综合评价法的碎纸片纵横切拼接复原算法
本专利技术主要运用于中英文图像拼接(文字拼接)领域,设计了一种融入FFT的综合评价的碎纸片纵横切拼接复原算法。
技术介绍
快速傅里叶变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅里叶变换的算法进行改进获得的。它对傅氏变换的理论并没有新的发现,但是对于在计算机系统或者说数字系统中应用离散傅立叶变换,可以说是进了一大步。快速傅氏变换算法可以运用到图像拼接的领域。
技术实现思路
单面印刷文字文件横纵切碎片的复原为了探寻两个相邻碎片间的关系,本算法将各个碎片编码后矩阵的边缘列进行FFT快速傅里叶变换,因为最终图片的最左边全为白色,所以首先可以得到原图最左边一列,再将该碎片的最右列和其他碎片的最左列逐一进行互相关系数的计算,得出一族互相关系数,选取其中结果最大的一列的碎片进行匹配,得到最终结果。傅里叶原理表明:任何连续测量的时序或信号,都可以表示为不同频率的正弦波信号的无限叠加。而根据该原理创立的傅里叶变换算法利用直接测量到的原始信号,以累加方式来计算该信号中不同正弦波信号的频率、振幅和相位。对于信号的分析,很多情况下仅依靠时域是远远不够的,很多时域上不好分析的信号转入频域的分析中,立即变得便于分析。本算法依据分析的需要,分别将每个灰度矩阵的左上角和右上角看作起点,将0-1 二值矩阵一列的取值看作y轴,将离散的点看作t轴,对其进行FFT处理。得到每个矩阵的边缘列的频谱。对它的特征进行提取,并分别计算它与其它碎纸片边缘的互相关系数,进行匹配。笔者认为,频谱特征接近,即互相关系数接近的两个碎纸片处在相邻的位置。单面印刷文字横纵切片的复原难度比仅有纵向切片文件的复原大很多,一方面在于碎纸片变多使得编程变得困难和程序运行速度变慢,另一方面在于纸片变小导致的信息变少从而使得匹配更易于发生错误。本算法阐述了研究过程中方案的探索和最终使用的方案的改进。本算法分别对中文和英文的处理方法进行了分析。本算法对于这种方案进行了分步处理。最后进行了一次人工干预,得到正确的结果。本算法在此对中英文两种情况进行分别讨论,不同特征。一、中文文件的复原本算法对于中文文件的复原主要经过行分类、综合评价体系的建立以及人工干预组成。其算法流程图如图1所示:(1)行分类①分类方案的选取首先,笔者经过观察发现,不是所有的标点都是全角的,所以不同行上面的字位置并不处在完全一样的列上。所以对于碎片的处理不能通过列分类而实现。之后,笔者经过观察发现,除去空行后,所有的碎片只有11种行的分布位置,所以可以先对它们进行行分类,之后再对于每一行类别的碎片进行相对位置的排序,即可恢复原文。观察事例图片,本算法发现文字的汉字大小几乎一致,对所有碎片中汉字的纵向高度进行统计,本算法发现汉字的纵向高度为38-41个像素,但是汉字的上下却往往并不对齐,所以本算法对于所有汉字纵向的中心点纵坐标进行了记录,根据这些纵坐标的位置,并设定一个像素的阈值,对所有碎纸片进行行分类。观察到事例图片中的行间距一致,而且大多数正规文件的行间距几乎一样宽,所以本算法首先假定图片中汉字的行间距一致,但是英文的行间距却并不完全一致,因此,本算法改变思路,转而去分析汉字高度。因为每个汉字的高度有一定的出入,而且汉字的底也不太相同,再加上部分形如“一”的文字存在,所以本算法的分析思路基于汉字的中心点。为了证明这种想法的合理性,本算法对所有汉字纵向坐标进行分析,发现同一行的汉字中心纵坐标处在阈值为1的区间内,所以用这种方法对汉字进行行分类可以得到较好的结果。②灰度矩阵的预处理每个汉字的大小不完全一样,一方面为了便于观察,另一方面为了减少部分形如“翁”之类的汉字中间空白部分的干扰。本算法首先对灰度矩阵进行预处理。因为本体首先,将灰度矩阵以RGB值128作为阈值,转化为0-1 二值矩阵。之后,对生成的矩阵进行扫描,从上到下并且横向进行,一旦在某一行中遇到有一个像素为黑色,便将整行变成黑色,直到结束为止。为了防止形如“翁”的字干扰后续检验。此时,再对矩阵进行检验,将宽度小于20像素的白线全部变成黑色。因为图片中的文本碎片均不含有噪音,所以噪音中黑点与白点的影响可以忽略不计。为了显示上述方法的处理效果,本算法选取一张原图与一张处理后的图片进行对t匕,为了使这种事例具有普遍性,本算法选取两个典型图进行师范,如图2、图3所示,其处理结果分别如图4,图5所示。经过对上述效果的观察,本预处理的效果十分明显,结果也很成功。③行分类的实施与结果本算法先确定两个边缘列的碎片项。之后,本算法对于预处理后的矩阵进行分析,统计出所有黑色部分的中心纵坐标大小,对其进行记录,并设定阈值为1,对其进行分类。对于结果分析可得,该分类与其差别较小,可以对其进行人工干预,将每行之间的先后顺序进行排列,本部分的任务完成。(2)基于FFT信号处理的互相关系数模型一种普遍的方法为:利用(1)中的图片编码方式,得出二值矩阵,首先利用碎片左侧的边缘找出最左边的一个碎片,之后将灰度矩阵它最右边一列分别与其他碎片最左边一列进行分别逻辑异或运算,并将所有结果进行求和,选取结果最大的一个碎片与其相连,但是这种方法的匹配成功率较低,所以本文采取了其他的方法。为了探寻两个相邻碎片间的关系,本算法将各个碎片编码后矩阵的边缘列进行FFT快速傅里叶变换,因为最终图片的最左边全为白色,所以首先可以得到原图最左边一列,再将该碎片的最右列和其他碎片的最左列逐一进行互相关系数的计算,得出一族互相关系数,选取其中结果最大的一列的碎片进行匹配,得到最终结果。傅里叶原理表明:任何连续测量的时序或信号,都可以表示为不同频率的正弦波信号的无限叠加。而根据该原理创立的傅里叶变换算法利用直接测量到的原始信号,以累加方式来计算该信号中不同正弦波信号的频率、振幅和相位。对于信号的分析,很多情况下仅依靠时域是远远不够的,很多时域上不好分析的信号转入频域的分析中,立即变得便于分析。本算法依据分析的需要,分别将每个灰度矩阵的左上角和右上角看作起点,将0-1 二值矩阵一列的取值看作y轴,将离散的点看作t轴,对其进行FFT处理。得到每个矩阵的边缘列的频谱。对它的特征进行提取,并分别计算它与其它碎纸片边缘的互相关系数,进行匹配。笔者认为,频谱特征接近,即互相关系数接近的两个碎纸片处在相邻的位置。(1)图片编码矩阵的FFT处理:①FFT快速傅里叶变换与DFT离散傅里叶本文档来自技高网...
【技术保护点】
一种融入FFT的综合评价的碎纸片纵横切拼接复原算法。
【技术特征摘要】
【专利技术属性】
技术研发人员:王浩,郑智隆,曹丹,邹孟霖,于思奇,孙翰斐,李子祺,张旭,余冬琪,
申请(专利权)人:王浩,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。