一种基于汉字图像轮廓特征描述的碑文修复方法,该方法属于计算机虚拟现实技术、机器视觉、图像处理领域,碑文修复所用的信息限定在同源碑文或者同一作者的书法作品中。在预处理过程中将碑文进行单字分割,并对提取的单字进行部件笔画分解。将这些获取的汉字部件和笔画组成一个部件笔画模板集合。在修复损坏汉字的过程中,首先提取损坏汉字的可信部分部件或笔画的结构信息和轮廓信息,利用结构匹配和轮廓段的部分对应,从构建的模板集合中搜索出相似度最高的模板作为损坏部分修复的信息源进行修复。本发明专利技术相比其它图像修复的方法,能够在较好的保持碑文原有风格的基础上恢复汉字缺损部分的结构信息和轮廓细节信息。
【技术实现步骤摘要】
本专利技术属于虚拟现实技术、计算机视觉与计算机图形学领域,具体地说是针对碑 文的图像修复的汉字部件笔画分解方法。
技术介绍
碑文数字化修复是图像修复的一个分支。目前在图像修复方面,前人做了大量的 工作。在图像修复领域的发展,根据图像修补的含义和修补的方式主要有两个方向。一是 从图像修补的含义本身出发,即对图像上细小噪声、不规则划痕的修复,这种情况一般采用 的是基于偏微分方程或变分方法来解决。基于变分问题的修复方法具有较充分的理论基 础,但是该方法的缺点是修复图像不自然,修复区域轮廓明显。用基于偏微分方程的方法来 修复图片上大面积的缺损区域时会产生模糊现象,所以该方法不适用于修补大面积的纹理 区域。二是针对于图片上大区域的缺失损坏,这类方法采用的是基于样本纹理的图像修补 方法和纹理生成技术,与方向一相比有效的避免了模糊现象的发生。利用图像的纹理信息 来引导纹理合成的过程,有效地提高了图像的修复质量,保持了图像结构纹理。而这种方 法的主要问题主要是在损坏区域的结构信息恢复上。为了解决这个问题前人提出了不少改 进的图像修复方法,如基于样例的图像修复方法,它利用受损区域周围信息的isophote方 向和发线方向为待修复区域块设置优先值,优先级大的部分将优先被修复,优先级小的像 素将押后修复,这些优先级记录在一张表中。在修复中通过不断的更新表中的各像素优先 级来引导修复的优先次序,以达到保持图像在该部分结构连续的目的。这种方法的缺点是 只能保持线性(如直线)结构,对于曲线结构效果难以人满意。基于结构传播(structure propagation)的图像修复方法是另一种注重结构修复的图像修复方法。在这种方法中,首 先由用户通过添加辅助线的方式指定图像中损坏区域周围结构在损坏区域延伸的方式,即 根据人的经验喜好等画出损坏区域的结构线。在辅助线指导下通过结构传播对损坏区域 内进行修复。建立图像集是另一个可以对结构进行修复的图像修复方法,通过在数以百万 的图像中匹配到和损坏图像可能相似的图像,然后利用该图像对应部分来填补图像损坏区 域。这种方法能够有效恢复原图像丢失部分,但是修复结构依赖于图像库。 针对于汉字图像(如书法,碑文等)来说,其修复特点是,注重结构信息和轮廓细 节的修复,而不强调纹理信息的修复。修复汉字的图像的重点在于恢复损坏部分结构信息, 汉字是经过二值化后的图像基于结构传播的方法不适合于二值图像,而基于汉字集方法的 难点在于书法作品有限和流传下来的碑文只有少量的可用样本,样本数量有限,在修复时 不一定能找到合适的汉字作为模板。
技术实现思路
本专利技术目的为了克服上述缺点,解决现有图像处理技术不能有效恢复碑文图像损 坏部分结构信息的缺点,提供,解决了针 对碑文图像难以恢复缺损区域结构和轮廓细节信息的缺点,较好解决了碑文图像不程序度 缺损的问题。 为了实现上述目的,本专利技术所采用的技术方案是:一种基于汉字图像轮廓特征描 述的碑文修复方法,其特征在于如下步骤: 步骤1、根据排列特点使用灰度直方图的方法进行碑文单列分割,对分割出的单列 再用灰度直方图统计出灰度分布规律分割出单个汉字。 步骤2、对步骤一中获得的单个汉字进行部件笔画分解,构建模板集合。 步骤3、对模板中的所有模板使用SC描述子进行描述,用于相似部件笔画的匹配 检索。 步骤4、修复碑文中损坏汉字时,针对汉字缺损的严重程度的不同分为基于部件的 修复和基于单个笔画的修复。对于一个汉字中某个部件的大部分区域缺损的情况。首先获 得损坏汉字部件的拓扑信息,通过拓扑即部件骨架采样点进行SC描述子描述。在步骤2中 提取到的部件集合基于SC算法的拓扑相似度度量,检索出相似度最高,即最有可能与缺损 部件相近的部件作为缺损区域修复的信息来源。对于只有某个笔画的局部受损的情况,先 对受损笔画的可信区域轮廓使用形状描述矩阵对其进行描述,对获取的笔画集合中的各笔 画也进行同样的表示。经过IS-Matching轮廓段匹配算法在笔画集合中检索出与缺损笔画 相似度最高的笔画作为笔画修复的信息来源。利用上述方法找到作为修复信息来源的模板 指导下完成汉字中损坏部分的修复。 相对于现有的其它技术相比本专利技术的优点在于:本专利技术针对的是碑文图像修复技 术,修复过程中了对汉字构型分析,通过部件,笔画多层次进行碑文汉字的修复。首先构建 模板集合,根据汉字缺损的不同程度进行分层次修复,同时涉及了汉字的结构信息和轮廓 细节信息。【附图说明】 图1是本专利技术基于汉字图像轮廓特征描述的碑文修复方法的过程示意图; 图2是本专利技术的汉字单字提取中的碑文列分割示意图; 图3是本专利技术的汉字单字提取中的碑文列分割出单字的示意图; 图4是本明的汉字修复中部件缺损修复流程图; 图5是本专利技术的汉字修复中笔画层次修复流程图; 图6是本专利技术的汉字修复结果展示。【具体实施方式】 如图1所示,本专利技术基于汉字图像轮廓特征描述的碑文修复方法采用如下步骤: 步骤一、碑文分割: (1)首先对碑文图像平滑后再进行二值化处理,在保留碑文中汉字边缘信息的基 础去除噪声。 (2)根据碑文书写过程是从上至下进行书写的,所以在竖直方向上是保持对齐的, 对预处理后的碑文在竖直方向上进行投影形成的直方图的波峰波谷比较明显,可以找到准 确的列分割位置,分割出单列。 (3)在分割出单列的基础上,对单列进行水平方向上投影,结构汉字的高宽的比例 约束,对分割过窄和过宽的情况进行调整,正确分割出单个汉字。 步骤二、部件和笔画分解: (1)笔画的分解。使用索引表细化算法对步骤一分割出的汉字进行细化得到骨架, 在大小为256的索引表的的指导下完成汉字图像的细化过程。细化得到的是单个像素宽 度的骨架。在细化过程中必须满足三个约束:1.内部点不能删除。2.直线端点不能删除。 3.如果点P是边界点,去掉P后,如果连通分量不增加,则P可以删除。经过细化得到汉字骨 架,这些骨架点的交叉点为分界点可以得到许多的笔画骨架段,对这些骨架段使用合并算 法进行合并可以得到完整笔画骨架。笔画的完整笔画骨架生成满足以下三个规则:1.两个 笔画骨架段相连接,2.两个笔画骨架段与目标笔画骨架段的角度差值小于给定阀值。3.合 并后得到的笔画骨架与目标笔画骨架的角度差小于给定阀值。获得完整的笔画骨架后,根 据骨架与轮廓的对应关系得到完整的笔画。 (2)构件的分解。通过边缘跟踪将目标轮廓采样点进行重新组织,得到链状的目标 轮廓用于部件分解。1.确定起始点。2.逆时针检测当前点的八领域中的下一个像素点并 更新当前点。3.重复上述两步直到跟踪结束。利用得到的具有链状形式的边缘点集,经过 最优组合原理得到输入汉字的骨架与目标部件的对应关系后,寻找轮廓点与骨架的对应关 系,将对应于部件骨架的轮廓点提取出来并在断开的位置连接,得到分割好的部件。 步骤三、基于拓扑结构匹配的部件选择和部分匹配的轮廓段配准: (1)拓扑描述与部件选择。对于部件缺损的情况,需要找到相近的部件,部件由多 个笔画组成,有各自的拓扑结构。对模板集合中的部件经过索引表细化算法,得到单像素宽 度的部件骨架,使用SC描述子对骨架采样点集进行描述,由公式以下统计出骨架点间的形 状直方图。 ^#{§ #Pi:(q~~1?) €bi本文档来自技高网...
【技术保护点】
一种基于汉字图像轮廓特征描述的碑文修复方法,其特征包括以下步骤:步骤1、根据碑文排列特点,通过灰度直方图将碑文图像中的书法字分别进行行列分割提取出单个汉字,对提取到的单字归一化处理;步骤2、对提取的单个字中未损坏汉字分解为汉字基本组成元素部件和笔画,将这些部件笔划组成一个集合,称之为模板集合,模板集合中保存各部件笔画的轮廓信息和骨架信息;步骤3、对模板中的所有模板使用形状上下文SC描述子进行描述,用于相似部件笔画的匹配检索;步骤4、碑文的修复分为两个分,对缺损严重的汉字在修复损坏汉字时,首先给定其损坏部件的拓扑信息,使用SC描述给定的拓扑信息;在模板集合中找出与该拓扑相似度最高的模板作为修复信息的来源;选择模板与缺损部件可信部分进行轮廓段匹配并修复;对于单字笔画损坏的汉字,使用形状描述矩阵对这些轮廓段进行形状描述,即建立用于表示轮廓各点之间关系的轮廓点与参考点间连线夹角的矩阵,然后采用部分轮廓匹配方法(IS‑Matching)在笔画模板集合中找到轮廓段的在模板笔画上的对应轮廓段,由这些对应轮廓段确定可能的相似笔画作为候选笔画;利用上述方法找到的与缺损区域最相近的模板指导下完成汉字中损坏部分的修复。...
【技术特征摘要】
【专利技术属性】
技术研发人员:梁晓辉,詹华年,景传杰,范啸海,孙林嘉,姜涵,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。