基于生成对抗网络的书法图片生成方法技术

技术编号：28842187 阅读：31 留言：0更新日期：2021-06-11 23:41

本发明专利技术公开了一种基于生成对抗网络的书法图片生成方法：步骤1，裁剪整幅书法图像得到裁剪图片；步骤2，得到所有的裁剪图片及标注文件组成的数据集；步骤3，对数据集中的每张裁剪图片进行预处理；步骤4，使用步骤3得到的预处理后得到的数据集中的标准化后的裁剪图片、字的二值化图片和标注文件中的字的位置和大小信息计算损失函数，训练生成对抗网络，得到训练好的书法图片生成模型；步骤5，获得待生成书法图像的字的编码和附加信息；步骤6，得到生成的书法图片。实验结果表明，本发明专利技术的方法能够生成效果良好的书法图片，解决了现有技术中的书法图像修复工作中由于破损程度过大而无法修复的情况。

全部详细技术资料下载

【技术实现步骤摘要】
基于生成对抗网络的书法图片生成方法
本专利技术属于计算机图像处理
，涉及基于生成对抗网络的书法图片生成方法。
技术介绍
计算机视觉与图像处理发展到现阶段已经有了令人惊叹的研究成果，一些根据输入条件生成特定图像的问题也是研究人员经常关注的问题。在以往的工作中图像的生成通常使用变分自编码器，即提取图像的中的信息并将这些信息嵌入到一个将对较简单分布(通常是正太分布)的向量中，再将这个向量还原回图像，并计算还原后的图像与原始图像的差异值，更新网络中的参数减小这个差异以达到可以直接使用一个符合特定分布(正太分布)的向量直接生成图像。后来提出的基于GAN的图像生成方法有着更好的效果，我们较熟悉的模型有pix2pix可以使用成对的图片数据集训练模型，进行两种图片的转化，之后提出来的CycleGAN可以使用不同的数据集训练模型来完成两个域的图片进行相互转化。再之后的一些研究工作还包括从一局文字描述中生成符合文字描述的图片如StackGAN,StackGAN++等工作。但是，上述这些研究的局限性在于，文本和生成的图像只能包含一个对象，无法从包含位置关系的复杂文本中生成具有多个对象且对象之间符合文本所描述的位置关系的图像。因此，对于现今书法图像修复工作中因为破损程度过大而无法修复的情况，目前还未有有效的书法图片生成方法。
技术实现思路
针对现有技术存在的不足，本专利技术的目的在于，提供一种基于生成对抗网络的书法图片生成方法，用于解决现有技术中的书法图像修复工作中由于破损程度过大而无法修复的情况。...

【技术保护点】
1.一种基于生成对抗网络的书法图片生成方法，其特征在于，具体包括以下步骤：/n步骤1，采集整幅书法图像，并采用覆盖该书法图像高度的正方形窗口对其进行裁剪，得到多张裁剪图片；/n步骤2，对每张裁剪图片上的每个字构建一个外切矩形，获得每个字在裁剪图片上的相对位置和大小信息，并对每个字赋予唯一的编码及附加信息；将字的位置和大小信息、附加信息均与字的编码一一对应，得到每张裁剪图片的标注文件；所有的裁剪图片及标注文件组成数据集；/n步骤3，对步骤2得到的数据集中的每张裁剪图片进行预处理；具体包括如下操作：对步骤2得到的数据集中的每张裁剪图片统一尺寸和标准化，得到标准化后的裁剪图片，同时，对裁剪图片中每个字裁剪得到字的图片、将字的图片转为单通道图片并统一尺寸、二值化，得到的字的二值化图片；标准化后的裁剪图片、字的二值化图片和步骤2得到的数据集中的标注文件组成预处理后的数据集；/n步骤4，将步骤2得到的每个字的编码及附加信息进行词嵌入操作，得到该字的编码对应的向量和附加信息对应的向量，将这两个向量拼接后作为生成对抗网络的输入数据，使用步骤3得到的预处理后得到的数据集中的标准化后的裁剪图片、字的二值化...

【技术特征摘要】
1.一种基于生成对抗网络的书法图片生成方法，其特征在于，具体包括以下步骤：
步骤1，采集整幅书法图像，并采用覆盖该书法图像高度的正方形窗口对其进行裁剪，得到多张裁剪图片；
步骤2，对每张裁剪图片上的每个字构建一个外切矩形，获得每个字在裁剪图片上的相对位置和大小信息，并对每个字赋予唯一的编码及附加信息；将字的位置和大小信息、附加信息均与字的编码一一对应，得到每张裁剪图片的标注文件；所有的裁剪图片及标注文件组成数据集；
步骤3，对步骤2得到的数据集中的每张裁剪图片进行预处理；具体包括如下操作：对步骤2得到的数据集中的每张裁剪图片统一尺寸和标准化，得到标准化后的裁剪图片，同时，对裁剪图片中每个字裁剪得到字的图片、将字的图片转为单通道图片并统一尺寸、二值化，得到的字的二值化图片；标准化后的裁剪图片、字的二值化图片和步骤2得到的数据集中的标注文件组成预处理后的数据集；
步骤4，将步骤2得到的每个字的编码及附加信息进行词嵌入操作，得到该字的编码对应的向量和附加信息对应的向量，将这两个向量拼接后作为生成对抗网络的输入数据，使用步骤3得到的预处理后得到的数据集中的标准化后的裁剪图片、字的二值化图片和标注文件中的字的位置和大小信息计算损失函数，训练生成对抗网络，得到训练好的书法图片生成模型；
步骤5，获得待生成书法图像的字的编码和附加信息；
步骤6，将步骤5得到的待生成书法图像的字的编码和附加信息进行词嵌入操作，得到该字的编码对应的向量和附加信息对应的向量，将这两个向量作为输入数据，输入步骤4得到的训练好的书法图片生成模型，得到生成的书法图片。

2.如权利要求1所述的基于生成对抗网络的书法图片生成方法，其特征在于，所述步骤4中，所述生成对抗网络包括生成器和判别器；
所述生成器用于将输入的字的编码对应的向量和附加信息对应的向量生成书法图像，生成器包括书法字生成网络、书法字布局预测网络和高清化生成网络，其中，所述书法字生成网络用来将步骤2得到的每个字的编码对应的向量生成所对应的书法字的图片；书法字布局预测网络用来根据步骤4所述的两个向量，预测每个字在裁剪图片中相对位置和大小；高清化生成网络用于结合所述书法字生成网络生成的书法字的图片和所述书法字布局预测网络得到的字的相对位置和大小，生成一副与步骤2得到的裁剪图片对应的书法图像。
所述判别器包括对图片的判别器和对字的判别器，其中，所述对图片的判别器用于对生成器输出的书法图像进行真伪判别；对字的判别器用于对生成器输出的书...

【专利技术属性】
技术研发人员：赵珂，肖云，张钰婷，王选宏，肖刚，许鹏飞，刘宝英，王欣，陈晓江，
申请(专利权)人：西北大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人