一种多风格字体生成方法技术

技术编号:31578478 阅读:18 留言:0更新日期:2021-12-25 11:20
本发明专利技术提出了一种基于StarGAN改进的多种风格字体生成方法,将由编码层、转换层和解码层的原始生成器网络结构替换为由Attention U

【技术实现步骤摘要】
一种多风格字体生成方法


[0001]本专利技术属于计算机图形处理
,尤其涉及生成对抗网络的图像生成
,具体涉及一种基于StarGAN改进的多种风格字体生成方法。

技术介绍

[0002]中国汉字字体数量庞大,结构复杂,每种字体的风格更是千差万别,设计统一风格的字体往往需要消耗大量的人力物力,因此,汉字的生成和字体风格的转换成为了近年来研究的热点问题。
[0003]中国书法历史悠久,书法艺术已成为中国传统文化的一项瑰宝,对于很多书法爱好者来说,收藏自己喜爱的书法家真品或者临摹喜爱的书法家风格的字体,已成为一种乐趣。当得不到他们喜爱的书法家真品以及临摹效果不好时,多风格汉字生成是解决多种书法字体生成潜在的一种重要途径。
[0004]字体识别( Optical Font Recognition )的目标是识别给定文本图像的字体,是自动文档分析和处理中一个重要且具有挑战性的主题,识别手写体或艺术字体的难度远大于识别印刷体,因为极其丰富的展现形式,每个人都写不同风格的文字。而一些手写字体和艺术字体的数据集也难以大量收集,导致字体识别的准确率不高。
[0005]生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,给解决汉字字体生成技术提供了新的研究角度和可行方案。自生成式对抗网络被提出来以后,越来越受到学术界和工业界的重视,不同于以往的生成模型,GANs 通过对抗训练来不断地拟合已有样本数据的分布,直至能够生成以假乱真的样本。这与汉字字体的生成过程相似,所以越来越多的研究者使用生成对抗网络来实现汉字字体生成算法并应用于数据增强。

技术实现思路

[0006]为了解决了汉字识别中数据集的缺失,提高字体识别的准确性,同时也为小样本领域以及数据迁移领域数量不足创造了条件。本专利技术提供了一种基于StarGAN 改进的多种风格字体生成方法,通过训练单个模型,学习多个字体域之间的映射,在数据集未配对的情况下一次性实现多种汉字风格的自动生成。
[0007]本专利技术解决其技术问题是通过以下技术方案实现的:一种基于StarGAN 改进的多种风格字体生成方法,包括以下步骤:步骤一:构建数据集,源字体数据集和目标字体数据集准备,并对每个数据集制定目标域标签;步骤二:构建生成对抗式网络,采用Attention U

NET和DenseNet两种特殊结构相结合作为生成器,判别器采用训练构并添加一个辅助分类器来提高GAN的性能,同时输出真假和类别;步骤三:构建模型的损失函数,利用印刷体字体图片、目标字体图片数据集依次输入到基于StarGAN改进的网络训练模型中,对模型进行训练、优化和调参,得到符合要求的
多风格字体生成网络;步骤四:将完整的印刷字体图片与目标域标签结合输入到训练后的生成网络中,由训练后的网络模型输出GB2312字库中相对应完整的目标字体;步骤五:对生成的目标字体图片进行质量评估,构建模型评级体系。
[0008]进一步的,步骤1中选取最常用的印刷体作为源字体,通过PC端自带的汉字字体文件数据ttf,采用PIL(Python Image Library)来生成字体图片,根据收集到的常用汉字来批量的提取照片。选取中文手写数据库中的手写汉字图像和一些常见的网络艺术字体构成目标字体数据集,取最常用的670个汉字。并且将数据集中的字体图片大小调整为255*255。在步骤4中,将完整的印刷字体图片输入到训练好的网络模型中,即可得到GB2312中完整的6763个目标风格字体。
[0009]进一步的,在步骤2中,采用Attention U

Net和DenseNet相结合的结构作为生成器,首先在U

Net模型的编码部分引入DenseNet网络结构,在借鉴跳跃连接的基础上建立不同层之间的连接关系,降低特征提取时的网络参数复杂度。将归一化后源字体图像经过编码器,由卷积核为3
×
3四部分Dense block提取相关字体特征,其中密集连接层的激活函数均采用修正线性单元ReLU,接着将每层的前后特征层特征图进行合并并重复利用。密集连接层后均有一层平移不变性的2
×
2最大下采样层(max pooling)以整合Dense block提取的字体特征;其次,在解码部分引入软注意模型,Attention U

NET是一种带有Soft Attention的U

Net结构,通过深层feature监督浅层feature实现Attention机制。为捕获足够多的字体特征图信息,在卷积神经网络体系中对特征映射网络进行上采样,Attention Gate添加到跳跃连接中,并且输出在上采样中添加到特征图。因此,Attention Gate的输入之一是跳跃连接中的输入,为相应层中下采样的特征图,而另一个输入是上采样中的上一层的特征图。Attention Gate模型在不相关的背景区中会逐渐抑制特征响应,而不需要在网络之间裁剪感兴趣区域(ROI),进而降低算法的计算复杂度,解决传统U

Net卷积网络对特征图“注意力分散”的现象。
[0010]所述判别器网络由6层卷积网络和2层全连接层网络组成,每一层卷积网络包含一个卷积层和一个Leaky

Relu激活函数。2个全连接层网络一个用于判断生成字体图片的真假性,另一个用于对字体图像的风格进行分类,使判别器同时具有判断和分类的功能。
[0011]所述模型先训练生成器G将输入字体图像x转换成目标域,将目标域标签记为c,G(x,c)y输出字体图像y。随机生成目标域标签c,让G更好的学习转换输入字体图像。另外,辅助分类器允许单个判别器控制多个域,判别器主要学习源域和目标域的标签分布,记为D:x{(x),(x)}。
[0012]为判断字体图片的真实性,引入双对抗损失定义式:生成器G通过输入源字体图像x和目标域标签c而输出目标字体图像,判别器D对生成的图片进行真假判断。此时生成器要最小化目标,而判别器要最大化目标。
[0013]判别器D上添加一个辅助分类器,在优化D和G的同时考虑优化判别器对真实字体的域分类损失。即用于优化D对真实字体图像的域分类损失和优化G对伪造字体图像的域分
类损失。前者定义式:最小化此目标函数,判别器D能正确分类真实字体图像x属于源域标签。
[0014]伪造字体图像的域分类的损失函数定义式:G 试图最小化该目标,并能正确分类生成字体图像属于目标域c。
[0015]为了保证转换的字体图像能够保留输入源字体图像的内容,引入循环一致性损失,定义式:采用范数作为重构损失。这里使用单个生成器两次,首先将原始字体图像转换为目标域中的字体图像,然后从转换后的字体图像重构原始字体图像。
[0016]最后优化生成器和判别器的目标函数,记为公式如下:记为公式如下:记为公式如下:和是超参数,控制域分类和循环一致性损失的相对性。
[0017]更进一步的,步骤3中使用Ada本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于StarGAN 改进的多种风格字体生成方法,其特征是,包括以下步骤:步骤一:构建数据集,源字体数据集和目标字体数据集准备,并对每个数据集制定目标域标签;步骤二:构建生成对抗式网络,采用Attention U

NET和DenseNet两种特殊结构相结合作为生成器,判别器采用训练构并添加一个辅助分类器来提高GAN的性能,同时输出真假和类别;步骤三:构建模型的损失函数,利用印刷体字体图片、目标字体图片数据集依次输入到基于StarGAN改进的网络训练模型中,对模型进行训练、优化和调参,得到符合要求的多风格字体生成网络;步骤四:将完整的印刷字体图片与目标域标签结合输入到训练后的生成网络中,由训练后的网络模型输出GB2312字库中相对应完整的目标字体;步骤五:对生成的目标字体图片进行质量评估,构建模型评级体系。2.根据权利要求1所述的基于StarGAN 改进的多种风格字体生成方法,其特征在于,选取最常用的印刷体作为源字体,通过PC端自带的汉字字体文件数据ttf,采用PIL(Python Image Library)来生成字体图片,根据收集到的常用汉字来批量的提取照片,选取中文手写数据库中的手写汉字图像和一些常见的网络艺术字体构成目标字体数据集,取最常用的670个汉字,并且将数据集中的字体图片大小调整为255*255;在步骤4中,将完整的印刷字体图片输入到训练好的网络模型中,即可得到GB2312中完整的6763个目标风格字体。3.根据权利要求1所述的基于StarGAN 改进的多种风格字体生成方法,其特征在于,采用Attention U

Net和DenseNet相结合的结构作为生成器,首先在U

Net模型的编码部分引入DenseNet网络结构,在借鉴跳跃连接的基础上建立不同层之间的连接关系,降低特征提取时的网络参数复杂度,将归一化后源字体图像经过编码器,由卷积核为3
×
3四部分Dense block提取相关字体特征,其中密集连接层的激活函数均采用修正线性单元ReLU,接着将每层的前后特征层特征图进行合并并重复利用,密集连接层后均有一层平移不变性的2
×
2最大下采样层(max pooling)以整合Dense block提取的字体特征;其次,在解码部分引入软注意模型,Attention U

NET是一种带有Soft Attention的U

Net结构,通过深层feature监督浅层feature实现Attention机制,为捕获足够多的字体特征图信息,在卷积神经网络体系中对特征映射网络进行上采样,Attention Gate添加到跳跃连接中,并且输出在上采样中添加到特征图,因此,Attention Gate的输入之一是跳跃连接中的输入,为相应层中下采样的特征图,而另一个输入是上采样中的上一层的特征图,Attention Gate模型在不相关的背景区中会逐渐抑制特征响应,而不需要在网络之间裁剪感兴趣区域(ROI),进而降低算法的计算复杂度,解决传统U

Net卷积网络对特征图“注意力分散”的现象,所述判别器网络由6层卷积网络和2层全连接层网络组成,每一层卷积网络包含一个卷积层和一个Leaky

【专利技术属性】
技术研发人员:徐向纮李金金
申请(专利权)人:中国计量大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1