一种图像风格转换网络及其转化方法技术

技术编号：40135213 阅读：14 留言：0更新日期：2024-01-23 22:45

本发明专利技术提供了一种图像风格转换网络及其转化方法，属于计算机科学技术领域，包括：内容编码器，用于将输入的内容图像编码成一个内容特征图；风格编码器，用于将输入的风格图像编码成一个风格特征向量；自注意力模块，用于根据内容特征图和风格特征向量生成一个注意力权重矩阵，该矩阵表示了内容特征图中各位置相关性；自适应实例归一化层，用于根据注意力权重矩阵和风格特征向量对内容特征图进行自适应实例归一化；解码器，用于将经过自适应实例归一化后内容特征图解码成具有目标风格的输出图像，本发明专利技术能够实现高效和实时的图像风格转换，无需每次重新优化，节省了计算资源和时间；且能够保证生成结果的质量和多样性，避免了失真或伪影等问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术主要涉及计算机科学，具体涉及一种图像风格转换网络及其转化方法。

技术介绍

1、图像风格转换是指将一张图像的风格(例如色彩、笔触、纹理等)转换成另一张图像的风格，同时保留原图像的内容(例如物体、场景、人物等)，这种技术可以用于创造新颖和有趣的艺术作品，或者增强和美化图像的视觉效果；早期的图像风格转换技术主要基于传统的图像处理方法，如滤波器、纹理合成、几何变换等，这些方法往往只能针对一种特定的风格或纹理类型，而且转换结果不够自然和协调，缺乏艺术感；

2、随着深度学习和卷积神经网络(cnn)的发展，基于神经网络的图像风格转换方法开始出现并引起了广泛的关注。这些方法的核心思想是利用cnn来提取图像的内容特征和风格特征，并通过优化算法或生成模型来合成具有目标风格的图像。

3、基于神经网络的图像风格转换方法可以分为两类：基于优化的方法和基于生成模型的方法：

4、基于优化的方法是指在给定一张内容图像和一张风格图像的情况下，通过迭代优化一个随机初始化的图像，使其同时最小化内容损失和风格损失，从而得到具有目标风格的图像。这类方法最早由gatys等人提出，并被称为神经风格迁移，这类方法可以生成高质量和多样化的风格转换结果，但每次生成都需要重新优化，计算代价高，速度慢，不适合实时应用；

5、基于生成模型的方法是指预先训练一个可以将任意内容图像转换成某种特定风格或多种风格的模型，通常是一个卷积神经网络或对抗生成网络(gan)，然后直接用该模型对输入图像进行前向传播，得到具有目标风格的图像。这类方

技术实现思路

1、本专利技术主要提供了一种图像风格转换网络及其转化方法用以解决上述
技术介绍
中提出的技术问题。

2、本专利技术解决上述技术问题采用的技术方案为：

3、一种图像风格转换网络，包括：

4、内容编码器，用于将输入的内容图像编码成一个内容特征图；

5、风格编码器，用于将输入的风格图像编码成一个风格特征向量；

6、自注意力模块，用于根据内容特征图和风格特征向量生成一个注意力权重矩阵，该矩阵表示了内容特征图中每个位置与其他位置之间的相关性；

7、自适应实例归一化层，用于根据注意力权重矩阵和风格特征向量对内容特征图进行自适应实例归一化，从而融合内容和风格信息；

8、解码器，用于将经过自适应实例归一化后的内容特征图解码成具有目标风格的输出图像。

9、进一步的，在本专利技术中，转换网络还包括：

10、判别器，用于判断输入的图像是真实的还是生成的，并给出相应的概率值。

11、进一步的，在本专利技术中，转换网络还包括：

12、条件生成对抗网络，用于作为训练框架，即在训练过程中，图像风格转换网络作为生成器，判别器作为对手，两者互相博弈。

13、进一步的，在本专利技术中，任一种上述的图像风格转换网络所使用的转化方法，包括以下步骤：

14、步骤一：将输入的内容图像设为xc，输入的风格图像设为xs，输出的具有目标风格的图像设为y，内容编码器设为ec，风格编码器设为es，自注意力模块设为s，自适应实例归一化层设为a，解码器为d，图像风格转换网络设为g，即生成器，判别器设为f；

15、步骤二：将内容图像xc通过内容编码器ec编码成内容特征图fc；

16、步骤三：将风格图像xs通过风格编码器es编码成风格特征向量fs；

17、步骤四：根据内容特征图fc和风格特征向量fs通过自注意力模块s生成注意力权重矩阵w；

18、步骤五：根据注意力权重矩阵w和风格特征向量fs对内容特征图fc进行自适应实例归一化得出内容特征图

19、步骤六：将输入的图像xc和风格图像xs通过判别器得到概率值p；

20、步骤七：将经过自适应实例归一化后的内容特征图通过解码器d解码成具有目标风格的输出图像y1；

21、步骤八：将输入的内容图像xc和风格图像xs通过图像风格转换网络或生成器得到输出图像y2。

22、进一步的，在本专利技术中，步骤二中的内容特征图fc的矩阵乘法公式为：fc＝ec(xc)；

23、步骤三中的风格特征向量fs的矩阵乘法公式为：fs＝es(xs)。

24、进一步的，在本专利技术中，转化方法的步骤四中的注意力权重矩阵w的矩阵乘法公式为w＝s(fc,fs)；

25、步骤五中的内容特征图的矩阵乘法公式为

26、进一步的，在本专利技术中，转化方法的步骤六中概率值p的矩阵乘法公式为：p＝f(xc,xs)。

27、进一步的，在本专利技术中，转化方法的步骤七中的输出图像y1的矩阵乘法公式为：

28、步骤八中的输出图像y2的矩阵乘法公式为：y2＝g(xc,xs)。

29、与现有技术相比，本专利技术的有益效果为：

30、本专利技术提出了一种基于自注意力机制和条件生成对抗网络的图像风格转换方法，该方法能够实现高效和实时的图像风格转换，同时保证生成结果的质量和多样性；同时引入了自注意力模块，该模块能够根据内容特征图和风格特征向量生成一个注意力权重矩阵，该矩阵表示了内容特征图中每个位置与其他位置之间的相关性，并根据风格图像进行调节，从而实现更加精细和协调的风格转换；以及引入了自适应实例归一化层，该层能够根据风格特征向量动态地调整内容特征图的统计分布，并保留内容特征图中的空间信息，从而实现更加自然和平滑的风格转换；同时采用了条件生成对抗网络作为训练框架，该框架能够利用判别器提供的反馈信息来优化生成器，并增强生成结果的真实性和多样性；

31、本专利技术能够实现高效和实时的图像风格转换，无需每次重新优化，节省了计算资源和时间；且能够保证生成结果的质量和多样性，避免了失真或伪影等问题，提高了用户的满意度和体验；以及能够捕捉内容图像中不同位置之间的长距离依赖关系，并根据风格图像调整注意力权重矩阵，从而实现更加精细和协调的风格转换，同时能够根据风格特征向量动态地调整内容特征图的统计分布，并保留内容特征图中的空间信息，从而实现更加自然和平滑的风格转换；最后能够利用判别器提供的反馈信息来优化生成器，并增强生成结果的真实性和多样性。

32、以下将结合附图与具体的实施例对本专利技术进行详细的解释说明。

本文档来自技高网...

【技术保护点】

1.一种图像风格转换网络，其特征在于，包括：

2.根据权利要求1所述的一种图像风格转换网络，其特征在于，还包括：

3.根据权利要求1所述的一种图像风格转换网络，其特征在于，还包括：

4.权利要求1-3所述的任一种图像风格转换网络所使用的转化方法，其特征在于，包括以下步骤：

5.根据权利要求4所述的一种图像风格转换网络的转化方法，其特征在于，步骤二中的内容特征图fc的矩阵乘法公式为：fc＝Ec(xc)；

6.根据权利要求4所述的一种图像风格转换网络的转化方法，其特征在于，步骤四中的注意力权重矩阵W的矩阵乘法公式为W＝S(fc,fs)；

7.根据权利要求4所述的一种图像风格转换网络的转化方法，其特征在于，步骤六中概率值p的矩阵乘法公式为：p＝F(xc,xs)。

8.根据权利要求4所述的一种图像风格转换网络的转化方法，其特征在于，步骤七中的输出图像y1的矩阵乘法公式为：步骤八中的输出图像y2的矩阵乘法公式为：y2＝G(xc,xs)。

【技术特征摘要】

1.一种图像风格转换网络，其特征在于，包括：

2.根据权利要求1所述的一种图像风格转换网络，其特征在于，还包括：

3.根据权利要求1所述的一种图像风格转换网络，其特征在于，还包括：

4.权利要求1-3所述的任一种图像风格转换网络所使用的转化方法，其特征在于，包括以下步骤：

5.根据权利要求4所述的一种图像风格转换网络的转化方法，其特征在于，步骤二中的内容特征图fc的矩阵乘法公式为：fc＝ec(xc)；

<...

【专利技术属性】
技术研发人员：柯峻涛，
申请(专利权)人：安徽信息工程学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人