一种基于逐步逆扩散生成式对抗神经网络的图像生成方法技术

技术编号:39821182 阅读:8 留言:0更新日期:2023-12-22 19:40
本发明专利技术公开了一种基于逐步逆扩散生成式对抗神经网络的图像生成方法,采用生成式对抗网络

【技术实现步骤摘要】
一种基于逐步逆扩散生成式对抗神经网络的图像生成方法


[0001]本专利技术属于计算机视觉
,具体涉及一种基于逐步逆扩散生成式对抗神经网络的图像生成方法的设计


技术介绍

[0002]在现有技术的图像生成方法中,主要有生成式对抗网络
(Generative adversarialNetworks

GAN)、PixelRNN、VAE、
正则流

自回归模型

扩散模型
(Diffusion Models

DM)
等方法

其中
GAN
是主要生成图像的方式之一,它由一个生成器和一个判别器组成,生成器负责将随机噪声转化为图像,判别器则用以判断生成的图像真实与否

通过不断训练生成器和判别器,使生成器能够生成接近真实的图像以欺骗判别器

[0003]现有图像生成方法存在以下缺陷:
(1)
对于变分自编码器
VAE
,它生成图像的质量有所欠缺
。(2)
对于生成式对抗网络
GAN
,它会产生模式坍塌,即生成图像单一,不具备多样性
。(3)
对于扩散模型
DM
,它生成图像的采样效率低下


技术实现思路

[0004]本专利技术的目的是为了解决现有图像生成方法采样速率低下的问题,提出了一种基于逐步逆扩散生成式对抗神经网络的图像生成方法,在提高采样速率的前提下保持扩散模型生成图像质量高,种类多的优点

[0005]本专利技术的技术方案为:一种基于逐步逆扩散生成式对抗神经网络的图像生成方法,包括以下步骤:
[0006]S1、
对原始图像
x0=
{x
(1)
,x
(2)
,...,x
(m)
}
进行逐步加噪,得到高斯噪声图像
x
T

{x
T(1)
,x
T(2)
,...,x
T(m)
}

m
表示原始图像大小

[0007]S2、
设置跨度
n

1,2,...,N
将逆扩散划分为
N
个区域

[0008]S3、
将图像
x
T
,x
T(N

1)/N,...,x0分别输入到生成式对抗神经网络
GAN
中进行训练,得到训练好的
GAN。
[0009]S4、
通过训练好的
GAN
采用逆扩散的方式将高斯噪声图像
x
T
还原成原始图像
x0。
[0010]进一步地,步骤
S1
中对原始图像进行逐步加噪的公式为:
[0011][0012]其中
x
t
为加噪
t
步之后的图像,
t

1,2,3,...,T

T
为人工参数,使得
x
T

{x
T(1)
,x
T(2)
,...,x
T(m)
}
服从高斯分布,为超参数且
ε
为服从标准正态分布的参数

[0013]进一步地,步骤
S2
中的区域数量
N
满足:
[0014]TmodN
=0[0015]其中
mod
表示求余运算

[0016]进一步地,步骤
S3
包括以下分步骤:
[0017]S31、
将图像
x
T
,x
T(N

1)/N,...,x0分别输入到生成式对抗神经网络
GAN


[0018]S32、
将噪声图像
x
nT/N
输入生成器
G
,得到图像
G(x
nT/N
)。
[0019]S33、
通过判别器
D
判断图像
G(x
nT/N
)

x
T(n

1)/N
是否为真实图片

[0020]S34、
重复步骤
S32

S33
直到生成器
G
和判别器
D
收敛,得到训练好的
GAN。
[0021]进一步地,步骤
S34
中生成器
G
和判别器
D
收敛的条件为:判别器
D
认为生成器
G
生成的图像和真实图像一致

[0022]进一步地,步骤
S4
包括以下分步骤:
[0023]S41、
将高斯噪声图像
x
T
输入训练好的
GAN
中的生成器
G
,得到图像
G(x
T
)。
[0024]S42、
根据图像
G(x
T
)
得到逆扩散过程中的图像
x
T(N

1)/N

[0025]S43、
将图像
x
iT/N
输入训练好的
GAN
中的生成器
G
,得到图像
G(x
iT/N
)
,其中
i

1,2,...,N

1。
[0026]S44、
根据图像
G(x
iT/N
)
得到逆扩散过程中的图像
x
T(i

1)/N

[0027]S45、
重复步骤
S43

S44
,逐步还原得到原始图像
x0。
[0028]本专利技术的有益效果是:本专利技术基于逐步逆扩散生成式对抗神经网络生成图像,保留了扩散模型的多步扩散,因此相比基于生成式对抗神经网络
GAN
的图像生成方法具有更好的生成质量以及多样性,同时简化了扩散模型中逆扩散的步骤数,因此相比基于扩散模型的图像生成方法具有更快速的采样效率

附图说明
[0029]图1所示为本专利技术实施例提供的一种基于逐步逆扩散生成式对抗本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于逐步逆扩散生成式对抗神经网络的图像生成方法,其特征在于,包括以下步骤:
S1、
对原始图像
x0=
{x
(1)
,x
(2)
,...,x
(m)
}
进行逐步加噪,得到高斯噪声图像
x
T

{x
T(1)
,x
T(2)
,...,x
T(m)
}

m
表示原始图像大小;
S2、
设置跨度
n

1,2,...,N
将逆扩散划分为
N
个区域;
S3、
将图像
x
T
,x
T(N

1)/N
,...,x0分别输入到生成式对抗神经网络
GAN
中进行训练,得到训练好的
GAN

S4、
通过训练好的
GAN
采用逆扩散的方式将高斯噪声图像
x
T
还原成原始图像
x0。2.
根据权利要求1所述的图像生成方法,其特征在于,所述步骤
S1
中对原始图像进行逐步加噪的公式为:其中
x
t
为加噪
t
步之后的图像,
t

1,2,3,...,T

T
为人工参数,使得
x
T

{x
T(1)
,x
T(2)
,...,x
T(m)
}
服从高斯分布,为超参数且
ε
为服从标准正态分布的参数
。3.
根据权利要求2所述的图像生成方法,其特征在于,所述步骤
S2
中的区域数量
N
满足:
T mod N
=0其中
mod
表示求余运算
。4.
根据权利要求1所述的图像生成方法,其特征在于,所述步骤
S3
包括以下分步骤:
S31、
将图像
x
T
,x
T(N

1)/N

【专利技术属性】
技术研发人员:刘书舟佘堃于钥王玥洋
申请(专利权)人:电子科技大学长三角研究院湖州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1