用于生成合成图像的级联聚类生成器网络制造技术

技术编号：32654180 阅读：10 留言：0更新日期：2022-03-17 11:01

用于生成合成图像的级联聚类生成器网络。用于训练聚类网络和生成器网络的组合的方法包括：

全部详细技术资料下载

【技术实现步骤摘要】
用于生成合成图像的级联聚类生成器网络
[0001]本专利技术涉及用于产生合成图像的生成器网络的对抗性训练，该合成图像尤其可以用于训练图像分类器。

技术介绍

[0002]图像分类器需要用训练图像来训练，对于所述训练图像，分类器应当分配给相应图像的“真实”分类分数是已知的。获得具有足够可变性的大训练图像集合是耗时且昂贵的。例如，如果图像分类器要对用由车辆携带的一个或多个传感器捕获的交通情形进行分类，则需要长的试驾来获得足够量的训练图像。对于训练所需的“真实”分类分数经常需要通过手动注释训练图像来获得，这也是耗时且昂贵的。此外，一些交通情形（诸如暴风雪）在训练图像的捕获期间仅鲜少发生。
[0003]为了缓解训练图像的不足，生成性对抗性网络（GAN）可以被训练以生成看起来像真图像的合成图像，并且可以被用作用于图像分类器的训练图像。条件GAN（cGAN）可以用于生成合成图像，所述合成图像属于逼真图像分布的某种模式。例如，条件GAN可以生成属于分类的特定类的合成图像。
[0004]DE 10 2018 204 494 B3公开了一种用于生成合成雷达信号作为分类器的训练材料的方法。

技术实现思路

[0005]本专利技术使用聚类网络和生成器网络的组合来产生合成图像。生成器网络有点类似于先前cGAN中的生成器那样工作，因为它被配置为将噪声样本和一些附加信息映射到合成图像。但与在cGAN中不同的是，该附加信息不是根据人类提供的分类的某个类标签或分类分数。而是，附加信息是所寻找的合成图像应属于的目标聚类的指示。聚类进而由聚类...

【技术保护点】

【技术特征摘要】
1.一种用于训练以下组合的方法（100）
·
聚类网络（C），其被配置为将输入图像（1）映射到潜在空间（Z）中的表示（2），其中该表示（2）指示输入图像（1）所属于的聚类（2a
‑
2c）；和
·
生成器网络（G），其被配置为将目标聚类（2a
‑
2c）的指示和噪声样本（3）映射到属于目标聚类（2a
‑
2c）的图像（4），所述方法（100）包括以下步骤：
·
提供（105）训练输入图像（1a）的集合；
·
由聚类网络（C）将训练输入图像（1a）映射（110）到指示训练输入图像（1a）所属于的聚类（2a
‑
2c）的表示（2）；
·
从随机分布中抽取（120）噪声样本（3）以及从由聚类网络（C）标识的聚类（2a
‑
2c）的集合中抽取（120）目标聚类（2a
‑
2c）的指示；
·
由生成器网络（G）将目标聚类（2a
‑
2c）的指示和噪声样本（3）映射（130）到伪图像（4），并且将每个伪图像（4）与用于产生它的目标聚类（2a
‑
2c）的指示组合（140），从而形成伪对（4 *）；
·
从训练输入图像（1a）的集合中抽取（150）真图像（1）；
·
将每个真图像（1）与聚类网络（C）分配给它的聚类（2a
‑
2c）的指示组合（160），从而形成真对（1 *）；
·
将真对（1*）和伪对（4*）的混合馈送（170）到鉴别器网络（D），所述鉴别器网络（D）被配置为区分真对（1*）和伪对（4 *）；
·
优化（180）表征鉴别器网络（D）的行为的参数（5），其目的是改进鉴别器网络（D）在真对（1*）和伪对（4*）之间进行区分所具有的准确度；以及
·
优化（190）表征聚类网络（C）的行为的参数（6）和表征生成器网络（G）的行为的参数（7），其目的是使所述准确度退化。2.根据权利要求1所述的方法（100），其中生成器网络（G）被附加地训练（191），其目的是伪图像（4）被聚类网络（C）映射到目标聚类（2a
‑
2c）的指示。3.根据权利要求1或2中任一项所述的方法（100），其中聚类网络（C）被附加地训练（192），其目的是聚类网络（C）将通过使输入图像（1）经受一个或多个预定干扰而已经获得的输入图像（1）的变换版本（1
’
）映射到指示输入图像（1）所属于的相同聚类（2a
‑
2c）的表示（2）。4.根据权利要求3所述的方法（100），其中，所述预定干扰包括：裁剪、颜色抖动和翻转中的一个或多个。5.根据权利要求3至4中任一项所述的方法（100），其中，聚类网络（C）被附加地训练（192a），其目的是最大化在一方面聚类网络（C）将输入图像（1）映射到的表示（2）与另一方面聚类网络（C）将输入图像（1）的变换版本（1
’
）映射到的表示（2）之间的互信息。6.根据权利要求1至5中任一项所述的方法（100），其中选择鉴别器网络（D），其对于输入到鉴别器网络（D）的一对（1*，4*）分离地输出，
·
一方面，包括在所述对（1*，4*）中的图像（1，4）是真图像（1）还是伪图像（4），以及
·
另一方面，所述对（1*，4*）作为一...

【专利技术属性】
技术研发人员：M，
申请(专利权)人：罗伯特，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人