训练生成模型和判别模型制造技术

技术编号：27098271 阅读：26 留言：0更新日期：2021-01-25 18:38

公开了一种用于训练生成模型和判别模型的系统（100）。生成模型通过从潜在特征向量生成中间表示并从中间表示生成合成实例来从潜在特征向量生成合成实例。判别模型确定用于输入实例的多个部分的多个判别器得分，其指示部分是来自合成实例还是实际实例。通过反向传播来训练生成模型。在反向传播期间，基于用于合成实例的部分的判别器得分来更新损失相对于中间表示的条目的偏导数，其中至少部分基于中间表示的条目来生成合成实例的部分，并且其中如果判别器得分指示实际实例，则偏导数的值减小。小。小。

全部详细技术资料下载

【技术实现步骤摘要】
训练生成模型和判别模型

[0001]本专利技术涉及用于训练生成模型和判别模型的系统，并且涉及对应的计算机实现的方法。本专利技术还涉及一种计算机可读介质，其包括用于执行生成模型和/或判别模型的方法和/或参数的指令。

技术介绍

[0002]当在机动车感知系统领域中应用机器学习模型时，主要挑战是训练和测试数据的可用性。例如，这样的数据可以包括图像数据和各种其他类型的传感器数据，其可以被融合以建立围绕车辆的360度视图。可用的这种数据越多，可以执行的训练和测试就越好。不幸的是，很难获得这样的数据。实际上，获得真实数据需要在实际交通情况下测试机动车感知系统。不仅在安装有这种系统的测试车辆周围驾驶是昂贵的，而且如果决策是基于还没有被充分训练的机动车感知系统，则也是危险的。此外，收集真实数据将需要收集各种参数的许多不同组合的数据，例如日光量、天气、交通量等。特别地，难以收集真实世界的数据，以执行对诸如接近碰撞的这种模型的极端情况的适当训练和测试。更一般地，在各种应用领域中，并且尤其是在将机器学习应用于传感器数据时，需要高效地获得真实的测试和训练数据。
[0003]在由I.Goodfellow等人（在https：//arxiv.org/abs/1406.2661处可获得，并且通过引用并入本文）的"Generative Adversarial Networks"中提出了所谓的生成对抗网络（GAN）。这样的GAN包括用于生成合成数据的生成模型，该合成数据可以用于例如训练或测试另一机器学习模型。生成模型与判别模型同时被训练，该判别...

【技术保护点】

【技术特征摘要】
1.一种用于训练生成模型和判别模型的系统（100），其中，所述生成模型被配置为从潜在特征向量生成合成实例，并且所述判别模型被配置为确定用于输入实例的多个部分的多个判别器得分，用于所述输入实例的部分的判别器得分指示所述部分是来自合成实例还是实际实例，所述系统包括：
-ꢀ
数据接口（120），用于访问一组实际实例（030）以及所述生成模型的参数（041）和所述判别模型的参数（042）；以及
-ꢀ
处理器（140），被配置为通过重复地训练所述判别模型以减少在所述实际实例与由所述生成模型生成的合成实例之间的区分的第一损失并且训练所述生成模型以减少生成所述判别模型指示为实际实例的合成实例的第二损失来学习所述生成模型和所述判别模型的参数，其中：
-ꢀ
所述生成模型被配置为通过从所述潜在特征向量生成中间表示并且从所述中间表示生成合成实例来从所述潜在特征向量生成合成实例；以及
-ꢀ
所述处理器子系统（140）被配置为通过反向传播从潜在特征向量生成的合成实例的所述第二损失来训练所述生成模型，其通过：
-ꢀ
使用所述判别模型来确定用于所述合成实例的所述多个部分的多个判别器得分；
-ꢀ
计算所述损失相对于所述中间表示的梯度，所述梯度包括所述损失相对于所述中间表示的条目的偏导数；
-ꢀ
基于用于所述合成实例的部分的判别器得分来更新所述损失相对于所述中间表示的条目的偏导数，其中所述合成实例的所述部分至少部分基于所述中间表示的所述条目而生成，并且其中，如果所述判别器得分指示实际实例，则所述偏导数的值减小；以及
-ꢀ
基于更新的梯度进一步反向传播所述损失。2.根据权利要求1所述的系统（100），其中，所述生成模型被配置为生成合成图像，并且所述判别器模型被配置为确定用于输入图像的各部分的判别器得分。3.根据前述权利要求中任一项所述的系统（100），其中，所述生成模型包括神经网络，所述处理器（140）被配置为通过所述神经网络的一个或多个卷积层从所述中间表示计算所述合成实例。4.根据权利要求3所述的系统（100），其中，所述处理器（140）被配置为在所述神经网络的层中计算所述中间表示，在所述层之前的层的数量大于或等于在所述层之后的层的数量。5.根据前述权利要求中任一项所述的系统（100），其中，所述判别模型包括神经网络，所述处理器（140）被配置为通过所述神经网络的卷积层基于所述合成实例中的相应接受域来计算相应判别器得分。6.根据前述权利要求中任一项所述的系统（100），其中，由所述判别模型确定的所述判别器得分形成第一数据体积，并且由所述生成模型生成的所述中间表示形成相应的第二数据体积，所述处理器（140）被配置为通过将所述判别器得分从第一体积缩放到相应的第二体积并且基于相应的缩放的判别器得分更新相应的偏导数来更新所述损失的所述梯度。7.根据权利要求6所述的系统（100），其中，所述处理器（140）被配置为通过计算原始偏导数和缩放的判别器得分的Hadamard乘积来基于相应的缩放的判别器得分更新相应的偏导数。
8.根据前述权利要求中任一项所述的系统（100），其中，所述损失函...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：罗伯特，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人