当前位置: 首页 > 专利查询>罗伯特专利>正文

训练生成模型和判别模型制造技术

技术编号:27098271 阅读:26 留言:0更新日期:2021-01-25 18:38
公开了一种用于训练生成模型和判别模型的系统(100)。生成模型通过从潜在特征向量生成中间表示并从中间表示生成合成实例来从潜在特征向量生成合成实例。判别模型确定用于输入实例的多个部分的多个判别器得分,其指示部分是来自合成实例还是实际实例。通过反向传播来训练生成模型。在反向传播期间,基于用于合成实例的部分的判别器得分来更新损失相对于中间表示的条目的偏导数,其中至少部分基于中间表示的条目来生成合成实例的部分,并且其中如果判别器得分指示实际实例,则偏导数的值减小。小。小。

【技术实现步骤摘要】
训练生成模型和判别模型


[0001]本专利技术涉及用于训练生成模型和判别模型的系统,并且涉及对应的计算机实现的方法。本专利技术还涉及一种计算机可读介质,其包括用于执行生成模型和/或判别模型的方法和/或参数的指令。

技术介绍

[0002]当在机动车感知系统领域中应用机器学习模型时,主要挑战是训练和测试数据的可用性。例如,这样的数据可以包括图像数据和各种其他类型的传感器数据,其可以被融合以建立围绕车辆的360度视图。可用的这种数据越多,可以执行的训练和测试就越好。不幸的是,很难获得这样的数据。实际上,获得真实数据需要在实际交通情况下测试机动车感知系统。不仅在安装有这种系统的测试车辆周围驾驶是昂贵的,而且如果决策是基于还没有被充分训练的机动车感知系统,则也是危险的。此外,收集真实数据将需要收集各种参数的许多不同组合的数据,例如日光量、天气、交通量等。特别地,难以收集真实世界的数据,以执行对诸如接近碰撞的这种模型的极端情况的适当训练和测试。更一般地,在各种应用领域中,并且尤其是在将机器学习应用于传感器数据时,需要高效地获得真实的测试和训练数据。
[0003]在由I.Goodfellow等人(在https://arxiv.org/abs/1406.2661处可获得,并且通过引用并入本文)的"Generative Adversarial Networks"中提出了所谓的生成对抗网络(GAN)。这样的GAN包括用于生成合成数据的生成模型,该合成数据可以用于例如训练或测试另一机器学习模型。生成模型与判别模型同时被训练,该判别模型估计样本来自训练数据而不是生成器的概率。对生成模型进行训练以最大化判别模型犯错的概率,而对判别模型进行训练以最大化样本来自训练数据的估计概率的准确度。用生成对抗网络(GAN)已经达到了有希望的结果。例如,GAN已经被证明能够以高分辨率和足够的质量再现看起来自然的图像,以甚至欺骗人类观察者。
[0004]不幸的是,用于训练GAN的现有方法并不令人满意。与仅训练判别模型相比,训练判别模型连同生成模型通常更困难,例如,涉及不是一个而是两个主要组件,其在零和游戏中对抗地工作并且被训练以找到纳什均衡。例如,在各种情况下,在训练早期,判别模型可能在区分真实实例和合成实例方面非常好,以至于生成模型可能太难以生成令人信服的合成图像。例如,在各种情况下,已经观察到GAN的训练过程在训练过程中合理地提前卡住,其中生成模型关注于其未能取得进展的特定方面。然而,难以对此进行检测或校正:GAN训练过程的损失曲线不提供所生成的合成实例的质量的良好度量,并且由于生成器和判别器彼此依赖,所以难以解释组件的学习历史中的任何明显模式。这也降低了发生对生成器的有意义训练的置信度。

技术实现思路

[0005]根据本专利技术的第一方面,如权利要求1所限定的那样,提出了用于训练生成模型和
判别模型的系统。根据本专利技术的另一方面,如权利要求14所限定的那样,提出了用于训练生成模型和判别模型的计算机实现的方法。根据本专利技术的一个方面,如权利要求15所限定的那样,提供了计算机可读介质。
[0006]本专利技术的上述方面涉及训练生成模型以从潜在特征向量生成合成实例,以及训练判别模型以在合成实例和实际实例(例如图像、音频波形等)之间进行区分。训练过程可以涉及重复地训练判别模型以减少在实际实例和由生成模型生成的合成实例之间的区分的第一损失,并且训练生成模型以减少生成判别模型指示为实际实例的合成实例的第二损失。
[0007]令人感兴趣的是,判别模型可以被配置为确定用于输入实例的多个部分的多个判别器得分。用于输入实例的部分的这种判别器得分可以指示该部分是来自合成实例还是实际实例。例如,可以将共同的区分器应用于输入实例的相应部分,其中基于用于相应部分的判别器得分例如通过平均来确定用于总体输入实例的最终判别器得分。影响判别器得分的输入图像的部分可以被称为其接受域(receptive field)。优选地,相应判别器得分的接受域覆盖整体输入实例。在图像的情况下,可以通过以卷积方式将区分器应用于图像的相应区域来获得相应判别器得分。通常,输入实例的各部分是重叠的,例如,可以通过使用小于各部分大小的步幅(stride)将区分器卷积地应用于输入实例来获得判别器得分。在图像的上下文中,通过对图像的较小区域(称为"贴片")上的区分器的输出进行平均来获得判别器得分本身被认为是强制判别器仅对图像的局部结构进行建模的方式,例如参见P.Isola等人的"Image-to-Image Translation with Conditional Adversarial Networks"(在https://arxiv.org/abs/1611.07004处可获得,并且通过引用并入本文)。
[0008]然而,如本专利技术人所认识到的,用于输入实例的各部分的这种判别器得分不仅可以用于使最终判别器得分作为基础,而且可以用于获得关于训练过程的有用反馈。由于传统训练仅使用最终判别器得分,所以生成模型可以以广泛不受约束的方式潜在地更新其当前合成实例的所有部分,以使判别模型确信其已经产生真实样本。因此,利用传统方法,在进行正确的修改之前可能花费很长时间,所述正确的修改使得判别模型开始相信所生成的样本的真实性。
[0009]然而,令人感兴趣的是,判别器得分以比最终判别器得分高得多的细节水平提供对判别模型的评估的访问:判别器得分可以被认为是指示由判别模型进行分类的根本原因。本专利技术人认识到,可以利用该详细信息来改进生成模型的训练。实际上,如果用于合成实例的部分的判别器得分指示实际实例,则这可以指示生成器模型已经在生成合成实例的该部分方面表现良好。因此,可能有益的是,确保影响合成实例的该部分的生成模型的参数在训练期间比影响判别器不太确信是真实的合成实例的其他部分的生成模型的参数更新得更少。
[0010]因此,本专利技术人设计了一种将这种反馈并入训练过程中的方式。在各种情况下,生成模型通过从潜在特征向量生成中间表示并且从中间表示生成合成实例来从潜在特征向量生成合成实例。例如,如果生成模型包括具有用于连续地提炼(refine)合成实例的一个或多个卷积层的网络,则是这种情况。这种生成模型可以通过反向传播来训练,其中计算损失相对于中间表示的梯度,并且然后基于所计算的梯度来进一步反向传播损失。在传统方法中,这样的损失将大体上基于整体合成实例的总体判别器得分而不是基于其部分的任何
单独判别器得分。
[0011]然而,令人感兴趣的是,本专利技术人设计成基于用于合成实例的各部分的判别器得分来更新损失相对于生成模型的中间表示的梯度。具体来说,可以基于至少部分基于中间表示的条目而生成的合成实例的部分的判别器得分来更新损失相对于中间表示的条目的偏导数。例如,如果判别器得分指示实际实例,则偏导数的值可以减小,例如,与其先前值相比减小或者与其在判别器得分不指示实际实例的情况下获得的值相比减小。这样,与负责生成较不真实部分并且因此可能存在更多改进空间的生成模型的部分相比,可以阻止对负责生成合成图像的真实部分的生成模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于训练生成模型和判别模型的系统(100),其中,所述生成模型被配置为从潜在特征向量生成合成实例,并且所述判别模型被配置为确定用于输入实例的多个部分的多个判别器得分,用于所述输入实例的部分的判别器得分指示所述部分是来自合成实例还是实际实例,所述系统包括:
-ꢀ
数据接口(120),用于访问一组实际实例(030)以及所述生成模型的参数(041)和所述判别模型的参数(042);以及
-ꢀ
处理器(140),被配置为通过重复地训练所述判别模型以减少在所述实际实例与由所述生成模型生成的合成实例之间的区分的第一损失并且训练所述生成模型以减少生成所述判别模型指示为实际实例的合成实例的第二损失来学习所述生成模型和所述判别模型的参数,其中:
-ꢀ
所述生成模型被配置为通过从所述潜在特征向量生成中间表示并且从所述中间表示生成合成实例来从所述潜在特征向量生成合成实例;以及
-ꢀ
所述处理器子系统(140)被配置为通过反向传播从潜在特征向量生成的合成实例的所述第二损失来训练所述生成模型,其通过:
-ꢀ
使用所述判别模型来确定用于所述合成实例的所述多个部分的多个判别器得分;
-ꢀ
计算所述损失相对于所述中间表示的梯度,所述梯度包括所述损失相对于所述中间表示的条目的偏导数;
-ꢀ
基于用于所述合成实例的部分的判别器得分来更新所述损失相对于所述中间表示的条目的偏导数,其中所述合成实例的所述部分至少部分基于所述中间表示的所述条目而生成,并且其中,如果所述判别器得分指示实际实例,则所述偏导数的值减小;以及
-ꢀ
基于更新的梯度进一步反向传播所述损失。2.根据权利要求1所述的系统(100),其中,所述生成模型被配置为生成合成图像,并且所述判别器模型被配置为确定用于输入图像的各部分的判别器得分。3.根据前述权利要求中任一项所述的系统(100),其中,所述生成模型包括神经网络,所述处理器(140)被配置为通过所述神经网络的一个或多个卷积层从所述中间表示计算所述合成实例。4.根据权利要求3所述的系统(100),其中,所述处理器(140)被配置为在所述神经网络的层中计算所述中间表示,在所述层之前的层的数量大于或等于在所述层之后的层的数量。5.根据前述权利要求中任一项所述的系统(100),其中,所述判别模型包括神经网络,所述处理器(140)被配置为通过所述神经网络的卷积层基于所述合成实例中的相应接受域来计算相应判别器得分。6.根据前述权利要求中任一项所述的系统(100),其中,由所述判别模型确定的所述判别器得分形成第一数据体积,并且由所述生成模型生成的所述中间表示形成相应的第二数据体积,所述处理器(140)被配置为通过将所述判别器得分从第一体积缩放到相应的第二体积并且基于相应的缩放的判别器得分更新相应的偏导数来更新所述损失的所述梯度。7.根据权利要求6所述的系统(100),其中,所述处理器(140)被配置为通过计算原始偏导数和缩放的判别器得分的Hadamard乘积来基于相应的缩放的判别器得分更新相应的偏导数。
8.根据前述权利要求中任一项所述的系统(100),其中,所述损失函...

【专利技术属性】
技术研发人员:A
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1