训练潜在基于得分的生成模型制造技术

技术编号：36106306 阅读：51 留言：0更新日期：2022-12-28 14:07

本发明专利技术涉及训练潜在基于得分的生成模型。本发明专利技术的一个实施例阐述了一种用于训练生成模型的技术。该技术包括将训练数据集中包括的第一数据点转换成与基于得分的生成模型的基本分布相关联的第一组值。所述技术还包括：经由所述基于得分的生成模型来执行一个或更多个去噪操作以将所述第一组值转换成与潜在空间相关联的第一组潜在变量值。所述技术还包括执行一个或更多个额外操作以将所述第一组潜在变量值转换成第二数据点。最后，该技术包括基于第一数据点和第二数据点来计算一个或更多个损失并且基于该一个或更多个损失来生成经训练的生成模型，其中经训练的生成模型包括基于得分的生成模型。基于得分的生成模型。基于得分的生成模型。

全部详细技术资料下载

【技术实现步骤摘要】
训练潜在基于得分的生成模型
[0001]相关申请的交叉引用
[0002]本申请要求2021年6月8日提交并且具有序列号63/208，304的标题为“潜在空间中的基于得分的生成建模(SCORE
‑
BASED GENERATIVE MODELING IN LATENT SPACE)”的美国临时专利申请的权益。该相关申请的主题特此通过引用合并于本文。

[0003]本公开的实施例总体上涉及机器学习和计算机科学，并且更具体地涉及训练潜在基于得分的生成模型。

技术介绍

[0004]在机器学习中，生成模型通常包括被训练以生成新的数据实例的深度神经网络和/或其他类型的机器学习模型。例如，可以在包括大量猫的图像的训练数据集上训练生成模型。在训练期间，生成模型“学习”图像中描绘的各个猫的视觉属性。然后，生成模型可以使用这些学习的视觉属性来产生在训练数据集中未发现的猫的新图像。
[0005]基于得分的生成模型(SGM)是一种类型的生成模型。SGM通常包括正向扩散过程，其将输入数据逐渐干扰成在一系列时间步长上遵循特定噪声分布的噪声。SGM还包括反向去噪过程，所述反向去噪过程通过在不同的时间步长系列内将来自噪声分布的随机噪声迭代地转换成新数据来生成新数据。可通过反向正向扩散过程的时间步长来执行反向去噪过程。例如，正向扩散过程可以用于向猫的图像逐渐添加噪声，直到产生白噪声的图像。随后可使用反向去噪过程来从白噪声的图像逐渐去除噪声直到产生猫的图像为止。
[0006]SGM的操作可以使用称为随机微分...

【技术保护点】

【技术特征摘要】
1.一种用于训练生成模型的计算机实现的方法，所述方法包括：将训练数据集中包括的训练图像转换成与基于得分的生成模型的基本分布相关联的第一组值；经由所述基于得分的生成模型来执行一个或更多个去噪操作以将所述第一组值转换成与潜在空间相关联的第一组潜在变量值；执行一个或更多个额外操作以将所述第一组潜在变量值转换成输出图像；基于所述训练图像和所述输出图像计算一个或更多个损失；以及基于所述一个或更多个损失生成经训练的生成模型，其中所述经训练的生成模型包括所述基于得分的生成模型。2.根据权利要求1所述的计算机实现的方法，其中所述经训练的生成模型还包括将所述第一组潜在变量值转换成所述输出图像的解码器神经网络。3.根据权利要求1所述的计算机实现的方法，其中在操作中，所述经训练的生成模型将与所述基本分布相关联的第二组值转换成第二组潜在变量值，以生成在所述训练数据集中不包括的新图像。4.一种用于训练生成模型的计算机实现的方法，所述方法包括：将训练数据集中包括的第一数据点转换成与基于得分的生成模型的基本分布相关联的第一组值；经由所述基于得分的生成模型来执行一个或更多个去噪操作以将所述第一组值转换成与潜在空间相关联的第一组潜在变量值；执行一个或更多个额外操作以将所述第一组潜在变量值转换成第二数据点；基于所述第一数据点和所述第二数据点计算一个或更多个损失；以及基于所述一个或更多个损失生成经训练的生成模型，其中所述经训练的生成模型包括所述基于得分的生成模型。5.根据权利要求4所述的计算机实现的方法，其中将所述第一数据点转换成所述第一组值包括：经由编码器神经网络执行一个或更多个编码操作以将所述第一数据点转换成第二组潜在变量值；以及执行一个或更多个扩散操作以将所述第二组潜在变量值转换为所述第一组值。6.根据权利要求4所述的计算机实现的方法，其中执行所述一个或更多个额外操作包括：将解码器神经网络应用于所述第一组潜在变量值以产生所述第二数据点。7.根据权利要求4所述的计算机实现的方法，其中计算所述一个或更多个损失包括：计算与由所述基于得分的生成模型生成的所述第一组潜在变量值的第一分布和由编码器神经网络基于所述训练数据集生成的第二组潜在变量值的第二分布相关联的交叉熵损失。8.根据权利要求7所述的计算机实现的方法，其中计算所述交叉熵损失包括：从与所述交叉熵损失中包括的损失加权相关联的建议分布采样。9.根据权利要求8所述的计算机实现的方法，其中所述损失加权包括与所述潜在空间与所述基本分布之间的扩散过程相关联的扩散系数。10.根据权利要求7所述的计算机实现的方法，其中所述交叉熵损失包括与所述编码器神经网络相关联的第一损失加权和与所述基于得分的生成模型相关联的第二损失加权中
的至少一个。11.根据权利要求7所述的计算机实现的方法，其中生成所述经训练的生成模型包括：基于所述交叉熵...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：辉达公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人