基于对数似然性的图像生成模型制造技术

技术编号：33120693 阅读：12 留言：0更新日期：2022-04-17 00:19

提供了基于对数似然性的图像生成模型。本发明专利技术涉及一种训练图像生成模型的计算机实现的方法（700）。图像生成模型包括argmax变换，其被配置为计算离散索引特征，该离散索引特征指示具有极值的连续特征向量的特征的索引。使用对数似然性优化来训练图像生成模型。这涉及获得训练图像的索引特征值，根据argmax变换的随机逆变换，给定索引特征值对连续特征向量的值进行采样，以及基于随机逆变换在给定索引特征值的情况下生成连续特征向量的值的概率，确定argmax变换对于对数似然性的似然性贡献。argmax变换对于对数似然性的似然性贡献。argmax变换对于对数似然性的似然性贡献。

全部详细技术资料下载

【技术实现步骤摘要】
基于对数似然性的图像生成模型

[0001]本专利技术涉及一种训练图像生成模型的计算机实现的方法，以及对应的系统。本专利技术进一步涉及一种使用这样的经训练图像生成模型来生成图像和/或获得图像的一致性值的计算机实现的方法。本专利技术进一步涉及一种计算机可读介质。

技术介绍

[0002]对于许多现实世界的图像处理任务，机器学习是一种很有前途的技术。例如，为了基于（半）自主车辆在其中操作的环境的图像或视频数据来控制所述（半）自主车辆，可以使用图像分类模型（包括语义分割模型和对象检测模型）来分析图像或视频数据，其结果然后可以用于控制车辆（例如，在检测到危险交通情形的情况下执行制动）。通过基于训练数据自动学习如何最好地执行此类任务，而不是根据手动指定的算法执行任务，机器学习保持提供更好的准确性和对不同设置的适应性的允诺。基于机器学习的图像处理的其他应用领域包括制造（例如，以检测制造过程中的误差）和医学（例如，以标识身体部位或检测异常）。
[0003]实际上，在许多情况下，可用训练数据的量是对于基于机器学习的图像处理可以实现的准确性的限制因子。尤其是在自主驾驶中，但也在其他应用领域中，需要大量具有高度可变性的训练图像来取得足够准确的模型。这一点尤其正确，因为当使用机器学习模型的输出来做出影响现实世界的决策时，模型需要非常可靠和鲁棒。同时，收集现实世界的训练数据可能非常昂贵，或甚至是危险的，例如，当收集危险交通情形的数据时。
[0004]处置用于训练机器学习模型的训练数据缺乏的一种方式是要训练图像生成模型。给定训练数...

【技术保护点】

【技术特征摘要】
1.一种训练图像生成模型的计算机实现的方法（700），所述图像生成模型被配置为从潜在特征表示生成图像，所述方法包括：
‑
访问（710）表示图像生成模型的参数的模型数据，以及表示多个训练图像的训练数据集的训练数据；
‑
使用对数似然性优化来训练（730）图像生成模型，其中：
‑
所述训练包括选择（732）训练图像，并确定（734）根据图像生成模型生成的训练图像的对数似然性，
‑
图像生成模型包括被配置为从连续特征向量确定离散特征的变换，所述变换是被配置为计算离散索引特征的argmax变换，所述离散索引特征指示具有极值的连续特征向量的特征的索引，
‑
确定对数似然性包括获得（736）训练图像的索引特征值，根据argmax变换的随机逆变换，给定索引特征值对连续特征向量的值进行采样（737），以及基于随机逆变换在给定索引特征值的情况下生成连续特征向量的值的概率来确定（738）argmax变换对于对数似然性的似然性贡献；
‑
输出（740）经训练图像生成模型。2.根据权利要求1所述的方法（700），其中，随机逆变换由包括在图像生成模型的参数中的参数来参数化。3.根据权利要求2所述的方法（700），其中，给定索引特征值对连续特征向量的值进行采样包括对初始特征向量进行采样，并且基于索引特征值对初始特征向量应用单射变换以获得连续特征向量的值，所述单射变换被定义为使得索引特征指示具有极值的连续特征向量的特征的索引。4.根据权利要求3所述的方法（700），其中，应用单射变换包括将平滑阈值化函数应用于由索引特征指示的连续特征向量的特征，以使由索引特征指示的所述特征大于或小于连续特征向量的一个或多个值，和/或将平滑阈值化函数应用于连续特征向量的一个或多个其他值，以使所述一个或多个其他值小于或大于由索引特征指示的所述特征。5.根据权利要求2所述的方法（700），其中，给定索引特征值对连续特征向量的值进行采样包括：
‑
根据Gumbel分布对由索引特征指示的连续特征向量的值进行采样；和
‑
基于由索引特征指示的所述采样值，根据截断Gumbel分布，对未由索引特征指示的连续特征向量的值进行采样。6.根据任何前述权利要求所述的方法（700），其中索引特征对应于训练图像的特定像素。7.根据任何前述权利要求所述的方法（700），其中图像生成模型被配置为通过使用argmax变换计算多个相应的离散索引特征并组合所述多个离散索引特征来确定离散特征。8.一种使用经训练图像生成模型的计算机实现的方法（800），包括：
‑
访问（810）表示图像生成模型的参数的模型数据，所述图像生成模型包括被配置为从连续特征向量确定离散特征的变换，所述变换是argmax变换，其被配置为计算指示具有极值的连续特征向量的特征的索引的离散索引特征，所述图像生成模型已经在训练数据集上被训练，argmax变换的逆由随机逆变换近似；
‑
将图像生成模型应用（820）于潜在特征表示以获得生成的图像，和/或使用（830）图像生成模型来确定指示输入图像与训练数据集的一致性的一致性值，所述一致性值基于根据图像生成模型生成的输入图像的对...

【专利技术属性】
技术研发人员：E，
申请(专利权)人：罗伯特，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人