用于图像分类器训练的数据扩充制造技术

技术编号：35771123 阅读：19 留言：0更新日期：2022-12-01 14:12

提供了用于图像分类器训练的数据扩充。一种用于从输入图像x生成输出图像x

全部详细技术资料下载

【技术实现步骤摘要】
用于图像分类器训练的数据扩充

[0001]本专利技术涉及图像的自动生成，该图像尤其可以用于扩充图像分类器的训练数据集。

技术介绍

[0002]当车辆被操控穿过交通时，对车辆环境的光学观察是对于规划车辆下一步动作所需的信息的最重要来源。这适用于人类驾驶员以及用于至少部分自动驾驶的系统。后一种系统通常采用经训练的图像分类器，这些图像分类器将图像映射到关于它们包含哪些类型的对象的分类分数。
[0003]产品的几何形状和/或表面的光学检查是图像分类器的另一个重要应用领域。基于结果，产品可以被分配到一个或多个预定的质量类。在最简单的情况下，这是“OK”/“不OK = NOK”形式的二元分类。
[0004]图像分类器通常在标注有“基本真值（ground truth）”分类分数的训练图像上进行训练。训练的目的是图像分类器将训练图像映射到它们各自的“基本真值”分类分数。如果用具有足够可变性的足够大的训练图像集来执行训练，则可以预期图像分类器也正确地分类未看见的图像。训练图像的获得是训练过程最昂贵的部分。特别地，训练图像的标注是昂贵的，因为它频繁地涉及手动工作。

技术实现思路

[0005]本专利技术提供了一种用于从输入图像x生成输出图像x
g
的方法，给定的图像分类器将该输出图像x
g
分类为从给定分类的多个可用类中选择的目标类c
’
。
[0006]在该方法的过程中，输入图像x通过经训练的编码器网络被映射到潜在空间中的较低维度表示z。例如，该潜在...

【技术保护点】

【技术特征摘要】
1.一种用于从输入图像x生成输出图像x
g
的方法（100），给定图像分类器（3）将所述输出图像x
g
分类为从给定分类的多个可用类中选择的目标类c
’
，所述方法包括以下步骤：
•ꢀ
借助于经训练的编码器网络（1）将输入图像x映射（110）到潜在空间中的较低维度表示z；
•ꢀ
从给定分布中抽取（115）噪声样本n；和
•ꢀ
借助于经训练的生成器网络（2）将噪声样本n映射（120）到输出图像x
g
，其中该映射以目标类c
’
和表示z两者为条件。2.根据权利要求1所述的方法（100），其中使映射以表示z为条件包括：经训练的生成器网络（2）产生输出图像x
g
，经训练的编码器网络（1）将所述输出图像x
g
映射到表示z。3.根据权利要求1至2中任一项所述的方法（100），其中，噪声样本n到输出图像x
g
的映射（120）进一步包括：
•ꢀ
借助于给定的图像分类器（3），将输出图像x
g
映射（121）到分类分数c #；
•ꢀ
借助于给定的分类损失函数（L
C
）确定（122）分类分数c#与输出图像x
g
到目标类c
’
的分类多么好地相符；以及
•ꢀ
优化（123）到生成器网络（2）的至少一个输入，使得基于改变的输入对输出图像x
g
的重新计算有可能引起分类损失函数（L
C
）的值改进。4.根据权利要求1至3中任一项所述的方法（100），其中输入图像x被选择（105）为具有源类，从而使输出图像x
g
成为输入图像x的反事实图像。5.根据权利要求4所述的方法（100），进一步包括以下步骤：
•ꢀ
比较（130）反事实图像x
g
和输入图像x；和
•ꢀ
将其中反事实图像x
g
不同于输入图像x的区域（）确定（140）为相对于源类c和目标类c
’
之间的类边界而言有意义的区域（S）。6.根据权利要求5所述的方法（100），进一步包括以下步骤：
•ꢀ
借助于给定度量（4）来确定（150）相对于类边界而言有意义的区域（S）与输入图像x的包含被认为显著的输入图像x的特征的给定区域（S*）多么好地相符；以及
•ꢀ
将与由所述给定度量（4）输出的结果（4a）相称的分数（3a）归属（160）于图像分类器（3）。7.根据权利要求6所述的方法（100），进一步包括：优化（170）表征给定图像分类器（3）的行为的参数（3b），使得当重复方法（100）的先前步骤（120
‑
160）时，图像分类器（3）的分数（3a）有可能改进。8.根据权利要求1至7中任一项所述的方法（100），其中，输入图像x是在产品的光学检查过程中已经获取的制造产品的图像，并且给定分类的类表示产品的质量等级。9.根据权利要求1至7中任一项所述的方法（100），其中，输入图像x是交通情形的图像，并且给定分类的类表示与交通情形的解释相关的对象。10.一种用于训练编码器网络（1）和生成器网络（2）的组合的...

【专利技术属性】
技术研发人员：C，
申请(专利权)人：罗伯特，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人