引入了用于使用对抗自编码器(12,14,16)检测第一图像数据集当中的异常图像的方法。在第一训练中利用图像训练数据集(11)来训练对抗自编码器(12,14,16),而优化对抗自编码器(12,14,16)使得图像训练数据集(11)的图像的潜在表示(13)的分布接近预定先验分布(17),并且最小化图像训练数据集的重构图像(15)的重构误差。在对对抗自编码器(12,14,16)的第一训练之后,在潜在表示(13)中检测异常,并且在第二训练中利用图像训练数据集(11)但是把检测到的异常考虑在内来训练对抗自编码器(12,14,16)。由经训练的对抗自编码器(12,14,16)取决于图像的重构误差和预定先验分布(17)下的概率密度中的至少一个来检测第一图像数据集当中的异常图像。
A Method of Detecting Abnormal Images in the First Image Data Set by Countermeasure Self-Encoder
【技术实现步骤摘要】
用对抗自编码器检测第一图像数据集当中异常图像的方法
引入用于使用对抗自编码器来检测第一图像数据集当中的一个或多个异常图像的方法、计算机程序以及计算设备。
技术介绍
在中公开了对抗自编码器。在中描述了用于异常检测的方法。在中公开了无监督一类支持向量机(SVM)算法。
技术实现思路
所给出的用于检测第一图像数据集当中的一个或多个异常图像的方法使用对抗自编码器,所述对抗自编码器是在第一训练中利用图像训练数据集被训练的,而优化对抗自编码器使得图像训练数据集的图像的潜在表示的分布接近预定先验分布,并且最小化图像训练数据集的重构图像的重构误差。在对对抗自编码器的第一训练之后,在潜在表示中检测异常,并且在第二训练中利用图像训练数据集但是把检测到的异常考虑在内来训练对抗自编码器,由经训练的对抗自编码器取决于图像的重构误差和预定先验分布下的概率密度中的至少一个来检测第一图像数据集当中的一个或多个异常图像。所给出的方法通过从至少部分未标注的图像训练数据集中学习来解决视觉异常检测的问题,所述至少部分未标注的图像训练数据集可能包含未知数量的异常,即“受污染”训练集。所述方法可以可靠地标识图像中未包含在训练集中的异常。所述方法还可以应用在主动半监督设定中,其中算法将未标注的数据集取作其输入,并且查询用户来为一小部分数据点供给标注。另外的优势是所述方法不局限于仅输出异常分数,而是可以标识很可能是异常的训练示例,使得可以由领域专家来核查系统的功能。所述方法引入用于异常检测的另外的标准,其通过将重构和潜在信息组合来减少错误肯定和错误否定的数量。通过在训练期间更改训练集,所述方法对于受污染数据集变得特别鲁棒。此外,交互式半监督方案可以最佳地利用来自领域专家的非常稀疏的反馈,所述领域专家可以提供少量标注。不要求训练数据中所包含的所有可能异常的代表性集。异常将自身表现为与正常类有显著偏差就足够,但是可能存在很多多样形式的异常。所述方法比严格要求所有训练数据都来自正常类的其他方法具有更一般的适用性。如果违反该条件,这类方法会迅速损失性能。例如,在利用受污染数据的设定中使用正常自编码器的方法也学习很好地重构异常,并且因此关于重构误差的阈值不提供用于检测异常的鲁棒标准。相反,所给出的方法在其中不需要针对训练数据的标注的设置中是适用的,并且小部分的训练数据可能是异常的。如果有领域专家可用于标注小部分的训练数据,那么所给出的方法可以处理训练数据并特别搜索那些示例,如果标注是已知的,这将提供最大的性能增益。通过使用对抗自编码器,所述方法获得对潜在空间中的期望分布的控制,并且可以将潜在空间中的密度估计用作用于异常检测的附加标准。这导致比单独使用自编码器的重构误差更好的标准。对抗自编码器还充当所学习的数据分布的生成模型,并且可以用于从正常或标识的反常类中生成样本以验证所学习的模型是有意义的。如果关于异常的性质的先验信息(例如,典型观察到的不同异常的预期数量)是已知的,这可以用于对抗自编码器中以成形潜在空间中的期望分布。所给出的方法在训练期间自动地检测很可能是异常的训练示例,使得性能对于改变的异常率是鲁棒的。在优选实施例中,通过使用一类支持向量机或局部离群因子算法来完成潜在表示中异常的检测。所给出的方法可以与处置检测到的异常的各种方法一起使用。针对该异常处置的优选实施例包括以下中的至少一个:(a)从用于第二训练的训练集中排除在潜在表示中检测到的异常,(b)在至少一次后续训练中,使用用于调谐对抗自编码器的加权损失函数,而在潜在表示中检测到的异常在该至少一次后续训练中接收减小的权重,(c)对于至少一次后续训练,将在潜在表示中检测到的异常集中每个异常的重构目标修改为其自身的噪声损坏版本,以及(d)在至少一次后续训练中,将在潜在表示中检测到的异常集中每个异常的重构目标修改为潜在空间中标识为没有异常的靠近或最靠近的图像。分离地或者组合使用这些功能提供对对抗自编码器的鲁棒和有效的训练。在优选实施例中,所述方法输出针对第一图像数据集中的图像的异常分数,所述异常分数是基于重构误差和预定先验分布下的概率密度中的至少一个计算的。这提供对异常的差异化和精确的反馈。在优选实施例中,所述方法用于视觉品质检查、医学图像分析、视觉监视或自动化驾驶中。附图说明图1示意性地示出了以二维高斯作为先验分布的示例性对抗自编码器框架。图2示意性地示出了用于利用使用受污染训练数据的无监督训练来检测异常图像的方法的示例性实施例。图3示意性地示出了用于利用使用受污染训练数据的半监督训练来检测异常图像的方法的示例性实施例。具体实施方式存在用于标识给定图像集中的异常或离群部的各种机器学习方法。然而假定来自正常类的图像共享很多相似的特征,离群部通过与正常类的显著偏差来表征。此外,假定训练数据完全由正常图像构成,或者仅小部分的图像是异常。视觉异常检测的典型应用是用于视觉品质检查、医学图像分析或用于监视任务。用于异常检测的方案可以被分类为有监督、半监督或无监督:有监督:训练集中的每个图像包含标注,所述标注指示其属于正常类还是异常。这也把假定所有可用训练数据都为正常的情况归入在内。半监督:大部分图像是未标注的,但是对于一些图像,它们是异常还是属于正常类是已知的。无监督:没有标注是已知的;图像是否是异常需要通过比较大多数类和最终离群部的特性来学习。可以在仅在一个固定的数据集上标识异常的方法和从训练集学习并归纳到以前未见的图像的那些方法之间做出进一步区别。用于视觉异常检测的一个方案是自编码器的使用,所述自编码器是由编码和解码级组成的具有多个隐藏层的神经网络。编码器被训练成将输入图像映射到较低维度的潜在表示,解码器从所述较低维度的潜在表示学习重构原始图像。目的是最小化自编码器的重构误差。通过具有较低维度的潜在表示,引入了瓶颈,所述瓶颈要求编码器聚焦于图像的特性特征,并且防止学习诸如恒等函数之类的平凡解。通过重构误差(通常是所有像素上的均方误差)来测量自编码器的品质。由于自编码器的目标输出是输入图像,因此自编码器训练是无监督的。自编码器可以用于在图像和其他数据上进行异常检测。想法是仅在正常数据上训练的自编码器学习正常类的模型,即,其可以以非常小的训练误差重构正常图像,但是关于异常数据的重构误差将更高。然后,基于自编码器的异常检测将对重构误差施加阈值并将超过阈值的所有图像考虑成异常。这已成功应用于视觉和听觉品质检查问题。用于异常检测的自编码器方案中的一个假定是所有训练示例都来自正常类,这使得那些方案落入如上文限定的有监督学习的类别,即使自编码器训练本身是无监督的。在更现实和更具有挑战性的情景中,训练集可能包含异常,但是哪些图像是异常的以及哪些不是在事先是未知的。这种“受污染训练数据”的情况很可能在现实世界的情景中发生,其中使所有训练点都由人类标注可能过于繁重或者甚至是不可能的,或者其中可能存在注释误差。对于所考虑的“受污染训练数据”集,可以假定训练数据中异常的部分是低的(在<5%的范围)并且正常类具有相对小的变异性,但是异常可能具有非常多样的形式。在该情景中,用于异常检测的自编码器的性能在小百分比的异常的情况下已经降级。现在,提出使用自编码器的扩展——用于异常检测的对抗自编码器。在图1中示出了示意性框架。对抗本文档来自技高网...
【技术保护点】
1.一种用于使用对抗自编码器(12,14,16)来检测第一图像数据集当中的异常图像的方法,其特征在于:在第一训练中利用图像训练数据集(11)训练对抗自编码器(12,14,16),而优化对抗自编码器(12,14,16)使得图像训练数据集(11)的图像的潜在表示(13)的分布接近预定先验分布(17),并且最小化图像训练数据集的重构图像(15)的重构误差,在对对抗自编码器(12,14,16)的第一训练之后,在潜在表示(13)中检测异常,并且在第二训练中利用图像训练数据集(11)但是把检测到的异常考虑在内来训练对抗自编码器(12,14,16),由经训练的对抗自编码器(12,14,16)取决于图像的重构误差和预定先验分布(17)下的概率密度中的至少一个来检测第一图像数据集当中的异常图像。
【技术特征摘要】
2017.10.27 EP 17198775.31.一种用于使用对抗自编码器(12,14,16)来检测第一图像数据集当中的异常图像的方法,其特征在于:在第一训练中利用图像训练数据集(11)训练对抗自编码器(12,14,16),而优化对抗自编码器(12,14,16)使得图像训练数据集(11)的图像的潜在表示(13)的分布接近预定先验分布(17),并且最小化图像训练数据集的重构图像(15)的重构误差,在对对抗自编码器(12,14,16)的第一训练之后,在潜在表示(13)中检测异常,并且在第二训练中利用图像训练数据集(11)但是把检测到的异常考虑在内来训练对抗自编码器(12,14,16),由经训练的对抗自编码器(12,14,16)取决于图像的重构误差和预定先验分布(17)下的概率密度中的至少一个来检测第一图像数据集当中的异常图像。2.根据权利要求1所述的方法,其特征在于,潜在表示(13)中的异常的检测是取决于预期异常率来完成的。3.根据前述权利要求中的一项所述的方法,其特征在于,潜在表示(13)中的异常的检测是取决于它们的重构误差和预定先验分布(17)下它们的概率密度中的至少一个来完成的。4.根据前述权利要求中的一项所述的方法,其特征在于,潜在表示(13)中的异常的检测是使用一类支持向量机或局部离群因子算法来完成的。5.根据前述权利要求中的一项所述的方法,其特征在于,通过从用于第二训练的训练集(11)中排除检测到的异常来把在潜在表示(13)中检测到的异常考虑在内。6.根据前述权利要求中的一项所述的方法,其特征在于,通过在至少一次后续训练中使用用于调谐对抗自编码器(12,14,16)的加权损失函数来把在潜在表示(13)中检测到的异常考虑在内,而在潜在表示(13)中检测到的异常在所述至少一次后续训练中接收减小的权重。7.根据前述权利要求中的一项所述的方法,其特征在于,通过对于至少一次后续训练,将在潜在表示(13)中检测到的异常集中每个异常的重构目标修改为其自身的噪声损坏版本来把在潜在表示(13)中检测到的异常考虑在内。8.根据前述权利要求中的一项所述的方法,其特征在于,通过...
【专利技术属性】
技术研发人员:L贝格尔,M普法伊弗,
申请(专利权)人:罗伯特·博世有限公司,
类型:发明
国别省市:德国,DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。