System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及借助于经训练的机器学习模型来评估测量数据。
技术介绍
1、在许多应用、诸如自主车辆或机器人在房屋上或甚至在公共道路交通中的操纵中,或者在质量保证检查中,使用经训练的机器学习模型来处理测量数据。特别地,机器学习模型有利于处理来自相机的图像数据、以及来自雷达或激光雷达传感器的点云数据。即使任何给定场景的这种测量数据的两个记录被紧接地(in immediate succession)捕获,它们也将不会是相同的。当使用经训练的机器学习模型进行处理时,这不是什么大问题,这是由于机器学习模型具有在训练数据集——它们是在该训练数据集上被训练的——上泛化的能力。
2、然而,泛化的能力固有地被限于训练数据集所属的域和/或分布。如果机器学习模型遇到来自非常不同的域和/或分布的测量数据记录,其输出可能不太准确。
技术实现思路
1、本专利技术提供了一种方法,该方法用于检测输入到经训练的机器学习模型的测量数据的给定输入记录是否在机器学习模型利用其被训练的训练示例的域和/或分布中。
2、特别地,术语“机器学习模型”包括任何具有高泛化能力的函数,该函数可借助于表征其行为的参数来适配。例如,机器学习模型可以包括一个或多个神经网络。参数可以例如包括权重,利用该权重,去往神经元的输入被求和以激活该神经元。
3、一般来说,测量数据的记录可以被认为具有内容和风格(style)。内容对应于该记录的语义信息。当该记录由已经针对特定给定任务被训练的机器学习模型来处理时,关于该给
4、在该方法的过程中,从每个训练示例,确定训练风格。该训练风格可以被认为是表征了训练示例所属的域和/或分布。例如,如果测量数据的记录是图像,则风格可以表征该图像被取得时的季节(例如夏天或冬天)或一天中的时间(例如白天或晚上)。
5、同样,从测量数据的给定输入记录,确定测试风格,该测试风格表征了测量数据的给定记录所属的域和/或分布。
6、从许多训练示例获得的训练风格形成了分布。基于训练风格和测试风格,评估测试风格在多大程度上是训练风格的分布的成员。至少部分地基于该评估的结果,确定测量数据的给定记录是否在训练示例的域和/或分布中。特别地,如果测量数据的给定记录不在该域和/或分布中,则这可以被认为是其中使用机器学习模型的应用的情境中的异常。
7、所提出的方法对异常是选择性敏感的,该异常影响测量数据的记录的风格。例如,在图像分类的所提到的用例中,如果是以下情况,则可以预期识别出从输入图像提取的测试风格在训练图像的分布外:
8、·机器学习模型尚未针对输入图像被获取的一天中的时间或季节被充分地训练;
9、·图像曝光过度或曝光不足;或者
10、·相机镜头上的冰、灰尘或其他污染物将“过滤器(filter)”应用于该图像。
11、此外,可以预期来自不同用例或应用的图像也将具有不同的风格。例如,由工厂中的质量检查系统取得的输入图像可以被预期具有关于交通情形图像的训练风格分布处于分布外(out-of-distribution)的风格。
12、另一方面,如果输入图像具有与训练风格相似的风格,但是仅仅具有未被机器学习模型的训练所覆盖的新颖内容,则可以预期该方法不会检测到异常。例如,如果立法者已经引入了新的交通标志,并且该标志未被训练所覆盖,则在其他方面基本上相似的条件下的新标志的图像仍然可以被预期具有关于训练风格处于分布内(in-distribution)的风格。
13、所描述的对风格改变的选择性敏感性是有利的,因为它允许将异常缩窄(narrowdown)到风格改变作为原因。如果仅使用一种方法,并且该一种方法对内容改变、风格改变以及任何其他异常都是敏感的,则只能够检测到存在某种异常,而不可能追踪到根本原因。
14、在特别有利的实施例中,对训练风格、测试风格的分别确定可以包括:
15、·由经训练的特征提取器网络分别将训练示例、测量数据的输入记录处理成特征图;以及·从该特征图分别确定训练示例、输入记录的特征,所述特征分别表征训练示例、输入记录的域和/或分布。
16、例如,卷积神经网络可以用于产生特征图。这些特征图然后可以被分解成:
17、·在一方面是第一贡献,其具有分别表征训练样本、测量数据的输入记录的域和/或分布的特征,以及
18、·在另一方面是第二贡献,其具有分别表征训练示例、测量数据的输入记录在其域和/或分布中的内容的特征。
19、在这里,仅需要第一贡献。例如,在由nvidia提出的stylegan网络的框架中提供的编码器包括卷积神经网络、以及用于从特征图确定所述第一风格贡献和所述第二内容贡献的“map2style(图到风格)”和“map2content(图到内容)”装置。
20、在另外的特别有利的实施例中,评估测试风格在多大程度上是训练风格的分布的成员包括:
21、·聚集训练风格以形成聚集;以及
22、·基于测试风格与该聚集之间的距离d、d'和/或基于取决于距离d、d'的评级函数r(d,d')的值,来确定测试风格在多大程度上是训练风格的分布的成员。例如,评级函数r(d,d')可以与较短距离d、d'相比不相称地(disproportionally)更多“惩罚”较长距离d、d'。
23、该聚集基于非常多的训练示例,并且因此可以被视为以良好的准确性表示训练示例集。距离度量具有非常好的激励性(very well motivated),并且好的度量是容易获得的。
24、特别地,该聚集可以包括拟合到训练风格的参数化统计分布。这种分布可以例如具有特征中心点或中心区域。在一方面该中心点或中心区域与另一方面测试风格之间的距离被很好地定义。同样,训练风格的聚类的质心可以被确定为该聚集。该质心还定义了距测试风格的距离。
25、在另外的特别有利的实施例中,马氏距离被选择作为针对距离d、d'的度量。该度量能够在一方面将训练风格的分布直接映射到距离,并且在另一方面将测试风格的分布直接映射到距离。例如,如果训练风格的分布w是具有均值μ和标准差(协方差矩阵)σ的多元高斯分布w~n(μ,σ),则分布w与给定测试风格τ之间的马氏距离d可以被计算为:
26、d=d(w,τ)2=(w-t)t∑-1(w-t)。
27、例如,当该马氏距离d超过预定阈值时,测试风格τ可以被认为是处于分布外的。
28、在另外的特别有利的实施例中,评估测试风格在多大程度上是训练风格的分布的成员可以包括:
29、·基于训练风格来训练归一化流模本文档来自技高网...
【技术保护点】
1.一种用于检测输入到经训练的机器学习模型(1)的测量数据的给定输入记录(2)是否在所述机器学习模型(1)利用其被训练的训练示例(2a)的域和/或分布(2a#)中的方法(100),包括以下步骤:
2.根据权利要求1所述的方法(100),其中对训练风格(4a)、测试风格(4)的分别确定(110、120)包括:
3.根据权利要求1至2中任一项所述的方法(100),其中所述评估(130)包括:
4.根据权利要求3所述的方法(100),其中所述聚集(4a*)包括(131a)拟合到训练风格(4a)的参数化统计分布和/或训练风格(4a)的聚类的质心。
5.根据权利要求3至4中任一项所述的方法(100),其中马氏距离被选择(132a)作为针对距离D、D'的度量。
6.根据权利要求1至5中任一项所述的方法(100),其中所述评估(130)包括:
7.根据权利要求1至6中任一项所述的方法(100),进一步包括,响应于确定(140)测量数据的给定记录(2)不在训练示例(2a)的域和/或分布(2a#)中,
8.根据权利
9.根据权利要求1至8中任一项所述的方法(100),进一步包括,响应于确定(140)测量数据的给定记录(2)不在训练示例(2a)的域和/或分布(2a#)中,
10.根据权利要求1至9中任一项所述的方法(100),进一步包括,响应于确定(140)测量数据的给定记录不在训练样本的域和/或分布中,
11.根据权利要求1至10中任一项所述的方法(100),其中选择(105)已经由车辆(50)或机器人(51)上携带的至少一个传感器所捕获的测量数据的输入记录(2)。
12.根据权利要求11所述的方法(100),其中
13.一种包括机器可读指令的计算机程序,所述机器可读指令当在一个或多个计算机和/或计算实例上执行时使得所述一个或多个计算机和/或计算实例执行权利要求1至12中任一项所述的方法(100、200)。
14.一种非暂时性机器可读数据载体和/或下载产品,其具有权利要求13的计算机程序。
15.一个或多个计算机,其具有权利要求13的计算机程序和/或权利要求14的非暂时性机器可读数据载体和/或下载产品。
...【技术特征摘要】
1.一种用于检测输入到经训练的机器学习模型(1)的测量数据的给定输入记录(2)是否在所述机器学习模型(1)利用其被训练的训练示例(2a)的域和/或分布(2a#)中的方法(100),包括以下步骤:
2.根据权利要求1所述的方法(100),其中对训练风格(4a)、测试风格(4)的分别确定(110、120)包括:
3.根据权利要求1至2中任一项所述的方法(100),其中所述评估(130)包括:
4.根据权利要求3所述的方法(100),其中所述聚集(4a*)包括(131a)拟合到训练风格(4a)的参数化统计分布和/或训练风格(4a)的聚类的质心。
5.根据权利要求3至4中任一项所述的方法(100),其中马氏距离被选择(132a)作为针对距离d、d'的度量。
6.根据权利要求1至5中任一项所述的方法(100),其中所述评估(130)包括:
7.根据权利要求1至6中任一项所述的方法(100),进一步包括,响应于确定(140)测量数据的给定记录(2)不在训练示例(2a)的域和/或分布(2a#)中,
8.根据权利要求1至7中任一项所述的方法(100),进一步包括,响应于确定(140...
【专利技术属性】
技术研发人员:李雨蒙,A·霍列娃,张丹,
申请(专利权)人:罗伯特·博世有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。