当前位置: 首页 > 专利查询>罗伯特专利>正文

用于训练机器学习算法的方法技术

技术编号:36067687 阅读:47 留言:0更新日期:2022-12-24 10:35
本发明专利技术涉及一种用于训练机器学习算法的方法,其中所述方法(1)具有如下步骤:通过控制设备基于最初收集到的数据来对所述算法进行预训练,以便获得初始模型(2);基于所规定的数据级别和来自通道之一的数据对当前包含在所述初始模型中的不确定性的相应的影响来确定通道集合,其中来自包含在所述通道集合中的通道的数据应该被用于对所述初始模型进行再训练(5);将来自所述通道集合中的各个通道的数据传输给所述控制设备(6);而且通过所述控制设备基于所传输的数据来对所述初始模型进行再训练(7)。再训练(7)。再训练(7)。

【技术实现步骤摘要】
用于训练机器学习算法的方法


[0001]本专利技术涉及一种用于训练机器学习算法来控制至少一个可控系统的方法,其中该至少一个可控系统基于具有不确定性的机器学习算法来训练,其中该机器学习算法可以在该至少一个可控系统的运行期间被再训练,而且其中训练数据到用于对机器学习算法进行再训练的控制设备的传输被优化。

技术介绍

[0002]数字控制设备在大量应用中被用于控制和调节技术系统,这些技术系统在下文通常称为可控系统。在此,这些控制设备根据指定的控制算法来处理传感器信号或者其它输入值,使得确定用于功能的一个或多个输出值,例如用于操控执行器的操纵参量。
[0003]在此,该控制算法例如可以是机器学习算法。在此,各个可控系统分别收集关于它们的使用的数据,其中这些数据然后被用于对机器学习算法相对应地进行训练。在此,此类机器学习算法通常基于:使用统计方法,以便对数据处理系统进行训练,使得该数据处理系统可以在该数据处理系统最初未曾明确为了特定任务而被编程的情况下执行该特定任务。在此,机器学习的目的在于构建可以从数据中学习并做出预测的算法。这些算法创建数学模型,利用这些数学模型例如可以对数据进行分类。
[0004]在此,公知如下方法,其中算法首先有关最初收集的数据来预训练,以便获得具有不确定性的初始模型。这具有如下优点:机器学习算法在此已经可以相对快速地被用于控制至少一个可控系统,而所有可能的分配、尤其是还有很少出现的分配不必首先复杂地被准确训练。经此,可以在训练机器学习算法时进一步节省计算时间以及相对应的计算机能力。接着,在至少一个可控系统的运行期间,机器学习算法或初始模型可以基于相对应的在该至少一个可控系统的运行期间所检测到的数据来再训练,以便消除不确定性。
[0005]然而,在这种情况下,被证明是有问题的是:可控系统越来越多地具有大量要控制的功能或相对应的执行器。然而,如果现在在可控系统的运行期间会检测关于所有这些要控制的功能的数据并且因此大量数据或大数据量会被传输给相对应的控制设备以对机器学习算法进行再训练,则这些数据可能导致数据传输方面的问题,例如导致时延或者像干扰那样的交互效应。
[0006]从出版文献DE 10 2016 216 945 A1公知一种用于以基于数据的功能模型的模型值为基础来执行功能的方法,其中在查询点确定基于数据的功能模型的模型值,确定模型精度指示或模型有效性指示,并且根据该模型精度指示或模型有效性指示来执行该功能,该模型精度指示或模型有效性指示说明了在查询点的基于数据的功能模型的模型值的精度或有效性。
[0007]因此,本专利技术所基于的任务在于:说明一种经优化的用于训练机器学习算法的方法以及尤其是一种经优化的用于对具有不确定性的机器学习算法进行再训练的方法。
[0008]该任务利用一种按照专利权利要求1的特征的用于训练机器学习算法的方法来解决。
[0009]该任务还利用一种具有专利权利要求7的特征的控制设备来解决。
[0010]此外,该任务也通过一种按照专利权利要求12的用于训练机器学习算法的系统来解决。
[0011]有利的实施方式和扩展方案从从属权利要求中以及从参考附图的描述中得到。

技术实现思路

[0012]按照本专利技术的一个实施方式,该任务通过一种用于训练机器学习算法的方法来解决,其中该机器学习算法是用于控制至少一个可控系统的算法,其中该机器学习算法给输入值分配可能的输出值,其中该机器学习算法针对输入值到输出值的每个分配都具有不确定性,其中该不确定性分别说明了输入值到可能的输出值的分配到目前为止被训练得有多好。在此,该方法具有:通过用于训练机器学习算法的控制设备基于最初收集到的数据来对机器学习算法进行预训练,以便获得初始模型。该控制设备可以是中央服务器,该中央服务器被安置在可控系统的远端。此外,在至少一个可控系统的运行期间,检测表征该至少一个可控系统的当前状态的数据,其中所检测到的数据来自第一数量的通道,针对所述第一数量的通道中的每个通道,分别确定来自相对应的通道的数据对当前包含在初始模型中的不确定性的影响,而且基于所规定的数据级别和来自所述第一数量的通道中的通道之一的数据对当前包含在初始模型中的不确定性的相应的影响来确定所述第一数量的通道中的通道集合,其中来自包含在该通道集合中的通道的数据应该被用于对初始模型进行再训练,其中来自该通道集合中的各个通道的所检测到的数据被传输给控制设备,并且该初始模型通过该控制设备基于被传输给该控制设备的数据来再训练。
[0013]在这种情况下,不确定性被理解成值或变量,该值或该变量说明了输入值与相对应的输出值之间的分配的质量,也就是说该分配基于多少信息内容或者到目前为止在该分配的附近记录了多少训练数据。
[0014]此外,最初收集的数据被理解成如下数据或训练数据,这些数据或训练数据最初被提供用于训练机器学习算法,其中尤其涉及描述频繁或定期出现的情况的数据。在此,有关这些最初收集的数据来训练的机器学习算法称为初始模型。
[0015]此外,通道被理解成如下元件或传感器,这些元件或传感器在至少一个可控系统的运行期间检测数据,这些数据表征该至少一个可控系统的各个可控功能或可控执行器的相对应的输出值或设定,其中各个可控系统或可控执行器在该至少一个可控系统的运行期间尤其是也可以与该至少一个可控系统的其它可控功能或可控执行器无关地被控制或设定。例如,自主驾驶车辆可具有用于基于当前情况来控制速度、进行挡位选择以及进行温度调节的功能,其中在自主驾驶机动车的运行期间检测表征对速度和/或挡位选择和/或温度调节的相对应地进行的设定的数据。
[0016]此外,来自所述第一数量的通道中的通道之一的数据对当前包含在初始模型中的不确定性的影响被理解成来自相对应的通道的数据的信息内容,其中该信息内容说明了这些数据对于初始模型的再训练的重要程度,也就是说通过基于这些数据对初始模型的再训练是否或者在多大程度上可以减小在初始模型中的不确定性。在此,在特定时间点包含在可能已经被再训练的初始模型中的不确定性称为当前所包含的不确定性。
[0017]此外,所规定的数据级别表示在被传输给控制设备的数据中的所定义的信息级
别,例如所要传输的最大数据量或者在所传输的数据中的信息内容总体上至少应该有多少。在此,所规定的数据级别例如可以由模型制造商或该至少一个可控系统的制造商或者控制设备或相对应的数据中心的运营商来指定。
[0018]因此,总的来说,并不是将所有检测到的数据都传输给(尤其是远端)控制设备以对机器学习算法进行再训练,而是只传输所选择的通道的数据。经此,可以防止在数据传输方面的问题,例如时延或者像干扰那样的交互效应。此外,数据传输可以被设计为使得考虑相对应的数据传输系统(尤其是总线系统)的现实条件,例如CAN总线的容量或者无线数据传输的供支配的带宽。此外,该方法确保了算法的动态细化或主动学习,其中基于所选择的被传输的数据也可以训练在实践中非常罕见的情况。经此,可以进一步提高在通过机器学习算法将输入值分配给输出值时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于训练机器学习算法的方法,其中所述机器学习算法是用于控制至少一个可控系统的算法,其中所述机器学习算法给输入值分配可能的输出值,其中所述机器学习算法针对输入值到输出值的每个分配都具有不确定性,其中所述不确定性分别说明了输入值到可能的输出值的分配到目前为止被训练得有多好,其中所述方法(1)具有如下步骤:
‑ꢀ
通过用于训练所述机器学习算法的控制设备基于最初收集到的数据来对所述机器学习算法进行预训练,以便获得初始模型(2);
‑ꢀ
在所述至少一个可控系统的运行期间,检测表征所述至少一个可控系统的当前状态的数据,其中所检测到的数据来自第一数量的通道(3);
‑ꢀ
针对所述第一数量的通道中的每个通道,分别确定来自相对应的通道的数据对当前包含在所述初始模型中的不确定性的影响(4);
‑ꢀ
基于所规定的数据级别和来自所述第一数量的通道中的通道之一的数据对当前包含在所述初始模型中的不确定性的相应的影响来确定所述第一数量的通道中的通道集合,其中来自包含在所述通道集合中的通道的数据应该被用于对所述初始模型进行再训练(5);
‑ꢀ
将来自所述通道集合中的各个通道的数据传输给所述控制设备(6);而且
‑ꢀ
通过所述控制设备基于被传输给所述控制设备的数据来对所述初始模型进行再训练(7)。2.根据权利要求1所述的方法,其中所述初始模型是高斯过程。3.根据权利要求1或2所述的方法,其中所规定的数据级别说明:所有检测到的数据中的应该被传输给所述控制设备的百分比是多少。4.根据权利要求1或2所述的方法,其中所规定的数据级别说明:所传输的数据对当前包含在所述初始模型中的不确定性的影响至少应该有多大。5.根据权利要求3或4所述的方法,其中确定所述第一数量的通道中的通道集合的步骤,其中来自包含在所述通道集合中的通道的数据应该被用于对所述初始模型进行再训练(5),进一步具有如下步骤:
‑ꢀ
选择应该是所述通道集合的一部分的通道,使得是所述通道集合的一部分的通道的数目被最小化,并且来自这些通道的数据同时最大可能地影响当前包含在所述初始模型中的不确定性。6.一种用于控制至少一个可控系统的方法,其中所述方法具有如下步骤:
‑ꢀ
通过根据权利要求1至5中任一项所述的方法(1)来训练用于控制所述至少一个可控系统的机器学习算法;
‑ꢀ
基于经训练的机器学习算法来控制所述至少一个可控系统。7.一种用于选择训练数据来训练机器学习算法的控制设备,其中所述机器学习算法是用于控制至少一个可控系统的算法,其中所述机器学习算法给输入值分配可能的输出值,其中所述机器学习算法针对输入值到输出值的每个分配都具有不确定性,其中所述...

【专利技术属性】
技术研发人员:C
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1