当前位置: 首页 > 专利查询>罗伯特专利>正文

用于使机器学习自动化的设备和使机器学习自动化的方法技术

技术编号:32853648 阅读:14 留言:0更新日期:2022-03-30 19:20
一种设备(100)和计算机实现的方法,包括:提供具有参数的机器学习流水线(M)的表示;提供多个元素及其关系的多个元素的表示(O);提供多个元素的表示(O)中的第一元素;根据第一元素来确定多个元素的表示(O)中的第二元素,其中,第一元素和第二元素具有满足第一条件的关系,特别地,第二元素是根据在多个元素的表示(O)中编码的语义从多个元素的表示(O)中的第一元素在语义上可得的;以及根据第二元素来确定参数。确定参数。确定参数。

【技术实现步骤摘要】
用于使机器学习自动化的设备和使机器学习自动化的方法


[0001]本专利技术涉及机器学习的自动化,尤其涉及流水线构造和流水线配置的自动化。

技术介绍

[0002]机器学习流水线可以将原始数据变成结论和功能机器学习模型。
[0003]机器学习流水线的开发是复杂的过程,其需要对数据的深入理解以及对领域和要解决的问题的必要理解。这需要在信息处理和数据分析中特别是在机器学习中进行专门的训练。

技术实现思路

[0004]用于使机器学习自动化的设备和使机器学习自动化的计算机实现的方法提供了使得较不熟练的或未受训练的用户能够创建功能机器学习模型的工具。
[0005]该设备和方法可被应用在其中存在针对用于数据分析的机器学习流水线的开发的任何以下要求的任何情况下。
[0006]机器学习流水线构造应该是自动化的,以节省大量的开发工作和时间。机器学习流水线应当是可由非专家配置的。机器学习流水线应当针对多个不同的数据集可修改,以解决若干任务。机器学习流水线也应当针对未来的场景可修改。
[0007]计算机实现的方法包括:提供具有参数的机器学习流水线的表示;提供多个元素及其关系的表示;提供多个元素的表示中的第一元素;根据第一元素来确定多个元素的表示中的第二元素,其中,第一元素和第二元素具有满足第一条件的关系,特别地,第二元素是根据在多个元素的表示中编码的语义从多个元素的表示中的第一元素在语义上可得的;以及根据第二元素来确定参数。
[0008]有利地,该方法包括:根据第二元素来确定多个元素的表示中的第三元素,其中,第二元素和第三元素具有满足第二条件的关系,特别地,第三元素是从多个元素的表示中的第二元素在语义上可得的;以及如果满足第二条件,则根据第二元素和第三元素来确定参数,否则,不根据第二元素和第三元素来确定参数。这允许更复杂的处理,以提供用于对应依赖性的三维映射。
[0009]有利地,多个元素的表示包括本体或表示本体的图形。本体或图形以适合于自动处理的格式对关于机器学习的知识进行编码。
[0010]有利地,该方法包括:提供输入数据;以及提供输入数据的特征的注释,特别是输入数据中的变量名,其中,提供第一元素包括根据第一本体针对注释来确定多个元素的表示的元素,其表示多个元素的表示中的输入数据的特征,特别是输入数据的变量名,其中,提供第二元素包括根据第一本体针对第一元素来确定多个元素的表示的元素,其表示多个元素的表示中的特征名,特别是域中的变量名,并且其中,该方法还包括确定包括输入数据、第一元素和第二元素的第一数据集。这对于非专家用户来说是有用的界面。
[0011]有利地,确定第三元素包括特别是根据第二本体针对第二元素来确定多个元素的
表示的元素,其表示满足第三条件的多个元素的表示中的特征群组。第二本体表示关于特征群组的专家知识,使其对于非专家用户是可用的。
[0012]有利地,该方法包括确定第四元素,其中,确定第四元素包括特别是根据第三本体针对第三元素来确定多个元素的表示的元素,其表示满足第三条件的处理算法,特别地,第四元素是从多个元素的表示中的第三元素在语义上可得的。这样,处理算法被自动选择。
[0013]在一个方面,该方法包括确定包括第一数据集、第二元素、第三元素和第四元素的第二数据集。
[0014]在一个方面,该方法包括通过利用由第四元素表示的处理算法来处理第二数据集而确定特征集;以及确定第五元素,其中,确定第五元素包括针对第三元素来确定多个元素的表示的元素,其表示满足第四条件的特征集,特别地,第五元素是从多个元素的表示中的第三元素在语义上可得的,并且第五元素是从多个元素的表示中的第四元素在语义上可得的,并且其中,该方法还包括确定包括特征集、第三元素和第五元素的第三数据集。
[0015]有利地,该方法包括确定第六元素,其中,确定第六元素包括针对第五元素来确定多个元素的表示的元素,其表示满足第五条件的机器学习建模算法,特别地,第六元素是从多个元素的表示中的第五元素在语义上可得的,并且其中,该方法还包括确定第四数据集,所述第四数据集包括从特征集中选择的特征、第五元素和第六元素。这样,可以自动确定机器学习算法或多个机器学习算法。
[0016]有利地,该方法包括查找用于处理数据的指令和/或根据第六元素针对第四数据集定义的数据。因此,自动创建机器学习模型。
[0017]有利地,提供机器学习流水线的表示包括从机器学习流水线的多个表示中选择机器学习流水线的表示。这允许使用由专家创建的模板。
[0018]有利地,提供机器学习流水线的表示包括检测对机器学习流水线的多个表示之一进行标识的用户输入;以及选择在用户输入中标识的机器学习流水线的表示。这使得非专家用户能够创建机器学习流水线和模型。
[0019]可以根据机器学习流水线的表示来确定机器学习模型。
[0020]该方法可以包括提供包括图像的原始数据;确定用于图像分类器模型的机器学习流水线的参数;根据参数来确定机器学习模型;利用原始数据的至少一个图像来训练机器学习模型。如此训练的机器学习模型是图像分类器模型或包括它。
[0021]该方法可以包括提供图像;利用机器学习模型对图像进行分类。
[0022]一种用于确定机器学习模型的设备适于执行该方法。
附图说明
[0023]从以下描述和附图中可获得进一步有利的实施例。在附图中:图1示意性地描绘用于确定机器学习模型的设备;图2示意性地描绘用于确定机器学习模型的方法中的步骤。
具体实施方式
[0024]图1描绘了用于确定机器学习模型102的设备100。
[0025]设备100包括用户界面层104、语义层106、数据和映射层108以及机器学习层110。
设备100适于执行将在下面描述的计算机实现的方法。
[0026]用户界面层104向用户提供用于使用语义层106的语义组件并因此使用整个系统的界面。
[0027]用户界面层104包括第一功能112,其适于动态地可视化关于数据注释114和关于机器学习模型116的信息。
[0028]用户界面层104可以包括图形用户界面功能,其用于显示关于当前数据注释114和关于机器学习模型116的信息。
[0029]第一功能112适于从用户检索关于数据注释114和/或机器学习模型116的信息。
[0030]在示例中,机器学习流水线的表示可由用户通过从图形用户界面上显示的多个机器学习流水线118中选择它来选择。
[0031]关于机器学习模型116的信息包括可视化120。
[0032]可视化120包括特征群组122。在示例中,特征群组122包括用于第一特征群组122

1、第二特征群组122

2和第三特征群组122

3的图标。示例中的第一特征群组122

1是用于单个特征的群组。示例中的第二特征群组122

2是用于时间序本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的方法,其特征在于,提供(200)具有参数的机器学习流水线(M)的表示;提供(202)多个元素及其关系的表示(O);提供(208)所述多个元素的所述表示(O)中的第一元素;根据所述第一元素来确定所述多个元素的所述表示(O)中的第二元素,其中,所述第一元素和所述第二元素具有满足第一条件的关系,特别地,所述第二元素是根据在所述表示(O)中编码的语义从所述多个元素的所述表示(O)中的所述第一元素在语义上可得的;以及根据所述第二元素来确定所述参数。2.根据权利要求1所述的方法,其特征在于,根据所述第二元素来确定(212)所述多个元素的所述表示(O)中的第三元素,其中,所述第二元素和所述第三元素具有满足第二条件的关系,特别地,所述第三元素是从所述多个元素的所述表示(O)中的所述第二元素在语义上可得的;以及如果满足所述第二条件,则根据所述第二元素和所述第三元素来确定所述参数,否则,不根据所述第二元素和所述第三元素来确定所述参数。3.根据权利要求1或2所述的方法,其特征在于,所述多个元素的所述表示(O)包括本体或表示本体的图形。4.根据前述权利要求中任一项所述的方法,其特征在于,提供(204)输入数据;以及提供(206)所述输入数据的特征的注释(A),特别是所述输入数据中的变量名,其中,提供(208)所述第一元素包括根据第一本体针对所述注释(A)确定所述多个元素的所述表示(O)的元素,其表示所述多个元素的所述表示(O)中的所述输入数据的所述特征,特别是所述输入数据的变量名,其中,提供(208)所述第二元素包括根据所述第一本体针对所述第一元素来确定所述多个元素的所述表示(O)的元素,其表示所述多个元素的所述表示(O)中的特征名,特别是域中的变量名,并且其中,所述方法还包括确定(210)包括所述输入数据、所述第一元素和所述第二元素的第一数据集。5.根据权利要求4所述的方法,其特征在于,确定(212)所述第三元素包括特别是根据第二本体针对所述第二元素来确定所述多个元素的所述表示(O)的元素,其表示满足所述第三条件的所述多个元素的所述表示(O)中的特征群组。6.根据权利要求5所述的方法,其特征在于,确定(214)第四元素,其中,确定所述第四元素包括特别是根据第三本体针对所述第三元素来确定所述多个元素的所述表示(O)的元素,其表示满足第三条件的处理算法,特别地,所述第四元素是从所述多个元素的所述表示(O)中的所述第三元素在语义上可得的。7.根据权利要求6所述的方法,其特征在于,确定(216)包括所述第一数据集、所述第二元素、所述第三元素和所述第四元素的第二数据集。8.根据权利要求7所...

【专利技术属性】
技术研发人员:周柏帆E
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1