执行机器学习流程的方法及系统技术方案

技术编号:15502658 阅读:55 留言:0更新日期:2017-06-03 23:27
提供了一种执行机器学习流程的方法及系统,所述方法包括:(A)向用户展示用于配置机器学习任务的图形界面并检测用户通过图形界面执行的输入操作,其中,机器学习任务用于执行机器学习流程所包括的数据处理;(B)根据检测到的用户通过所述图形界面执行的输入操作来配置所述机器学习任务;以及(C)在不执行配置的所述机器学习任务的情况下,推断与所述机器学习任务有关的数据属性信息,其中,数据属性信息包括数据属性字段的名称和/或数据类型。相应地,能够花费较少资源和时间而有效地得到机器学习流程中各个阶段的数据属性信息,从而改善机器学习工具的可操作性。

Method and system for executing machine learning process

Provides an implementation of machine learning and system flow method, the method includes: (A) display is used to configure the machine learning task to the graphical user interface and user input through the detection operation, the graphical interface implementation of the machine learning task for performing machine learning including the process of data processing; (B) according to the the detected user input operation through the graphical interface implementation to configure the machine learning tasks; and (C) in the implementation of learning tasks not the machine configuration under the condition of inference and the machine data attribute information, the task of learning about the name of the data attribute information including data and attribute field / or data type. Accordingly, the data attribute information of each phase of the machine learning process can be effectively obtained by using less resources and time so as to improve the operability of the machine learning tool.

【技术实现步骤摘要】
执行机器学习流程的方法及系统
本专利技术总体说来涉及人工智能领域,更具体地说,涉及一种执行机器学习流程的方法及系统。
技术介绍
随着海量数据的出现,人工智能技术得到了迅速发展,其中,机器学习技术普遍被用于从海量的数据记录(例如,金融数据、互联网数据等)中挖掘出有益的价值,然而,人工智能技术应用的一大难题在于缺少有效易用的机器学习工具,很多现有的机器学习平台都仅面向精通机器学习技术的使用者,并且,由于机器学习往往所针对的是海量复杂数据和复杂数据运算,因此,即便是精通机器学习技术的使用者也难以有效地操作目前的机器学习工具。实际上,要想培养出精通机器学习的技术专家,需要花费大量的时间和精力,这使得人工智能技术的应用存在较高的人才门槛。另一方面,机器学习模型的预测效果与模型的选择、可用的数据和特征的提取等都有关系,例如,在确定特征提取方式的过程中,往往不仅需要掌握机器学习的技术知识,还需要对实际预测问题有深入的理解,而预测问题往往结合着不同行业的不同实践经验,导致很难仅依靠技术专家来达到满意的机器学习效果。可以看出,机器学习工具需要在操作性上有所改进,以帮助不同用户更好地执行机器学习流程。作为示例,AzureMachineLearning(简称“AML”)是微软在其公有云Azure上推出的基于Web使用的一项机器学习服务,该产品的目标是简化使用机器学习的过程,以便于开发人员、业务分析师和数据科学家进行广泛、便捷地应用。在AML中,用户可通过DAG(有向无环图)来完成机器学习流程中各个机器学习任务(例如,数据导入、数据格式转换、数据变换、特征抽取、模型训练等)的配置,其中,在用户选择运行DAG中的特定顶点之后,该顶点所代表的机器学习任务将被执行,并且,作为执行结果而得到的数据的字段名称被显示在屏幕上。具体说来,参照图1A,在AML中建立的机器学习流程可包括诸如成人调查收入表的导入(AdultCensusIncomeBinary)、选择数据集中的列(SelectColumnsinDataset)和清理丢失数据(CleanMissingData)等机器学习任务,其中,在完成了对“选择数据集中的列”的配置之后,可开始配置下游机器学习任务“清理丢失数据”。然而,如图1B中所示,由于之前的“选择数据集中的列”这一任务没有执行,所以无法按照字段名称来配置“清理丢失数据”,相应地,在屏幕上显示了提醒消息“将在执行实验之后启用基于名称的列选择(Name-basedcolumnselectionwillbeenabledafterrunningtheexperiment)”。在图1C中,可以看出,通过点击屏幕下方的“RUN”而实际执行了机器学习任务“选择数据集中的列”。相应地,在图1D中,下游机器学习任务“清理丢失数据”变得能够基于名称来进行相应的配置。可以看出,在AML中,在配置机器学习流程的过程中,用户无法预先了解到任何关于经过各个机器学习任务处理后所得到的数据字段的信息,只有在相应机器学习任务被实际执行之后,才能知晓结果数据的字段名称。然而,由于机器学习过程常常涉及海量数据,执行机器学习任务将花费大量的时间和计算资源,这使得无法及时有效地获取或利用各阶段的数据属性信息。
技术实现思路
本专利技术的示例性实施例旨在克服现有技术中在执行机器学习流程时无法及时有效地获取数据属性信息的缺陷。根据本专利技术的示例性实施例,提供一种执行机器学习流程的方法,包括:(A)向用户展示用于配置机器学习任务的图形界面并检测用户通过图形界面执行的输入操作,其中,机器学习任务用于执行机器学习流程所包括的数据处理;(B)根据检测到的用户通过所述图形界面执行的输入操作来配置所述机器学习任务;以及(C)在不执行配置的所述机器学习任务的情况下,推断与所述机器学习任务有关的数据属性信息,其中,数据属性信息包括数据属性字段的名称和/或数据类型。可选地,所述方法还包括:(D)向用户展示在步骤(C)推断出的数据属性信息。可选地,在所述方法中,在步骤(C)中,推断出的数据属性信息是所述机器学习任务的输入数据、输出数据和/或中间处理数据的数据属性信息。可选地,所述方法还包括:(E)向用户展示用于配置以所述机器学习任务为上游机器学习任务的下游机器学习任务的图形界面并检测用户通过所述图形界面执行的输入操作;(F)根据检测到的用户通过所述图形界面执行的输入操作来配置所述下游机器学习任务;(G)基于在步骤(C)推断出的数据属性信息来检验所述下游机器学习任务的配置。可选地,在所述方法中,在步骤(E)中,在图形界面中向用户展示在步骤(C)推断出的数据属性信息,使得用户基于展示的数据属性信息来配置所述下游机器学习任务。可选地,在所述方法中,响应于所述机器学习任务的配置结束来自动执行步骤(C),或者,响应于以所述机器学习任务为上游机器学习任务的下游机器学习任务的配置开始来自动执行步骤(C),或者,响应于用户的推断指示来执行步骤(C)。可选地,在所述方法中,机器学习任务被实现为有向无环图中的可配置顶点,其中,响应于所述机器学习任务的配置结束来自动执行步骤(C),并且,在用户连接代表配置的所述机器学习任务的可配置顶点与代表以所述机器学习任务为上游机器学习任务的下游机器学习任务的可配置顶点时自动执行步骤(D)。可选地,所述方法还包括:(H)根据用户的执行指示来执行一个或多个配置的机器学习任务。可选地,在所述方法中,在步骤(C)中,通过解释所述机器学习任务的执行指令和/或通过针对从所述机器学习任务的输入数据之中抽取的抽样数据执行所述执行指令来推断所述机器学习任务的中间处理数据和/或输出数据的数据属性信息。根据本专利技术的另一示例性实施例,提供一种执行机器学习流程的系统,包括:显示装置,用于向用户展示用于配置机器学习任务的图形界面,其中,机器学习任务用于执行机器学习流程所包括的数据处理;检测装置,用于检测用户通过图形界面执行的输入操作;配置装置,用于根据检测到的用户通过所述图形界面执行的输入操作来配置所述机器学习任务;以及推断装置,用于在不执行配置的所述机器学习任务的情况下,推断与所述机器学习任务有关的数据属性信息,其中,数据属性信息包括数据属性字段的名称和/或数据类型。可选地,在所述系统中,显示装置还向用户展示由推断装置所推断出的数据属性信息。可选地,在所述系统中,推断装置推断出的数据属性信息是所述机器学习任务的输入数据、输出数据和/或中间处理数据的数据属性信息。可选地,在所述系统中,显示装置还向用户展示用于配置以所述机器学习任务为上游机器学习任务的下游机器学习任务的图形界面;检测装置还检测用户通过所述图形界面执行的输入操作;配置装置根据检测到的用户通过所述图形界面执行的输入操作来配置所述下游机器学习任务;并且,配置装置基于由推断装置所推断出的与所述机器学习任务有关的数据属性信息来检验所述下游机器学习任务的配置。可选地,在所述系统中,显示装置在图形界面中向用户展示由推断装置所推断出的与所述机器学习任务有关的数据属性信息,使得用户基于展示的数据属性信息来配置所述下游机器学习任务。可选地,在所述系统中,推断装置响应于所述机器学习任务的配置结束来自动推断与所述机器学习任务有关的数据属性信息,或者,推断装本文档来自技高网
...
执行机器学习流程的方法及系统

【技术保护点】
一种执行机器学习流程的方法,包括:(A)向用户展示用于配置机器学习任务的图形界面并检测用户通过图形界面执行的输入操作,其中,机器学习任务用于执行机器学习流程所包括的数据处理;(B)根据检测到的用户通过所述图形界面执行的输入操作来配置所述机器学习任务;以及(C)在不执行配置的所述机器学习任务的情况下,推断与所述机器学习任务有关的数据属性信息,其中,数据属性信息包括数据属性字段的名称和/或数据类型。

【技术特征摘要】
1.一种执行机器学习流程的方法,包括:(A)向用户展示用于配置机器学习任务的图形界面并检测用户通过图形界面执行的输入操作,其中,机器学习任务用于执行机器学习流程所包括的数据处理;(B)根据检测到的用户通过所述图形界面执行的输入操作来配置所述机器学习任务;以及(C)在不执行配置的所述机器学习任务的情况下,推断与所述机器学习任务有关的数据属性信息,其中,数据属性信息包括数据属性字段的名称和/或数据类型。2.如权利要求1所述的方法,还包括:(D)向用户展示在步骤(C)推断出的数据属性信息。3.如权利要求1所述的方法,其中,在步骤(C)中,推断出的数据属性信息是所述机器学习任务的输入数据、输出数据和/或中间处理数据的数据属性信息。4.如权利要求1或3所述的方法,还包括:(E)向用户展示用于配置以所述机器学习任务为上游机器学习任务的下游机器学习任务的图形界面并检测用户通过所述图形界面执行的输入操作;(F)根据检测到的用户通过所述图形界面执行的输入操作来配置所述下游机器学习任务;(G)基于在步骤(C)推断出的数据属性信息来检验所述下游机器学习任务的配置。5.如权利要求1所述的方法,其中,响应于所述机器学习任务的配置结束来自动执行步骤(C),或者,响应于以所述机器学习任务为上游机器学习任务的下游机器学习任务的配置开始来自动执行步骤(C),或者,响应于用户的推断指示来执行步骤(C)。6.如权利要求2所述的方法,其中,机器学习任务被实现为有向无环图中的可配置顶点,其中,响应于所述机器学习任务的配置结束来自动执行步骤(C),并且,在用户连接代表配置的所述机器学习任务的可配置顶点与代表以所述机器学习任务为上游机器学习任务的下游机器学习任务的可配置顶点时自动执行步骤(D)。7.如权利要求3所述的方法,其中,在步骤(C)中,通过解释所述机器学习任务的执行指令和/或通过...

【专利技术属性】
技术研发人员:栾淑君杨慧斌孙迪
申请(专利权)人:北京物思创想科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1