The invention discloses a method for creating distributed algorithm for container operation and flow chart, container operation including the hardware module and software module and hardware module for the running environment of the algorithm; software modules include the flow chart drawing module, determine the module and the interface module and detection module. Create a new process method includes: firstly; and then to the process of adding algorithm; increase the algorithm to process, modify the properties used in the algorithm; the arrangement process, system operation in spark distributed computing, the results of the analysis. Compared with the existing technology in the distributed algorithm container operation and flow chart method to create the application, through a unified algorithm and interface standard, allows users the freedom to realize their algorithm and other algorithm system seamless combination; by drawing the flow chart of the algorithm, to achieve data analysis and processing of different combination of algorithms, analysis process diversification, strong practicability.
【技术实现步骤摘要】
一种适用于分布式算法的运行容器及流程图创建方法
本专利技术涉及大数据
,具体地说是一种实用性强、适用于分布式算法的运行容器及流程图创建方法。
技术介绍
随着信息时代的到来,数据的积累成几何倍增长。为了从已有的海量数据中挖掘有效信息,出现了各种不同的数据挖掘算法。在数据挖掘中,无法立即确定最合适的算法,需要通过不断的尝试不同的算法,或者算法组合来获得不同的计算结果。根据对不同的计算结果进行对比,从而获得最佳的算法方案、以及最优的分析结果,以获得最有效的数据反馈信息。数据分析人员需要既懂算法的原理,又要懂算法的具体代码实现。对技术人员要求较高,同时实现不同的算法组合分析数据时候,需要不断调整编码,较为繁琐。算法的改造一般针对三个方向进行,算法处理容器、算法编写规范、分布式运行框架。尤其是分布式算法,分布式算法的编写与传统算法开发差别较大,并且分布式算法的运行依托于特定的平台,而且不同的平台对分布式算法的开发要求不同,这就导致了同一种算法的实现在不同的平台下不同。在数据挖掘中,由于数据量大,导致单一服务器很难快速计算结果。鉴于此,现提供一种基于适用于分布式算法的运行容器及流程图创建方法。通过将绘制好的流程图自动运行到spark分布式计算系统中,通过采用云计算的方案,大大增加了运算速率。
技术实现思路
本专利技术的技术任务是针对以上不足之处,提供一种实用性强、适用于分布式算法的运行容器及流程图创建方法。一种适用于分布式算法的运行容器,包括硬件模块和软件模块,硬件模块为算法的运行环境;软件模块则包括流程图绘制模块、关系确定模块、接口模块和检测模块;其中:运行环境, ...
【技术保护点】
一种适用于分布式算法的运行容器,其特征在于,包括硬件模块和软件模块,硬件模块为算法的运行环境;软件模块则包括流程图绘制模块、关系确定模块、接口模块和检测模块;其中:运行环境,该运行环境采用spark分布式计算系统并用于算法的运行;流程图绘制模块,提供绘制界面使用户实现对算法流程的绘制,同时该绘制界面还用于添加算法实例节点;关系确定模块,在通过流程图绘制模块添加算法实例节点后,该关系确定模块通过算法实例节点与算法实例节点之间的连线来表示算法实例节点之间的关系;接口模块,提供用户增加新的算法的接口与标准,且该标准规范实现任意算法在流程图绘制模块中与其它算法随机组合,进行数据分析;检测模块,检测整个算法添加或组合过程的完整性。
【技术特征摘要】
1.一种适用于分布式算法的运行容器,其特征在于,包括硬件模块和软件模块,硬件模块为算法的运行环境;软件模块则包括流程图绘制模块、关系确定模块、接口模块和检测模块;其中:运行环境,该运行环境采用spark分布式计算系统并用于算法的运行;流程图绘制模块,提供绘制界面使用户实现对算法流程的绘制,同时该绘制界面还用于添加算法实例节点;关系确定模块,在通过流程图绘制模块添加算法实例节点后,该关系确定模块通过算法实例节点与算法实例节点之间的连线来表示算法实例节点之间的关系;接口模块,提供用户增加新的算法的接口与标准,且该标准规范实现任意算法在流程图绘制模块中与其它算法随机组合,进行数据分析;检测模块,检测整个算法添加或组合过程的完整性。2.根据权利要求1所述的一种适用于分布式算法的运行容器,其特征在于,所述流程图绘制模块中,提供浏览器使用户实现对算法流程的绘制,该绘制的算法流程图中包含算法实例节点以及算法实例节点的关系,算法实例节点的关系是通过算法之间的连线来确定。3....
【专利技术属性】
技术研发人员:王莹,张立军,孙丙聪,王栋,
申请(专利权)人:浪潮软件集团有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。