The invention relates to a method and system for data development and operation, the method includes: extended data calculation process, the formation of integrated environment data processing; the integrated environment based on large data acquisition, customized processing; data uploading the making process of big data scheduling run the upload process and display the results. The abstract data application development process, the big data application development process are integrated together to facilitate users to customize the data processing flow, improve work efficiency, reduce the data application threshold, reducing the production cost target.
【技术实现步骤摘要】
本专利技术涉及数据处理领域,尤其涉及一种大数据开发与运行方法及系统。
技术介绍
目前,各公司、单位通常基于开源或商业的大数据基础平台进行大数据应用开发,这些开源或商业的大数据基础平台通常对Hadoop、Spark体系平台进行了定制、封装和集成。在此基础上进行大数据开发时,通常在本地完成程序的开发和编译,随后上传到上述平台运行。此种方式中的所有运行、调度等工作都需要自写代码完成,其大致流程如图1所示,首先,开发人员在本地计算机进行大数据应用开发,并编译成在大数据平台运行的目标文件;操作人员将目标文件上传到大数据平台,并使用命令行提交到大数据平台运行;运行成功结束或失败后,操作人员检查运行结果、日志。如运行结果与预想的不一致,则开发人员还需要再修改、编译代码。然后再重复上述过程。现有大数据平台是通常只是大数据运行Hadoop、Spark框架和组件的堆砌,相关通常直接基于上述底层的组件进行开发和运行,在诸多方面具有不足,大致有以下几种缺点:1、大数据应用门槛高大数据运行Hadoop、Spark框架包含程序组件有上百个之多,开发人员、运维人员学习这些框架的曲线非常陡峭。另外,人才市场也缺少具有这些技能的开发人员与运维人员。基于以上原因,企业要在现有大数据平台上开展大数据应用,门槛非常高。2、生产效率低下从上面描述的生产过程可知,在现有大数据平台上开展大数据应用的几个步骤是完全割裂的。在实际的工作中往往需要反复执行上述步骤,割裂的步骤导致低下的生产效率。3、生产成本高开展大数据应用的高门槛、生产效率的低下,导致企业或单位开展大数据应用的成本极高,严重阻碍了大数据行 ...
【技术保护点】
一种大数据开发与运行方法,其特征在于,包括:扩展大数据计算处理流程,形成大数据处理流程的集成环境;基于所述集成环境,获取用户定制的大数据处理流程;上传所述定制的大数据处理流程,调度运行所述上传的大数据处理流程,并显示运行结果。
【技术特征摘要】
1.一种大数据开发与运行方法,其特征在于,包括:扩展大数据计算处理流程,形成大数据处理流程的集成环境;基于所述集成环境,获取用户定制的大数据处理流程;上传所述定制的大数据处理流程,调度运行所述上传的大数据处理流程,并显示运行结果。2.根据权利要求1所述的大数据开发与运行方法,其特征在于,用户根据所述运行结果,与其期望运行结果进行对比,如果所述运行结果与其期望运行结果不同,则重新定制新的大数据处理流程。3.根据权利要求1所述的大数据开发与运行方法,其特征在于,所述扩展大数据计算处理流程,形成大数据处理流程的集成环境的步骤包括数据采集的扩展、数据存储的扩展、数据处理的扩展和数据分享的扩展。4.根据权利要求3所述的大数据开发与运行方法,其特征在于,所述数据采集的扩展包括历史数据的采集和实时数据的采集,采集的数据类型包括结构化数据、半结构化数据和非结构化数据。5.根据权利要求3或4所述的大数据开发与运行方法,其特征在于,所述数据存储的扩展包括存储结构化数据的关系型数据存储和支持存储半结构化数据和非结构化数据的非关系型数据存储。6.根据权利要求3或4所述的大数据开发与运行方法,其特征在于,所述数据处理的扩展包括SQL处理、通用算法处理及利用用户开发的处理程序的处理;所述数据分享的扩展包括数据的批量输出、实时输出和外部高并发访问。7.一种大数据开发与运行系统,其特征在于,包括:处理流程集成模块,用于集成扩展后的大数据计算处理流程;获取模块,用于获取用户定制的大数据处理流程;上传模块,用于将定制的大数据处理流程上传至大数...
【专利技术属性】
技术研发人员:黄超,曹正凤,张祺君,郜义浩,边海叶,
申请(专利权)人:北京云星宇交通科技股份有限公司,北京博宇通达科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。