一种基于流处理大数据实时计算任务平台技术的方法技术

技术编号：34443724 阅读：35 留言：0更新日期：2022-08-06 16:36

本发明专利技术公开了一种基于流处理大数据实时计算任务平台技术的方法，涉及实时计算任务平台技术领域。本发明专利技术至少包括以下步骤：基于Flink程序的处理流计算引擎，将实时数据的处理分成一系列的小批量任务，并由Flink运行时框架执行，在Flink程序中以层级式系统形式组件其软件栈，不同层的栈建立在其下层基础上，并且各层接收程序不同层的抽象形式，运行时层以JobGraph形式接收程序，采用DataStreamAPI和DataSetAPI单独编译的处理方式生成JobGraph。本发明专利技术通过整体的设计，从而实现一种基于流处理大数据实时计算任务平台的技术，进而实现云原生数据仓库，能够充分地利用云架构提供的资源弹性优势，为用户提供成本更低、效率更高的数仓服务。效率更高的数仓服务。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于流处理大数据实时计算任务平台技术的方法

[0001]本专利技术涉及实时计算任务平台
，具体为一种基于流处理大数据实时计算任务平台技术的方法。

技术介绍

[0002]大数据中与离线计算对应的则是实时计算，由于应用场景的各不相同，所以这两种计算引擎接收数据的方式也不太一样：离线计算的数据是固定的即为不再会发生变化的，通常离线计算的任务都是定时的，然而实时计算的数据源却是流式的，对于流处理往往需要柴永实时计算进行应用，但是，现有应用的方法，缺乏搭建大数据实时计算引擎的计算任务平台，导致效果较差。

技术实现思路

[0003]本专利技术的目的在于提供一种基于流处理大数据实时计算任务平台技术的方法，以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的，本专利技术提供如下技术方案：一种基于流处理大数据实时计算任务平台技术的方法，至少包括以下步骤：
[0005]基于Flink程序的处理流计算引擎，将实时数据的处理分成一系列的小批量任务，并由Flink运行时框架执行；
[0006]在Flink程序中以层级式系统形式组件其软件栈，不同层的栈建立在其下层基础上，并且各层接受程序不同层的抽象形式；
[0007]运行时层以JobGraph形式接收程序；
[0008]采用DataStreamAPI和DataSetAPI单独编译的处理方式生成JobGraph；
[0009]通过Flink中的Stream形成中间结果数据，并通过执行Transformation 对...

【技术保护点】

【技术特征摘要】
1.一种基于流处理大数据实时计算任务平台技术的方法，其特征在于：至少包括以下步骤：基于Flink程序的处理流计算引擎，将实时数据的处理分成一系列的小批量任务，并由Flink运行时框架执行；在Flink程序中以层级式系统形式组件其软件栈，不同层的栈建立在其下层基础上，并且各层接受程序不同层的抽象形式；运行时层以JobGraph形式接收程序；采用DataStreamAPI和DataSetAPI单独编译的处理方式生成JobGraph；通过Flink中的Stream形成中间结果数据，并通过执行Transformation对一个或多个输入Stream进行计算处理以及输出一个或多个结果Stream；Flink程序被执行的时候，被映射形成StreamingDataflow，StreamingDataflow包括一组St...

【专利技术属性】
技术研发人员：魏俊杰，蓝岸，熊黄，何翼，余翔达，
申请(专利权)人：深圳新闻网传媒股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人