本公开的实施例公开了实时流数据存储方法、装置、终端设备。该方法的一具体实施方式包括:接收目标终端设备发来的消息集集合,其中,响应于发送消息集集合,目标终端设备删除消息集集合,消息集集合包括实时消费者组和重跑消费者组;将消息集集合中的各个实时消息数据开关标识符和重跑数据开关标识符设置为表征开启状态;根据消息集集合,生成目标消息组集合;基于目标消息组集合,生成输出消息组集合;更新目标消息组集合;将输出消息组集合发送至目标终端设备,其中,目标终端设备存储以及显示输出消息组集合。该实施方式根据数据开关标识符更新实时流数据,及时删除无效数据,节省数据存储空间,提高了实时流数据的存储效率。提高了实时流数据的存储效率。提高了实时流数据的存储效率。
【技术实现步骤摘要】
实时流数据存储方法、装置、终端设备
[0001]本公开的实施例涉及计算机
,具体涉及实时流数据存储方法、装置、终端设备。
技术介绍
[0002]随着大数据技术的不断发展,针对海量数据的清洗、加工、处理对于大数据存储及后续大数据应用的重要性日益显现。将数据库中的数据经过抽取、清洗、转换将分散、零乱、标准不统一的数据整合到一起,通过在分析数据库中建模数据能够提高查询性能。而合并来自多个来源的数据,构建复杂的连接和聚合,以创建数据的可视化图标使用户能更直观获得数据价值。实时流数据处理是大数据处理的一个重要应用场景,数据源是实时的不间断的,要求用户的响应时间也是实时的。实时流数据处理包括数据产生与收集阶段、传输与分析处理阶段和存储对对外提供服务阶段。
[0003]然而,在进行实时流数据处理和存储的过程中,经常会存在如下技术问题:
[0004]现有技术在处理实时流计算修数问题时,如果无法有效隔离历史数据和实时修数后的数据,则当前数据存在被重复计算后的历史数据覆盖的数据倒退现象。而采用同时构建两套数据系统的方法,维护两套系统间的一致性非常困难,且浪费了服务器的存储资源,影响了实时流数据的存储效率。
技术实现思路
[0005]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0006]本公开的一些实施例提出了实时流数据存储方法、装置、终端设备,来解决以上
技术介绍
部分提到的技术问题中的一项或多项。
[0007]第一方面,本公开的一些实施例提供了一种实时流数据存储方法,该方法包括:接收目标终端设备发来的消息集集合,其中,响应于发送消息集集合,目标终端设备删除所述消息集集合,消息集集合包括实时消费者组和重跑消费者组,实时消费者组包括第一数目条实时消息集,重跑消费者组包括第二数目条重跑消息集,实时消息集包括实时消息信息集合和实时消息数据开关标识符,重跑消息集包括重跑消息信息集合和重跑消息数据开关标识符;将消息集集合中的各个实时消息数据开关标识符和重跑数据开关标识符设置为表征开启状态;根据消息集集合,生成目标消息组集合,其中,目标消息组集合包括第三数目个目标消息组,目标消息组包括属性标签、数据开关标识符、目标数据、目标消息、目标消息水位线、对象唯一键;基于目标消息组集合,生成输出消息组集合;更新目标消息组集合;将输出消息组集合发送至目标终端设备,其中,目标终端设备存储以及显示输出消息组集合。
[0008]第二方面,本公开的一些实施例提供了一种实时流数据存储装置,该装置包括:接收单元,被配置成接收目标终端设备发来的消息集集合,其中,响应于发送消息集集合,目
标终端设备删除所述消息集集合,消息集集合包括实时消费者组和重跑消费者组,实时消费者组包括第一数目条实时消息集,重跑消费者组包括第二数目条重跑消息集,实时消息集包括实时消息信息集合和实时消息数据开关标识符,重跑消息集包括重跑消息信息集合和重跑消息数据开关标识符;设置单元,被配置成将消息集集合中的各个实时消息数据开关标识符和重跑数据开关标识符设置为表征开启状态;第一生成单元,被配置成根据消息集集合,生成目标消息组集合,其中,目标消息组集合包括第三数目个目标消息组,目标消息组包括属性标签、数据开关标识符、目标数据、目标消息、目标消息水位线、对象唯一键;第二生成单元,被配置成基于目标消息组集合,生成输出消息组集合;更新单元,被配置成更新目标消息组集合;发送单元,被配置成将输出消息组集合发送至目标终端设备,其中,目标终端设备存储以及显示输出消息组集合。
[0009]第三方面,本公开的一些实施例提供了一种终端设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一的方法。
[0010]本公开的上述各个实施例中具有如下有益效果:通过本公开的一些实施例的实时流数据存储方法能够根据数据开关标识符更新实时流数据,及时删除无效数据,节省数据存储空间,提高了实时流数据的存储效率。具体来说,专利技术人发现,造成目前实时流数据存储资源浪费和效率较低的原因在于:现有技术在处理实时流计算修数问题时,如果无法有效隔离历史数据和实时修数后的数据,则当前数据存在被重复计算后的历史数据覆盖的数据倒退现象。而采用同时构建两套数据系统的方法,维护两套系统间的一致性非常困难,且浪费了服务器的存储资源,影响了实时流数据的存储效率。基于此,首先,本公开的一些实施例接收目标终端设备发来的消息集集合。其中,响应于发送消息集集合,上述目标终端设备删除上述消息集集合。消息集集合包括实时消费者组和重跑消费者组,实时消费者组包括第一数目条实时消息集,重跑消费者组包括第二数目条重跑消息集,实时消息集包括实时消息信息集合和实时消息数据开关标识符,重跑消息集包括重跑消息信息集合和重跑消息数据开关标识符。其次,将消息集集合中的各个实时消息数据开关标识符和重跑数据开关标识符设置为表征开启状态。再次,根据消息集集合,生成目标消息组集合。其中,目标消息组集合包括第三数目个目标消息组,目标消息组包括属性标签、数据开关标识符、目标消息、目标消息水位线、对象唯一键。然后,基于目标消息组集合,生成输出消息组集合,以及,更新目标消息组集合。最后,将输出消息组集合发送至目标终端设备。其中,目标终端设备存储以及显示输出消息组集合。该方法将消息集集合区分为实时消费者组和重跑消费者组,从而区分开历史实时数据和需要重跑修数的实时数据,无需搭建两套系统分别存储,节省了数据存储资源。此外,利用数据开关标识符控制数据修数状态,根据对象唯一键进行数据更新,避免了数据倒退现象,提高了实时流数据的存储效率。
附图说明
[0011]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
[0012]图1是本公开的一些实施例可以应用于其中的示例性系统的架构图;
[0013]图2是根据本公开的实时流数据存储方法的一些实施例的流程图;
[0014]图3是根据本公开的实时流数据存储装置的一些实施例的流程图;
[0015]图4是适于用来实现本公开的一些实施例的终端设备的结构示意图。
具体实施方式
[0016]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0017]另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下,本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种实时流数据存储方法,包括:接收目标终端设备发来的消息集集合,其中,响应于发送消息集集合,所述目标终端设备删除所述消息集集合,所述消息集集合包括实时消费者组和重跑消费者组,所述实时消费者组包括第一数目条实时消息集,所述重跑消费者组包括第二数目条重跑消息集,所述实时消息集包括实时消息信息集合和实时消息数据开关标识符,所述重跑消息集包括重跑消息信息集合和重跑消息数据开关标识符;将所述消息集集合中的各个实时消息数据开关标识符和重跑数据开关标识符设置为表征开启状态;根据所述消息集集合,生成目标消息组集合,其中,所述目标消息组集合包括第三数目个目标消息组,所述目标消息组包括属性标签、数据开关标识符、目标数据、目标消息、目标消息水位线、对象唯一键;基于所述目标消息组集合,生成输出消息组集合;更新所述目标消息组集合;将所述输出消息组集合发送至所述目标终端设备,其中,所述目标终端设备存储以及显示所述输出消息组集合。2.根据权利要求1所述的方法,其中,所述属性标签包括实时属性标签和重跑属性标签。3.根据权利要求2所述的方法,其中,所述更新所述目标消息组集合,包括:将所述目标消息组集合中的各个实时属性标签对应的数据开关标识符设置为表征关闭状态;将所述目标消息组集合中的各个重跑属性标签设置为实时属性标签。4.根据权利要求3所述的方法,其中,所述基于所述目标消息组集合,生成输出消息组集合,包括:根据所述属性标签将所述目标消息组集合划分为实时目标消息组集合和重跑目标消息组集合;对所述重跑目标消息组集合进行聚合处理,以得到输出重跑消息组集合;基于所述输出重跑消息组集合,生成输出消息组集合。5.根据权利要求4所述的方法,其中,所述基于所述输出重跑消息组集合,生成输出消息组集合,包括:对所述输出重跑消息组集合中的每个输出重跑消息组,根据该输出重跑消息组的对象唯一键在预先确定的状态后端查找该输出重跑消息组;响应于查找到该输出重跑消息组,将预先确定的状态后端中查找到的该输出重跑消息组的水位线确定为标准水位线;对所述输出重跑消息组集合中的每个输出重跑消息组,根据所述标准水位线生成该输出重跑消息组的过滤指标,以得到过滤...
【专利技术属性】
技术研发人员:赵玉峰,
申请(专利权)人:多点生活成都科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。