数据流存储方法、装置以及计算机存储介质制造方法及图纸

技术编号：25708208 阅读：21 留言：0更新日期：2020-09-23 02:55

一种数据流存储方法、装置以及计算机存储介质，所述方法包括：获取数据流；确定数据流中的数据的关键字；根据数据的关键字将数据分配分区；对各个区内的数据进行存储。采用上述方案，可以避免出现由于处理不及时而导致数据丢失的情况，在数据存储出现故障时，易于根据数据的关键字定位数据的分区，进而对相应的数据进行恢复。

全部详细技术资料下载

【技术实现步骤摘要】
数据流存储方法、装置以及计算机存储介质
本专利技术涉及数据处理领域，尤其涉及一种数据流存储方法、装置以及计算机存储介质。
技术介绍
在数据处理中，存在一种由持续大量产生的多组数据组成的数据流，所述数据流持续带来数据。如果不对数据流中的数据进行及时的处理或者存储，数据将会丢失。现有技术中，对上述数据流进行处理的方案是直接将数据流中的数据进行存储。然而，采用上述方案，当数据出现存储故障时，由于数据流的数据量过大，难以确定数据存储的位置，进而影响数据恢复。
技术实现思路
本专利技术解决的技术问题是数据恢复困难。为解决上述技术问题，本专利技术实施例提供一种数据流存储方法，包括：获取数据流；确定数据流中的数据的关键字；根据所述数据的关键字将数据分配分区；对各个分区内的数据进行存储。可选的，通过Kafka获取多条数据组成的数据流。可选的，使用Hash算法计算各条数据的关键字。可选的，根据预设的分区的数量，使用Hash取模算法，通过所述数据的关键字计算所述数据对应的分区序号。可选的，对各个分区内的数据进行序列化；存储序列化后的数据。可选的，对各个分区内的数据进行快照存储。本专利技术还提供一种数据流存储装置，包括：获取单元，用于获取数据流；确定单元，用于确定数据流中的数据的关键字；分配单元，用于根据所述数据的关键字将数据分配分区；存储单元，用于对各个分区内的数据进行存储。可选的，所述获取单元，还用于通过Kafka获取多条数据组成的数据流。可选...

【技术保护点】
1.一种数据流存储方法，其特征在于，包括：/n获取数据流；/n确定数据流中的数据的关键字；/n根据所述数据的关键字将数据分配分区；/n对各个分区内的数据进行存储。/n

【技术特征摘要】
1.一种数据流存储方法，其特征在于，包括：
获取数据流；
确定数据流中的数据的关键字；
根据所述数据的关键字将数据分配分区；
对各个分区内的数据进行存储。

2.根据权利要求1所述的数据流存储方法，其特征在于，所述获取数据流，包括：
通过Kafka获取多条数据组成的数据流。

3.根据权利要求1所述的数据流存储方法，其特征在于，所述确定数据流中的数据的关键字，包括：
使用Hash算法计算各条数据的关键字。

4.根据权利要求3所述的数据流存储方法，其特征在于，所述根据所述数据的关键字将数据分配分区，包括：
根据预设的分区的数量，使用Hash取模算法，通过所述数据的关键字计算所述数据对应的分区序号。

5.根据权利要求1所述的数据流存储方法，其特征在于，所述对各个分区内的数据进行存储，包括：
对各个分区内的数据进行序列化；
存储序列化后的数据。

6.根据权利要求1所述的数据流存储方法，其特征在于，所述对各个分区内的数据进行存储，包括：
对各个分区内的数据进行快照存储。

7.一种数据流存储装置，其特征在于，包括：
获取单元，用于获取数据流；
确定单元，用于确定数据流中的数据的关键字；
分配单元，用于根据所述数据...

【专利技术属性】
技术研发人员：唐英荣，
申请(专利权)人：上海晶赞融宣科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人