【技术实现步骤摘要】
数据导出方法及其装置、电子设备以及存储介质
本公开涉及云计算
,尤其涉及分布式存储
更具体地,本公开提供了一种数据导出方法及其装置、电子设备以及存储介质。
技术介绍
云计算基于分布式存储提供大容量的存储和高效率的计算,分布式存储的核心功能是数据导出,导出的数据能够用于支持云上存储产品的功能以及用于数据分析。目前的数据导出方法在数据导出的完整性和/或实时性上存在缺陷,直接影响到存储系统的性能。因此,需要一种数据导出方法和设备,其能够实现具有更高的实时性和数据完整性的数据导出。
技术实现思路
提供了一种数据导出方法及其装置、电子设备以及存储介质。根据第一方面,提供了一种数据导出方法,包括:接收数据导出指令,数据导出指令包括第一时间信息、第二时间信息和至少一个存储单元标识,其中至少一个存储单元标识与至少一个存储单元一一对应;根据第一时间信息,从至少一个存储单元导出在第一时间信息指示的第一时刻之前存储的存量数据;以及根据第二时间信息,从第二时间信息指示的第二时刻起,以预定时间间隔从至少一个存储单元导出至少一个存储单元存储的增量数据,其中,增量数据是前一次从至少一个存储单元导出更新数据到当前时刻期间,至少一个存储单元被写入的数据。根据第二方面,提供了一种数据导出装置,包括:接收单元,用于接收数据导出指令,数据导出指令包括第一时间信息、第二时间信息和至少一个存储单元标识,其中至少一个存储单元标识与至少一个存储单元一一对应;第一导出单元,用于根据第一时间信息,从至少一个存储 ...
【技术保护点】
1.一种数据导出方法,包括:/n接收数据导出指令,所述数据导出指令包括第一时间信息、第二时间信息和至少一个存储单元标识,其中所述至少一个存储单元标识与至少一个存储单元一一对应;/n根据第一时间信息,从至少一个存储单元导出在第一时间信息指示的第一时刻之前存储的存量数据;以及/n根据第二时间信息,从第二时间信息指示的第二时刻起,以预定时间间隔从所述至少一个存储单元导出所述至少一个存储单元存储的增量数据,其中,所述增量数据是前一次从所述至少一个存储单元导出更新数据到当前时刻期间,所述至少一个存储单元被写入的数据。/n
【技术特征摘要】
1.一种数据导出方法,包括:
接收数据导出指令,所述数据导出指令包括第一时间信息、第二时间信息和至少一个存储单元标识,其中所述至少一个存储单元标识与至少一个存储单元一一对应;
根据第一时间信息,从至少一个存储单元导出在第一时间信息指示的第一时刻之前存储的存量数据;以及
根据第二时间信息,从第二时间信息指示的第二时刻起,以预定时间间隔从所述至少一个存储单元导出所述至少一个存储单元存储的增量数据,其中,所述增量数据是前一次从所述至少一个存储单元导出更新数据到当前时刻期间,所述至少一个存储单元被写入的数据。
2.根据权利要求1所述的方法,其中,所述至少一个存储单元中的每个存储单元包括第一存储区和第二存储区,第一存储区和第二存储区配置为同步存储被写入的数据;
所述从至少一个存储单元导出存量数据包括以打快照的方式从第一存储区导出存量数据;以及
所述从至少一个存储单元导出增量数据包括从第一存储区导出增量数据。
3.根据权利要求2所述的方法,还包括:
设置导出数据索引值,所述导出数据索引值指示了已导出增量数据的数据量;
根据当前导出的增量数据的数据量,将所述导出数据索引值增大对应数值,得到所述导出数据索引的当前值;
将所述当前值与预定阈值进行比较;以及
在所述当前值大于等于所述预定阈值的情况下,使得清除所述第二存储区中存储的数据,并将所述导出数据索引值复位。
4.根据权利要求1所述的方法,其中,所述第一时刻在第二时刻之后。
5.根据权利要求1所述的方法,其中,所述至少一个存储单元中存储的数据具有数据标签,所述数据标签包括数据标识和数据写入时刻。
6.根据权利要求5所述的方法,还包括:
获取在第一时刻导出的存量数据的数据标签;
获取在第一时刻和第二时刻之间导出的增量数据的数据标签;
将存量数据的数据标签与增量数据的数据标签进行比较;以及
根据比较结果,清除获取的存量数据与获取的增量数据之间的重复数据。
7.根据权利要求5所述的方法,还包括:
根据已导出数据的数据标签,确定已导出数据是否存在数据缺失;
在确定已导出数据存在数据缺失的情况下,从所述第二存储区导出缺失的数据。
8.根据权利要求5所述的方法,还包括:
根据已导出数据的数据写入时刻,按照时间顺序对导出的存量数据和增量数据进行排序,得到已排序数据;以及
根据已导出数据的数据标识,将所述已排序数据聚合为多个数据集,以便分发所述多个数据集。
9.一种数据导出装置,包括:
接收单元,用于接收数据导出指令,所述数据导出指令包括第一时间信息、第二时间信息和至少一个存储单元标识,其中所述至少一个存储单元标识与至少一个存储单元一一对应;
第一导出单元,用于根据第一时间信息,从至少一个存储单元导出在第一时间信息指示的第一时刻之前存储的存量数据;以及
第二导出单元,用于根据第二时间信息,从第二时间信息指示的第二时刻起,以预定时间间...
【专利技术属性】
技术研发人员:席涛,王悦,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。