一种在数据存储器中用于时间线压缩的技术制造技术

技术编号:10221203 阅读:203 留言:0更新日期:2014-07-16 21:54
公开了一种在数据存储器中用于时间线压缩的技术。在一个特定实施例中,所述技术可实现为在存储系统中用于时间线压缩的方法,其中所述存储系统的数字内容被备份以使得所述数字内容能够恢复到时间线的一个或更多个点上。所述方法可包括在所述时间线上选择时间间隔。所述方法也可包括识别为所选择的时间间隔记录的一组或更多组备份数据,其中所识别的一组或更多组备份数据代表在所选择的时间间隔内被改写的旧数据的至少一部分。所述方法可进一步包括丢弃为所选择的时间间隔记录的其它备份数据,从而降低所选择的时间间隔内的时间线的粒度水平。

【技术实现步骤摘要】
一种在数据存储器中用于时间线压缩的技术本申请是2006年10月13日提交的名称为“一种在数据存储器中用于时间线压缩的技术”的中国专利申请200680043342.5的分案申请。相关申请的交叉引用本专利申请要求2005年10月14日提交的编号为60/726,187的美国临时专利申请的优先权,所述临时申请的全部作为参考合并于此。本专利申请与2004年8月24日提交的编号为10/924,652的美国专利申请相关,后者是2003年9月23日提交的编号为10/668,883的美国专利申请的部分延续,它们的全部都作为参考合并于此。
本公开一般地涉及数据存储,特别地涉及在数据存储器中用于时间线压缩的技术。
技术介绍
在相关的编号为10/924,652的美国专利申请和编号为10/668,833的美国专利申请中,公开了一种依赖时间的数据存储和恢复技术。这一技术的实施例提供了连续数据保护(CDP)的方案,其中指向存储系统的写命令被具有当前存储器和时间存储器的存储管理系统拦截。当前存储器可保持或者存取存储系统的数字内容的当前(或镜像)复制。时间存储器可记录与每次被拦截的写命令相关联的信息,例如在该写命令的有效负荷中的新数据或在当前存储器中响应于写命令而要被覆盖的旧数据。响应于写命令对新数据或者旧数据进行的记录可称为写时复制(COW)操作,而所记录的新数据或旧数据可被称为COW数据。时间存储器也可记录与被拦截的写命令和/或相应COW操作相关的其它信息(例如元数据),相应COW操作包括例如时间戳,旧数据被改写的当前存储器中的原始位置,以及COW数据被复制到的时间存储器中的目的位置。每个COW操作一般备份一个或更多个COW数据块,从而产生一组COW数据和相应元数据。经过一段时间,多组COW数据和相应元数据(包括时间戳)可被累积作为在当前存储器或存储系统中写入和改写的内容的历史记录的集合。时间存储器的内容可基于元数据被索引以便于对COW数据的有效存取。在当前存储器中包含存储系统的数字内容的当前复制以及在时间存储器中包含历史记录的情况下,存储管理系统为存储系统增加了一个新的维度,即时间。假定所述存储管理系统自一个过去时刻开始已经和所述存储系统操作性耦合,则所述存储管理系统可快速而准确地把存储系统中的任何可寻址的内容恢复到从所述过去时刻到当前时刻中的任何时间点。理想地,希望保持这样的数据恢复能力尽量长的时间线。但是要想提供延长的时间线,需要巨大的存储空间来存储该时间线中对应每个写命令的COW数据和相应元数据。如果所述存储系统寻求较高的写入率(即每个单元时间内写操作的次数),则需要更多的存储空间。一种临时方案可以是简单地增加时间存储器的存储空间。但是,除了更高的开销,简单的存储量增加可能不会与系统的其余部分协调良好并易于导致过多的其它问题,诸如对额外数据量的解析困难导致的性能降低。由于没有无限的存储能力,大多数存储系统不得不满足于只能保持有限长度的时间线(例如十天或两周)的现实。在传统数据保护系统,典型地保持一些天的有价值的备份数据而完全丢弃超过一些天数的备份数据。在这些系统中,数据恢复能力限于备份数据可用的过去的一些天。作为替代,超过一些天的备份数据可周期性地移出站点。这样强力的方案开销大而且有破坏性,更不用说当需要离站(off-site)数据时对数据恢复请求的迟缓响应了。纵观前述,可能需要提供一种能够克服上述不足和缺点的数据存储管理方案。
技术实现思路
公开了一种在数据存储器中用于时间线压缩的技术。在一个特定的示例性实施例中,所述技术可实现为一种在存储系统中用于时间线压缩的方法,其中所述存储系统的数字内容被备份以使得所述数字内容能够恢复到时间线的一个或更多个点上。本方法可包括在所述时间线上选择时间间隔。所述方法也可包括识别为所选时间间隔记录的一组或更多组备份数据,其中所识别的一组或更多组备份数据代表在所选时间间隔中被改写的旧数据的至少一部分。所述方法可进一步包括丢弃为所选时间间隔记录的其它备份数据,从而降低所选时间间隔中的时间线的粒度水平。根据该特定示例性实施例的其它方面,所述存储系统的数字内容可通过写时复制操作备份为多组写时复制数据和相应元数据,而且所述识别步骤可进一步包括识别为所选时间间隔记录的一组或更多组写时复制数据和相应元数据。根据该特定示例性实施例的更多方面,时间间隔的长度可至少部分地基于时间线的所需粒度水平进行选择。根据该特定示例性实施例的附加方面,所述识别步骤可进一步包括:确定存储系统中的存储单元是否在所选时间间隔内被改写超过一次;如果所述存储单元在所选时间间隔内已被改写一次而导致唯一一组写时复制数据和相应元数据被记录,则选择所述唯一一组;而如果所述存储单元在所选时间间隔内已被改写超过一次而导致多组写时复制数据和相应元数据被记录,则选定多个组中的一个。根据该特定示例性实施例的另一方面,如果存储单元在所选时间间隔内被改写超过一次,所选的写时复制数据和相应元数据的组可能是为所选时间间隔记录的最早的组。根据该特定示例性实施例的又一方面,本方法可进一步包括合并在所识别的一组或更多组写时复制数据和相应元数据中的元数据。根据该特定示例性实施例的再一方面,本方法可进一步包括:识别对应于被合并元数据的写时复制数据;以及将之前为所选时间间隔记录的写时复制数据和相应元数据的所有组替换为包含所识别的写时复制数据和被合并的元数据的新组。根据该特定示例性实施例的另一方面,本方法可进一步包括:基于所述时间线的一部分的所需粒度水平,在所述时间线的所述部分上选择多个时间间隔;以及为所选多个时间间隔重复所述识别和丢弃的步骤。根据该特定示例性实施例的再一方面,所述存储系统可包括多个存储器件,所述方法可进一步包括:对一个或更多个所述多个存储器件重复所述识别和丢弃步骤以使得所述多个存储器件相互之间具有一致的时间线的粒度水平。根据该特定示例性实施例的又一方面,所述选择、识别和丢弃步骤在满足一个或更多个下面的条件时可被触发:所述时间线的预定存储容量已被耗尽;所述时间线的粒度水平的预定数据量已被积累;所述存储系统中至少两个存储器件的所述时间线的粒度水平不一致;收到降低所述时间线的所述粒度的指令;以及达到用于降低所述时间线的所述粒度的预设时间。根据该特定示例性实施例的另一方面,所述方法可进一步包括扫描存储系统以寻找一存储器件,针对该存储器件可以降低时间线的粒度。在另一个特定示例性实施例中,所述技术可实现为包含在至少一个载波中的至少一个信号,该载波用于传送计算机程序指令,其被配置为至少一个处理器可读以指示所述至少一个处理器执行计算机处理以完成前述的方法。在又一个特定示例性实施例中,所述技术可实现为至少一个处理器可读的载体,其用于存储一个计算机程序指令,该指令被配置为可由至少一个处理器读取以指示所述至少一个处理器执行计算机处理以完成前述方法。在另一个特定示例性实施例中,所述技术可实现为在存储系统中用于时间线压缩的系统,其中所述存储系统的数字内容被备份以使得所述数字内容能够恢复到时间线的一个或更多个点上。该系统可包括用于在时间线上选择时间间隔的装置。该系统也可包括用于识别为所述选定时间间隔记录的一组或更多组备份数据的装置,其中所识别的一组或更多组备份数据代表在所本文档来自技高网
...
一种在数据存储器中用于时间线压缩的技术

【技术保护点】
一种在存储系统中用于时间线压缩的方法,其中所述存储系统的数字内容被备份以使得所述数字内容能够恢复到时间线的一个或更多个点上,所述方法包括:在所述时间线上选择时间间隔,其中所述时间间隔是所述时间线中多个时间间隔中的一个,其中所述多个时间间隔中的每个具有相应关联的存储容量级别和存储长度;根据所选择的时间间隔的相应关联的存储容量级别和存储长度,识别为所选择的时间间隔记录的一组或更多组第一备份数据,以代表针对所选择的时间间隔的备份数据,其中所识别的一组或更多组第一备份数据代表在所选择的时间间隔内被改写的旧数据的至少一部分;以及根据所选择的时间间隔的相应关联的存储容量级别和存储长度,丢弃为所选择的时间间隔记录的一组或更多组第二备份数据,从而降低所述选择的时间间隔内的所述时间线的粒度水平并且避免所述存储系统的存储需求增加。

【技术特征摘要】
2005.10.14 US 60/726,1871.一种在存储系统中用于时间线压缩的方法,其中所述存储系统的数字内容被备份以使得所述数字内容能够恢复到时间线的一个或更多个点上,所述方法包括:在所述时间线上选择时间间隔,其中所述时间间隔是所述时间线中多个时间间隔中的一个,其中所述多个时间间隔中的每个具有相应关联的存储容量级别和存储时间长度;根据所选择的时间间隔的相应关联的存储容量级别和存储时间长度,识别为所选择的时间间隔记录的一组或更多组第一备份数据,以代表针对所选择的时间间隔的备份数据,其中所识别的一组或更多组第一备份数据代表在所选择的时间间隔内被改写的旧数据的至少一部分;以及根据所选择的时间间隔的相应关联的存储容量级别和存储时间长度,丢弃为所选择的时间间隔记录的一组或更多组第二备份数据,从而降低所述选择的时间间隔内的所述时间线的粒度水平并且避免所述存储系统的存储需求增加。2.根据权利要求1所述的方法,其中所述存储系统的所述数字内容通过写时复制操作备份到多组写时复制数据和相应元数据中,以及其中识别步骤进一步包括识别为所选择的时间间隔记录的一组或更多组写时复制数据和相应元数据。3.根据权利要求2所述的方法,其中所述时间间隔的长度至少部分地基于所述时间线的所需粒度水平进行选择。4.根据权利要求2所述的方法,其中识别步骤进一步包括:确定所述存储系统中的存储单元是否在所选择的时间间隔内已被改写超过一次;如果所述存储单元在所选择的时间间隔内已被改写过一次而导致唯一一组写时复制数据和相应元数据被记录,则选择所述唯一一组;以及如果所述存储单元在所选择的时间间隔内已被改写过多于一次而导致多组写时复制数据和相应元数据被记录,则选择所述多组写时复制数据和相应元数据中的一组。5.根据权利要求4所述的方法,其中,如果所述存储单元在所选择的时间间隔内被改写过多于一次,所选择的写时复制数据和相应元数据的组是为所选择的时间间隔记录的最早的组。6.根据权利要求2所述的方法,进一步包括:合并在所识别的一组或更多组写时复制数据和相应元数据...

【专利技术属性】
技术研发人员:R·P·帕塞里尼R·W·佩里C·A·罗卡M·D·安东尼
申请(专利权)人:塞门铁克操作公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1