用于提供快照的文件系统的分层存储管理技术方案

技术编号:4664159 阅读:252 留言:0更新日期:2012-04-11 18:40
一种用于管理已经被选择从文件系统内的第一存储级别迁移到第二存储级别的文件的存储的方法。包括:将选定文件的索引节点的对应的索引中维护的物理磁盘地址处选定文件的存储在第一存储级别中的一个或多个数据块中的每一个数据块从第一存储级别复制到第二存储级别;在引用了选定文件的被复制到第二存储级别的一个或多个数据块中的一个数据块的文件系统中的每一个快照文件的索引节点的每一个索引中维护逻辑照抄地址;以及更新文件系统以包括用于通过选定文件的索引节点控制对一个或多个数据块的访问的受管理的区域。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及数据存储系统,更具体地说,涉及存储了表明在特定时间点存储的数据的状态的快照的数据存储系统。
技术介绍
许多数据存储系统根据文件比喻来组织存储的数据。在这些存储系统中,相关数据存储在一个文件中,而数据存储系统存储了多个文件。然后,数据存储系统存储对多个文件的索引,以允许访问这些文件中的数据。单个文件可以存储在数据存储设备中的相邻的或完全不同的位置。将数据存储在数据存储设备中的完全不同的位置,常常导致当要在已经存储了许多文件的设备上存储大的数据文件时,大的数据文件必须分解为适合存储设备内的空闲区域的数据块。当向现有文件中添加另外的数据时,数据也常常存储在完全不同的位置。将存储的数据组合成数据存储设备上的结构化文件被称为形成文件系统。 数据存储系统常常存储当前存储在文件系统中的所有文件的数据的时间点副本或映像。这些映像被称为快照(或克隆或快闪副本)。快照的内容是在捕获快照时存储在现用文件系统内的数据。数据存储系统可以使用快照来将文件系统的状态存储在诸如另一个磁盘驱动器或磁带存储系统之类的辅助存储器系统上。数据存储系统也可以使用文件系统快照来允许重新创建被删除的数据(即,访问已经被删除或更新的文件的以前的版本)。 为最小化创建快照的时间以及用于维护快照的存储空间,拍摄文件系统的快照的某些方法推迟了原始文件系统中的数据实际复制到快照的时间,直到原始系统中的数据被修改(例如,被盖写或删除)。因为直到对原始数据执行写入之前数据不被复制到快照数据中,因此,使用这种方法的系统被称为"写入时复制"系统。"写入时复制"技术常常用于实现文件版本控制,通过维护单个文件的快照,而不是整个系统,可以使文件的多个版本在文件系统中并行地存在。"写入时复制"系统可以利用由文件系统软件所创建的控制结构,以描述文件的结构以及包含文件系统的磁盘的用途的元数据,以便修改过的文件的未修改的数据块不需复制到快照中。这些系统创建快照元数据集,包括描述了原始文件系统中的原始数据文件的位置的文件索引,以便从原始文件内的元数据以及文件的快照副本中都可以引用未修改的数据块。这会创建多个对原始文件系统中的同一个数据块的多个索引原始文件系统的元数据中的索引和每一个快照数据集中的索引。 原始文件系统内的多个对单个数据块的索引的存在影响原始文件系统的要求。利用其中每一个快照都存储了对原始数据块的索引的快照的文件系统必须维护每一个对该数据块的索引的指示或映射,以便判断数据块是否正在使用中还是空闲。若没有多个索引,单个比特就可以足以表明数据块是否正在使用中还是空闲。然而,在有多个索引的情况下,可能需要多个比特来跟踪多个索引,确保在声明数据块"空闲"之前不存在对数据块的索引。由于较高速度的存储设备(如硬盘驱动器阵列)比慢一些的设备(如光盘和磁带驱动器)更加昂贵(每存储字节),因此,某些较大的文件系统使用分层存储管理器(HSM)自动地在高成本和低成本的存储介质之间移动数据。在使用HSM的文件系统(诸如,例如,来自IBM的ADSTAR分布式存储管理器、Tivoli的StorageManager Extended Edition,或Legato的NetWorker)中,大多数文件系统数据被存储在较慢的脱机设备中,并根据需要,复制到更快的联机磁盘驱动器中。HSM监视文件系统中的数据的使用,标识文件系统中的哪些文件长时间没有被访问,并将它们的所有数据或某些数据迁移到较慢的存储设备中。这就释放了更快的联机存储器中的空间,从而允许存储额外的文件和更多的数据。事实上,HSM通过将更快的磁盘驱动器变成较慢的大容量存储设备的高速缓存,提供了存储大量的数据的经济的解决办法。 在典型的HSM情况下,频繁地被使用的数据文件存储在硬盘驱动器上,而在某一时间段内未被使用的数据文件被迁移到磁带驱动器中。当用户尝试访问已经被迁移到磁带的数据文件时,文件自动地并透明地恢复到联机硬盘驱动器,可使操作完成得好像数据从来没有被迁移那样。优点是,尽管存储的数据的总量可以比可用的磁盘存储器的容量大得多,由于只有很少被使用的文件位于磁带上,因此,用户通常不会注意任何速度减慢。 这里专利技术人认识到,在利用快照的文件系统中,跟踪多个对单个数据块的索引的必要性会大大地使文件系统的操作复杂化,特别是在文件系统也使用HSM的情况下。例如,当HSM将文件迁移到磁带时,希望能够回收由该文件的数据块占用的磁盘空间。然而,在存在快照的情况下,这些数据块仍可以由快照从文件的较旧的版本引用,因此,直到文件的所有其他版本也都被迁移到磁带之前不能被释放。此外,尽管一旦一个文件的所有版本都被迁移HSM就可以回收由该文件占用的所有磁盘空间,被单独地存储并由不同文件版本的快照共享的数据块将作为单独的副本冗余地存储在磁带上。即,可以占据磁盘上的极少空间的快照将占用磁带上整个文件系统所占用的那么大的空间。另外,当HSM将迁移的文件返回到联机存储器时,将为返回的数据分配新的数据块,不能定位其他对初始块的其他联机索引。结果,恢复迁移的文件可能导致不需要的数据复制,并比从来没有被迁移的文件需要更大的联机存储空间。
技术实现思路
解决了现有技术的各种缺点,通过本专利技术的示例性实施例可以提供额外的优点,这些示例性实施例与用于管理已经被选择从文件系统内的第一存储级别迁移到第二存储级别的文件的存储的方法相关。选定文件是从多个源文件中选择的,每一个源文件都在文件系统内组织成一个或多个数据块。文件系统具有多个源文件中的每一个源文件的索引节点。每一个索引节点都具有对所述对应的源文件的一个或多个数据块中的每一个的索引。文件系统被配置为定期生成多个源文件中的所述源文件的快照文件。文件系统具有每一个快照文件的索引节点。在生成快照文件时,每一个快照文件的索引节点都具有对所述对应的源文件的所述一个或多个数据块中的每一个数据块的索引。该方法包括将所述选定文件的索引节点的所述对应的索引中维护的物理磁盘地址处所述选定文件的存储在所述第一存储级别中的所述一个或多个数据块中的每一个数据块从所述第一存储级别复制到所述第二存储级别。该方法进一步包括在引用了所述选定文件的被复制到所述第二存储级别的所述一个或多个数据块中的任何一个数据块的所述文件系统中的每一个快照文件的索引节点的每一个索引中维护逻辑照抄地址。每一个逻辑照抄地址都表明,需要另外的处理以 获得被所述索引引用的所述数据块的所述物理磁盘地址。该方法进一步包括更新文件系 统,以包括用于通过选定的文件的索引节点控制对一个或多个数据块的访问的受管理的区 域。附图说明 现在将参考下面的附图,只作为示例,对本专利技术的实施例进行描述,其中 图1是显示了提供分层系统管理的文件系统的一般系统体系结构的示例性实施例的方框图。 图2A是显示了具有索引节点和相关数据块的文件系统数据结构集的示例性实施 例的方框图。 图2B是显示了具有索引节点和关联的间接块的和数据块的文件系统数据结构集 的示例性实施例的方框图。 图3是显示了文件系统目录和关联的结构的示例性实施例的方框图。 图4是显示了其中一个以上的索引节点包含同一个磁盘地址的文件系统数据结构集的示例性实施例的方框图。 图5A-5B描述了本专利技术的示例性实施例的总体操作和控制流的流程图,其中,由 快本文档来自技高网
...

【技术保护点】
一种用于管理已经被选择从文件系统内的第一存储级别迁移到第二存储级别的文件的存储的方法,选定文件是从多个源文件中选择的,每一个源文件都在所述文件系统内组织成一个或多个数据块,所述文件系统具有所述多个源文件中的每一个源文件的索引节点,每一个索引节点都具有对对应的源文件的所述一个或多个数据块中的每一个的索引,所述文件系统被配置为定期生成所述多个源文件中的所述源文件的快照文件,所述文件系统具有每一个快照文件的索引,在生成所述快照文件时,每一个快照文件的索引节点都具有对所述对应的源文件的所述一个或多个数据块中的每一个数据块的索引,所述方法包括:将所述选定文件的索引节点的对应的索引中维护的物理磁盘地址处所述选定文件的存储在第一存储级别中的所述一个或多个数据块中的每一个数据块从所述第一存储级别复制到第二存储级别;在引用了所述选定文件的被复制到所述第二存储级别的所述一个或多个数据块中的一个数据块的所述文件系统中的每一个快照文件的索引节点的每一个索引中维护逻辑照抄地址,每一个逻辑照抄地址都表明,需要另外的处理以获得被所述索引引用的所述数据块的所述物理磁盘地址;以及更新所述文件系统,以包括用于通过所述选定文件的索引节点控制对所述一个或多个数据块的访问的受管理的区域。...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:W索东F施穆克
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1