The invention discloses a decoupling distributed file system metadata and distribution methods, including: separation of metadata in distributed file system, metadata, directory and file metadata items; the directory metadata stored in the metadata directory inode, not contains pointers to directory entries. The directory node performs directory operations according to the directory index. After each directory metadata file metadata associated with the stored on the same node, and the establishment of inverted index points to directory metadata. The invention has the following advantages: reducing the distributed file system for information exchange between each node to access the metadata, reduces the metadata access delay, at the same time, through the method of separation of contents, decoupling strong relevance between files and directories, can reach a high throughput, thereby improving the distributed file system for the treatment efficiency of metadata.
【技术实现步骤摘要】
一种分布式文件系统元数据的解耦合分布方法
本专利技术涉及计算机领域,具体涉及一种分布式文件系统元数据的解耦合分布方法。
技术介绍
分布式文件系统是一种支持海量数据存储的新型存储系统,被广泛应用于数据中心,超算中心和公有云平台。分布式文件系统具有很多好的优点相对于传统的集中式存储。如可以对存储数据进行横向扩展,通过增加存储节点的方式可以动态的扩充存储的容量,并保证访问吞吐量的同步提升。其次,分布式文件系统相对于传统的集中式存储具有灵活的容错策略,可以使用副本机制和纠删码进行分布式的容错。分布式文件系统还可以使用更加廉价的存储和计算设备去构建一个大规模的存储集群,以保证大量数据的访问。但是受限于文件系统的访问标准(POSIX),分布式文件系统的元数据访问往往成为了其性能的瓶颈。其元数据的访问往往无法满足高吞吐量和低延时的需求,但是在实际的系统中,超过一半以上的数据访问需要经过元数据节点。为了解决分布式文件系统元数据的可扩展性,现有的技术主要有下面三种:一种是基于动态目录树的分布式元数据节点扩展方法,这种方法的特点是将分布式文件系统的名字空间按照子目录分为不同的子树,每个子树独立的存放在某一个节点,并且更具访问的负载动态的调节存放的节点。这种方式的优势是能够根据负载的同步动态的调整访问的位置,但是这种方式无法解决文件访问的路径回朔问题,当访问一个文件的时候,需要访问整个路径的所有目录,而这些目录往往没有存放在同一个节点,往往造成了较大的访问延迟。另一种是基于哈希算法的元数据扩展方法,其特点是将一个目录内的文件通过哈希的方式将元数据分配到不同的节点。这种方式的优势 ...
【技术保护点】
一种分布式文件系统元数据的解耦合分布方法,其特征在于,包括以下步骤:S1:对分布式文件系统的元数据进行分离,以得到目录的元数据、目录项的元数据和文件的元数据;S2:将所述目录的元数据设置在目录索引节点;S3:将每个目录项根据文件的分布情况进行分割,并在文件存放的节点存储与之相关的目录项,并建立指向目录元数据的反向索引。
【技术特征摘要】
1.一种分布式文件系统元数据的解耦合分布方法,其特征在于,包括以下步骤:S1:对分布式文件系统的元数据进行分离,以得到目录的元数据、目录项的元数据和文件的元数据;S2:将所述目录的元数据设置在目录索引节点;S3:将每个目录项根据文件的分布情况进行分割,并在文件存放的节点存储与之相关的目录项,并建立指向目录元数据的反向索引。2.根据权利要求1所述的分布式文件系统元数据的解耦合分布方法,其特征在于,所述目录操作包括目录的创建、目录的删除、读取目录、获取目录的所有元数据、改变目录所在的用户组和改变目录所属的用户。3.根据权利要求1所述的分布式文件系统元数据的解耦合分布方法,其特征在于,还包括:提供全局唯一确定文件的标识;计算所需要访问的文件的全局所述标识的哈希值;根据所述哈希值定位元数据存放的节点。4.根据权利要求3所述的分布式文件系统元数据的解耦合分布方法,其特征在于,所述标识为文件的完整路径。5.根据权利要求1所述的分布式文件系统元数据的解耦合分布方法,其特征在于,还包括:当创建文件或者目录时,在创建文件或者目录的节点创建一个包...
【专利技术属性】
技术研发人员:陆游游,舒继武,李思阳,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。