【技术实现步骤摘要】
本专利技术涉及一种分布式文件系统的纠删码缓存装置,具体是一种合理处理热、冷数据,节省存储开销且提高存储层效率的分布式文件系统的纠删码缓存装置,本专利技术还涉及上述装置的文件处理方法。
技术介绍
随着计算机技术和网络技术的发展,数据正以爆炸式的速度增长,海量数据对存储系统的处理能力提出了巨大的挑战。为了提高数据处理效率,通常采用的策略是对数据进行分层处理。现有技术通过在集群文件系统中同时采用副本存储技术和纠删码存储技术进行存储分层,利用副本技术存放热点数据(访问较多),利用纠删码技术存放冷数据(访问较少)。但是,在现有技术中,往往采取统一较大数据切块大小来处理副本存储层和纠删码存储层的数据。其弊端在于纠删码存储层处理较大数据块的能力远远不及副本存储层,当访问较少的数据块从副本存储层转移到纠删码存储层时,造成纠删码存储层的处理效率低。
技术实现思路
本专利技术要解决的第一个技术问题,是提供一种合理处理热、冷数据,节省存储开销且提高存储层效率的分布式文件系统的纠删码缓存装置。本专利技术要解决的第一个技术问题,可以通过以下的技术方案来实现:一种分布式文件系统的纠删码缓存装置,其特征在于:包括配置模块、创建模块、记录模块、层级关联模块、阀值设置模块、对比模块、切片模块和迁移模块;其中,1)所述配置模块位于管理节点上,其包括第一配置模块和第二配置模块,其中,—第一配置模块,用于设置第一存储池的名称、副本个数和分组规则,并生成第一存储池配置文件,—第二配置模块,用于设置第二存储池的名称、原始数据块个数、校验数据块个数和分组规则,并生成第二存储池配置文件;2)所述创建模块位 ...
【技术保护点】
一种分布式文件系统纠删码缓存装置,其包括配置模块、创建模块、记录模块、层级关联模块、阀值设置模块、对比模块、切片模块和迁移模块;其中,1)配置模块位于管理节点上,其包括第一配置模块和第二配置模块,其中,—第一配置模块,用于设置第一存储池的名称、副本个数和分组规则,并生成第一存储池配置文件,—第二配置模块,用于设置第二存储池的名称、原始数据块个数、校验数据块个数和分组规则,并生成第二存储池配置文件;2)创建模块位于管理节点上,其包括第一创建模块和第二创建模块,其中,—第一创建模块,用于读取第一存储池配置文件,并根据对应的参数创建第一存储池,—第二创建模块,用于读取第二存储池配置文件,并根据对应的参数创建第二存储池;3)记录模块位于元数据服务节点上,其用于根据第一存储池配置文件和第二存储池配置文件,将第一存储池和第二存储池的参数记录到元数据节点中,并分配唯一的第一存储池标识和第二存储池标识,记录模块还用于记录第一、第二存储池的层级关联到存储池元数据;4)层级关联模块位于管理节点上,其用于从元数据服务节点获取原数据中存储池类型,并根据存储池的类型做关联:定义第一类型的副本存储池为第一层级,定 ...
【技术特征摘要】
1.一种分布式文件系统纠删码缓存装置,其包括配置模块、创建模块、记录模块、层级关联模块、阀值设置模块、对比模块、切片模块和迁移模块;其中,1)配置模块位于管理节点上,其包括第一配置模块和第二配置模块,其中,—第一配置模块,用于设置第一存储池的名称、副本个数和分组规则,并生成第一存储池配置文件,—第二配置模块,用于设置第二存储池的名称、原始数据块个数、校验数据块个数和分组规则,并生成第二存储池配置文件;2)创建模块位于管理节点上,其包括第一创建模块和第二创建模块,其中,—第一创建模块,用于读取第一存储池配置文件,并根据对应的参数创建第一存储池,—第二创建模块,用于读取第二存储池配置文件,并根据对应的参数创建第二存储池;3)记录模块位于元数据服务节点上,其用于根据第一存储池配置文件和第二存储池配置文件,将第一存储池和第二存储池的参数记录到元数据节点中,并分配唯一的第一存储池标识和第二存储池标识,记录模块还用于记录第一、第二存储池的层级关联到存储池元数据;4)层级关联模块位于管理节点上,其用于从元数据服务节点获取原数据中存储池类型,并根据存储池的类型做关联:定义第一类型的副本存储池为第一层级,定义第二类型的纠删码存储池为第二层级;5)阀值设置模块位于管理节点上,其用于预设第一层级的第一存储池的数据向第二层级的第二存储池迁移的迁移阀值;6)对比模块位于元数据服务节点上,其用于实时获取第一存储池的空间使用量,并与阀值设置模块预设的数据迁移的阀值对比,当第一存储池的空间使用量达到阀值,则满足数据迁移条件;7)切片模块位于数据服务节点上,其用于读取元数据,并在文件进入第一层级的存储池之前,将文件的数据部分分割成若干较大数据切片,对于满足迁移条件的文件,在迁移到第二层级的存储池之前,将文件的数据部分分割成若干较小数据切片;8)迁移模块位于元数据服务节点上,其用于读取元数据,获得满足数据迁移条件文件所含数据块的分布,再把数据块从当前所在的存储单元中迁移到第二层级存储池所含的存储单元中。2.根据权利要求1所述的装置,其特征在于:所述第一创建模块,用于根据配置文件中包含有副本个数生成第一存储池的类型为第一类型的副本存储池;所述第二创建模块,用于根据配置文件中包含有原始数据切块个数和校验数据块个数生成第二存储池的类型为第二类型的纠删码存储池。3.根据权利要求1所述的装置,其特征在于:所述第一存储池的副本个数用于定义向第一存储池写入文件时、所述第一存储池对其中的原始数据生成冗余数据的份数;所述第二存储池的原始数据切块个数用于定义第二存储池对其中文件的数据部分的切块个数以及生成校验数据块的个数。4.根据权利要求1所述的装置,其特征在于:所述第一存储池和第二存储池的分组规则均为按存储单元分组;其中,所述第一存储池设置的存储单元个数不小于该第一存储池配置的副本个数;所述第二存储池设置的存储单元个数不小于该第二存储池配置的原始数据块切片个数和校验数据块个数之和。5.根据权利要求1所述的装置,其特征在于:所述第一存储池和第二存储池的分组规则...
【专利技术属性】
技术研发人员:曹碧舟,张勤,李进,
申请(专利权)人:中广天择传媒股份有限公司,深圳市中博科创信息技术有限公司,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。