一种分布式文件系统控制数据恢复速度的方法及装置制造方法及图纸

技术编号：27248339 阅读：55 留言：0更新日期：2021-02-04 12:23

本发明专利技术公开了一种分布式文件系统控制数据恢复速度的方法，使用Peering过程中发现的缺失数据的OSD来判断磁盘是否需要在数据恢复中写入数据。PG将缺失数据的OSD上报到Mon，Mon统计当前正在数据恢复的所有PG上报的OSD，来得到正在写入的磁盘数量。得到写入的磁盘数量后，计算数据恢复速度上限，和现有方案计算出的数据恢复速度上限相比较，取较小的值作为最终结果。通过上述方式，本发明专利技术能够在数据恢复过程中根据写入数据的磁盘数量动态调整数据恢复速度上限，减小磁盘写入压力。减小磁盘写入压力。减小磁盘写入压力。

全部详细技术资料下载

【技术实现步骤摘要】
一种分布式文件系统控制数据恢复速度的方法及装置

[0001]本专利技术涉及分布式存储系统领域，特别是涉及一种分布式文件系统控制数据恢复速度的方法及装置。

技术介绍

[0002]分布式文件系统以分布式存储系统为基础，将文件转化为存储对象随机存储在集群底层的磁盘中。每个磁盘通过一个守护进程OSD来管理，OSD实现了数据读写、复制、平衡、恢复等功能。系统通过多副本或者纠删码产生的数据冗余来实现数据保护机制。当一个磁盘发生故障时，通过其他磁盘上的冗余数据将故障磁盘上的数据恢复到满足故障域要求的非故障磁盘上。这是数据恢复(或称数据重构，recovery/backfill)的一个基本场景，Recovery是数据恢复的意思，在某些语境下专指通过日志来恢复不一致对象；Backfill是指PG通过扫描和全量拷贝恢复缺失对象。除了磁盘故障，其他类型的集群拓扑结构变化，如集群扩容/缩容，也要通过对象的灵活迁移实现数据的平衡分布。
[0003]为了减少数据恢复对前端性能的影响，现有方案实现了对数据恢复速度的控制功能。该方案通过限定一个恢复周期可恢复的最大数据量和最大对象数来限制恢复速度。具体方法是根据集群规模计算出数据恢复速度的上限，即最大带宽，再根据最大带宽计算每个OSD的恢复速度。计算数据恢复速度上限的方法考虑到了集群规模等因素，使恢复速度上限和参与数据恢复的主OSD个数成正比，这样，集群规模越大，恢复速度越大。
[0004]然而，对于换盘或者扩容等场景，只有少量磁盘参与数据恢复的数据写入。在这些场景下，虽然参与数据恢复...

【技术保护点】

【技术特征摘要】
map是否为空，如果不为空，将该OSD计入该PG需要写入的OSD中；在OSD层上报统计的信息，将每个PG需要写入的OSD信息加入到PGInfo中，OSD每隔一段时间上报一次该OSD上所有PG的PGInfo给监视器守护进程。8.根据权利要求7所述的一种分布式文件系统控制数据恢复速度的方法，其特征在于：所述监视器守护进程收到上报的PGInfo后将其保存起来；所述监视器守护进程每隔一段时间遍历保存的PGInfo，若遍历到的P...

【专利技术属性】
技术研发人员：刘鑫，孟祥瑞，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人