The invention discloses a degenerate reading optimization method of erasure code storage system based on node performance evaluation. This method sends the performance data of each node to performance evaluation node according to the real-time status of hardware performance and software request of the nodes of the distributed storage system, and the performance evaluation node is based on the hardware performance of each node. And queuing delay of distributed storage system, filtering useless data, obtaining the real-time performance weights of each node by evaluation formula, and writing the weights back to each storage node. When some nodes fail, the upper reading request is converted to the degenerate read request, and the system selects the best nodes according to the global performance state and performs the decoding operation. This method reduces the read response time and ensures the completion of the degraded read operation, and makes full use of the hardware and software resources of each node.
【技术实现步骤摘要】
一种基于纠删码的分布式存储系统的退化读优化方法
本专利技术涉及计算机存储领域,尤其涉及了分布式存储中纠删码优化,应用了分布式监控技术、纠删码理论,提出一种退化读优化方法。
技术介绍
随着近年来数据规模的爆炸式增长,纠删码容错技术在分布式存储系统受到了业界的广泛关注,开源存储系统Ceph、HDFS、Swift等实现了纠删码方法作为可使用的容错技术。与多副本容错技术相比,纠删码容错技术能够以低得多的存储开销提供相同甚至更高的数据可靠性。当分布式存储系统中出现节点失效时,当上层用户需要读取损坏节点的数据时,系统需要利用校验块数据将失效数据块恢复出来,并通过解码操作获得原始数据然后响应客户端读请求,这称为退化读操作。采用纠删码容错的分布式存储系统进行退化读操作时,需要从多个存储节点下载数据并对这些数据进行编解码运算,此过程中需要读取并传输大量的数据,占用多个节点的网络、IO、计算资源。在当前异构的分布式存储系统中,存储节点会由于频繁更换造成硬件不同,同时每个节点会由于软件实现造成负载不均衡、繁忙程度不同等情况。当节点发生故障时,系统会简单选取某些节点进行解码操作,从而在退化读操作过程中无法充分利用各节点的性能差异,一方面导致无法合理使用节点资源,另一方面导致退化读性能下降,影响系统的整体响应时间。在对纠删码退化读操作优化中,传统方法往往仅考虑各节点的硬件资源带来的影响,而忽略了真实存储系统的软件影响,导致评估节点并不准确,不能充分利用各节点的差异性。
技术实现思路
在当前纠删码分布式系统中,虽然实现方法各不相同,但是对于一个读写操作而言过程是相似的,在纠删码的编码过程 ...
【技术保护点】
一种基于纠删码的分布式存储系统的退化读优化方法,其特征在于,包括以下步骤:1)第一阶段,首先建立纠删码分布式存储系统IO栈,对存储系统中的纠删码读操作进行分层分析,将纠删码读IO栈主要可以分为以下四层:消息处理层、操作分发层、操作处理层、对象读取层;2)第二阶段,收集每个节点的纠删码读请求中每层的延迟情况、队列排队状态、指定时间内处理读写请求的个数等软件性能数据,同时收集每个节点中的硬件数据,包含CPU、IO、网络等数据,将这些数据进行格式统一处理,以三元组<时间,性能指标,性能数据>的方式传输至性能收集节点进行保存;3)第三阶段,性能收集节点会收集保存每项性能数据,并对无用数据进行过滤操作,对过期数据进行清理操作;4)第四阶段,根据建立的异构存储环境系的节点性能评价方案,根据获取的存储软件性能数据和节点硬件数据评估每个节点的实时性能状态,计算出每个节点的性能权值;5)第五阶段,数据收集评估节点将评估后各节点的实时性能权值分别发送至每个存储节点,每个存储节点接受到权值数据后更新原有的性能权值数据;6)第六阶段,读请求所在的主节点会查看所需要的数据块节点是否都存活,如果发生故 ...
【技术特征摘要】
1.一种基于纠删码的分布式存储系统的退化读优化方法,其特征在于,包括以下步骤:1)第一阶段,首先建立纠删码分布式存储系统IO栈,对存储系统中的纠删码读操作进行分层分析,将纠删码读IO栈主要可以分为以下四层:消息处理层、操作分发层、操作处理层、对象读取层;2)第二阶段,收集每个节点的纠删码读请求中每层的延迟情况、队列排队状态、指定时间内处理读写请求的个数等软件性能数据,同时收集每个节点中的硬件数据,包含CPU、IO、网络等数据,将这些数据进行格式统一处理,以三元组<时间,性能指标,性能数据>的方式传输至性能收集节点进行保存;3)第三阶段,性能收集节点会收集保存每项性能数据,并对无用数据进行过滤操作,对过期数据进行清理操作;4)第四阶段,根据建立的异构存储环境系的节点性能评价方案,根据获取的存储软件性能数据和节点硬件数据评估每个节点的实时性能状态,计算出每个节点的性能权值;5)第五阶段,数据收集评估节点将评估后各节点的实时性能权值分别发送至每个存...
【专利技术属性】
技术研发人员:张兴军,蔡毅,董小社,梁宁静,刘云飞,刘威,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。