一种HDFS针对小文件的改进方法技术

技术编号：9596856 阅读：117 留言：0更新日期：2014-01-23 02:20

本发明专利技术涉及计算机HDFS分布式文件系统领域，公开了一种HDFS针对小文件的改进方法,将Namenode的部分权限下放Datanode节点上,让Datanode缓存部分小文件元数据信息,让Datanode处理绝大多数的小文件读写请求,最大限度的减轻Namenode的负担。本发明专利技术针对HDFS处理小文件的效率低下问题，提出了一种新的处理方法，该方法有效解决了Namenode单点负载过重的问题，将小文件的压力分配到数据节点Datanode上，从而达到了整个大数据处理集群对大文件和小文件处理效率性能相当的理想效果。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术涉及计算机HDFS分布式文件系统领域，公开了一种HDFS针对小文件的改进方法,将Namenode的部分权限下放Datanode节点上,让Datanode缓存部分小文件元数据信息,让Datanode处理绝大多数的小文件读写请求,最大限度的减轻Namenode的负担。本专利技术针对HDFS处理小文件的效率低下问题，提出了一种新的处理方法，该方法有效解决了Namenode单点负载过重的问题，将小文件的压力分配到数据节点Datanode上，从而达到了整个大数据处理集群对大文件和小文件处理效率性能相当的理想效果。【专利说明】一种HDFS针对小文件的改进方法
本专利技术涉及计算机HDFS分布式文件系统领域，具体涉及一种HDFS针对小文件的改进方法。技术背景Hadoop Distributed File System,简称 HDFS,是一个分布式文件系统。随着互联网的快速发展，数据量呈现指数级增长，为了适应这种情况，如今已经出现了很多大的服务器架构如数据中心以及云计算。在大数据处理方面，Google的GFS为处理大文件提供了有效的方法，而Hadoop下的文件系统HDFS作为GFS开源实现，实现了 GFS的绝大多数功能，其也是基于大文件处理的，大文件的处理效率出色，然而在处理小文件效率上却十分低下，因为在存储小文件时需要反复的请求存储地址，分配存储的block (块)，大量的小文件使单Namenode (名字节点)的HDFS显得力不从心，并且产生了大量的元数据占用Namenode的内存。然而，在实际的应用当中，小文件比比皆是，从个人应用中产生...

【技术保护点】
一种HDFS针对小文件的改进方法，包括一个集群，其中集群中包含一个Namenode和多个Datanode，能被多个客户端访问，其特征在于：将Namenode的部分权限下放Datanode节点上,让Datanode缓存部分小文件元数据信息,处理绝大多数的小文件读写请求。

【技术特征摘要】

【专利技术属性】
技术研发人员：孟祥飞，邓鹏飞，吴楠，宗栋瑞，邓强，
申请(专利权)人：浪潮电子信息产业股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人