云存储平台的数据处理方法技术

技术编号:13461501 阅读:24 留言:0更新日期:2016-08-04 12:45
本发明专利技术提供了一种云存储平台的数据处理方法,该方法包括:在数据在写入前通过存储负载平衡策略确定存储节点,在数据写入后根据访问频率或节点存储容量重新分配副本存储节点。本发明专利技术提出了一种云存储平台的数据处理方法,简化了服务器集群部署方式,避免用户直接对服务器集群进行操作,保证存储节点的合理性和数据稳定性。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种,该方法包括:在数据在写入前通过存储负载平衡策略确定存储节点,在数据写入后根据访问频率或节点存储容量重新分配副本存储节点。本专利技术提出了一种,简化了服务器集群部署方式,避免用户直接对服务器集群进行操作,保证存储节点的合理性和数据稳定性。【专利说明】
本专利技术设及云存储,特别设及一种。
技术介绍
云存储采用了云计算、分布式文件系统W及服务器集群等技术,将网络中各种存 储资源聚合起来,共同对外提供数据存储和业务访问功能,在科研、生产和贸易服务领域有 着广泛应用。目前的云存储分为公有服务型存储,即对企业或者个人提供存储服务;一种是 私有架构型云存储,即企业内部搭建的基于存储服务器集群和分布式文件系统,部署在企 业数据中屯、或者安全的节点托管场所,为企业自身提供相应的存储服务。云存储平台保密 性较高,且存储过程无需太多I/O操作,因此采用搭建私有云存储系统来保存其数据文件是 最好的选择。目前,私有云存储搭建方案有很多种:包括键值型分布式文件系统,采用了分 组的方式,服务器集群由一个或多个组构成,同组内的业务节点为互备关系。采用分组存储 的方式能够使存储服务器集群更加灵活,可控性也相对较强。然而,化doop作为一个开源的 分布式存储计算框架,也有着它自身的缺点。那就是系统架构设计复杂,运行维护难度较 大。对云存储平台的使用不仅需要多方面的知识积累,而且在其运行维护方面也有很多技 能去学习掌握,从一定程度上限制了云存储平台的行业推广和使用。在搭建信息云存储平 台中,还有两个影响部署和系统性能的问题:第一个是运行过程中,节点容易发生故障。一 旦节点故障发生而不能准备及时地进行处理,就会影响多个节点的存储服务器集群搭建过 程中,每个节点都有很多重复的操作,使得搭建过程非常繁琐而且容易出错;第二个是因为 节点均为普通个人计算机,而非小型机或大型机之类的专用服务器,因此数据在使用过程 中,受到诸如CPU,内存W及磁盘I/O等影响较为严重。
技术实现思路
为解决上述现有技术所存在的问题,本专利技术提出了一种云存储平台的数据处理方 法,包括: 在数据在写入前通过存储负载平衡策略确定存储节点,在数据写入后根据访问频 率或节点存储容量重新分配副本存储节点。 优选地,该方法进一步包括:在云存储平台的文件系统中设置节点选择与调度监 视器,其中节点选择策略实现于名字节点之中,由名字节点在选择业务节点时调用,调度监 视器用来监视服务器集群运行状况,包括数据块的访问频率W及业务节点的存储容量,系 统在闲置状态时,管理节点根据数据访问频率和系统容量,调度副本存放位置; 文件上传之前,业务节点向名字节点发出写数据请求,名字节点调用节点选择模 型,通过调度监视器,获取服务器集群运行信息,计算节点的存储比例,计算每个机架节点 的存储比例,并按照备份因子个数,优先选择存储比例最高的节点组成节点队列发送给客 户端,由客户端将待存储的数据分割成多个数据块,存储在不同的业务节点上; 在所有文件已经保存于服务器集群之后,通过调度监视器收集服务器集群运行信 息,获取到所有节点的数据访问频率及所有节点的存储容量,若数据的访问频率超过预定 义阔值,则将副本放置在访问频率最低的节点上;若系统剩余容量低于阔值,则将副本放置 在存储比例最高的节点; 服务器集群运行信息通过云存储平台运行信息测量和展示框架进行监视,所述框 架监测和调度云存储平台相关的任务;客户端在节点选择分为两种方式:客户端在服务器 集群节点上的选择策略与客户端在服务器集群节点外的选择方式,具体实现方式如下: 在n个机架服务器集群的每个机架设置TR台业务节点,副本数为r;若客户端在服 务器集群业务节点上,贝U a)客户端向管理节点发出写数据请求; b)管理节点根据文件内容及系统配置情况,计算客户端所在机架的所有业务节点 存储比例,过程如下: 设客户端在第i台机架,初始化被选节点集合SDN为空;[001引该机架第j个节点的剩余容量为化^,存储的块数为化U,节点的存储优选比例RSiJ =化ij/化ij,将存储优选比最高的两个节点放入被选节点集合,即SDN= {DNia、DNib};其中 DNia、DNib表示第i个机架上的a和b业务节点, C)从剩余每个机架中计算r-2个存储比最大的节点,排序后选择最大的r-2个节点 放入被选节点集合SDN,共r个节点,用来存放数据块及其副本; d)管理节点将SDN集合中的节点分配业务节点给客户端,由客户端来写入; 当客户端不在业务节点上时,则直接计算服务器集群中所有节点的存储比例,选 择前r个最大的节点,即为数据存储节点;从个节点中,根据RSu =化U/化U选出存储 比例最高的r个节点,放入SDN列表中,即为选中的最优节点。 本专利技术相比现有技术,具有W下优点: 本专利技术提出了一种,简化了服务器集群部署方式,避 免用户直接对服务器集群进行操作,保证存储节点的合理性和数据稳定性。【附图说明】 图1是根据本专利技术实施例的的流程图。【具体实施方式】 下文与图示本专利技术原理的附图一起提供对本专利技术一个或者多个实施例的详细描 述。结合运样的实施例描述本专利技术,但是本专利技术不限于任何实施例。本专利技术的范围仅由权利 要求书限定,并且本专利技术涵盖诸多替代、修改和等同物。在下文描述中阐述诸多具体细节W 便提供对本专利技术的透彻理解。出于示例的目的而提供运些细节,并且无运些具体细节中的 一些或者所有细节也可W根据权利要求书实现本专利技术。 本专利技术的一方面提供了一种。图1是根据本专利技术实施 例的流程图。 为了更好地管理服务器集群,本专利技术对云存储平台分布式框架运行过程的整个生 命周期进行自动化管理,包括安装,搭建W及监视,提供可视化界面,提高管理员的效率。同 时存储资源控制系统进行故障报警及处理。除了对服务器集群的运行维护操作,还需要对 服务器集群的性能进行优化。服务器集群中新增节点后,重新优化服务器集群性能。针对云 存储服务器集群在部署、运行维护与使用过程中的种种问题,本专利技术针对搭建的服务器集 群,利用数据读写阶段的节点调度优化模型,来实现服务器集群的便捷管理与优化。本专利技术 将针对服务器集群的部署框架、节点管理和服务器优化调度的方面进行详细说明。 本专利技术采用主从结构,包含一个管理节点和多个业务节点。管理节点用于与业务 节点交互,接受业务节点发送的屯、跳请求,完成集中式管理监视逻辑,而每个业务节点负责 所在节点的状态采集及维护工作。管理节点部署在单独的节点,作为服务器集群部署框架 的管理节点,其职责是接收用户发送的命令执行请求,随后向业务节点发送命令,采用JSON 方式来发送命令,该JSON数据包括了安装、开始、停止服务的配置信息。 业务节点部署在所有待加入服务器集群的节点上,用来执行由管理节点发送的执 行任务请求,所执行的脚本存储在管理节点上的指定目录下,该脚本将业务节点接收来自 管理节点的命令文件的内容转化为字典格式,便于脚本实现部署时对配置的使用。在部署 过程中的状态和行为传递均为由管理节点发送给业务节点,业务节点接收到某个操作行 为,通过行为执行线程来执行对应的方法,并将执行后的消息通过消息队列反馈给管理节 点。 在服务器集群部署过程中,操作人员通过页面执行不同的行为,管本文档来自技高网
...

【技术保护点】
一种云存储平台的数据处理方法,其特征在于,包括:在数据在写入前通过存储负载平衡策略确定存储节点,在数据写入后根据访问频率或节点存储容量重新分配副本存储节点。

【技术特征摘要】

【专利技术属性】
技术研发人员:张敬华程映忠王松
申请(专利权)人:四川新环佳科技发展有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1