The invention provides a CRUSH-based data storage optimization method, which includes: classifying and storing multiple target data according to data characteristics; adjusting CRUSH strategy according to the type of target data, optimizing the mapping relationship of write operation; and according to the adjusted CRUSH strategy and the optimized mapping relationship of write operation, classifying and storing multiple target data according to data characteristics; Multiple target data are stored on the corresponding disk; thus, more balanced data distribution can be achieved, thus reducing the frequent thread switching and memory copy operations in the process of storing objects on client side, thus optimizing I/O operations and greatly improving disk writing speed.
【技术实现步骤摘要】
一种基于CRUSH的数据存储优化方法和装置
本专利技术涉及计算机存储
,尤其涉及一种基于CRUSH的数据存储优化方法和装置。
技术介绍
现如今,移动互联网正处于繁荣鼎盛时期,带动了云计算、物联网(IoT)、人工智能(AI)等新兴产业的飞速发展,随之而来的是海量非结构化数据的产生,且在呈爆炸式增长。例如当前人们经常访问的购物网站、视频网站、以及即时通讯工具等,后端存储上保存了海量的视频、图片资源以及用户的访问记录日志等等。传统的技术解决方案通常是多台服务器通过SAN交换网络同时连接FC光纤存储(共享存储型,而非分布式),然后对外提供服务。采用传统的技术方案存在多个弊端,如硬件成本费用过高;维护管理多个品牌的SAN存储网络存在困难;硬件存储可能存在单点故障;存储I/O存在瓶颈等。因为终端用户的任意操作均涉及到底部存储的I/O操作,当用户数越来越多,并发越来越大时,I/O操作就会成为整个系统架构中最大的性能瓶颈。如何提供较廉价的超大容量存储,并且要支持高性能、高可用、且横向动态扩展的分布式存储系统是当前亟需解决的问题。Ceph文件系统提供了与POSIX兼容的文件系统服务,基于Ceph对象存储集群之上,其内的文件被映射到Ceph存储集群内的对象。客户端可以把此文件系统挂载在内核对象或用户空间文件系统上。Ceph本地存储接口为了支持事务,引入了日志(Journal)机制。所有的写入操作都需要先记录日志,再写入本地文件系统,然后写PGLog。简单来说就是一份数据都需要写两遍,日志和本地文件系统,然而本地文件系统如ext3/ext4/xfs默认也是都是写日志的。这 ...
【技术保护点】
1.一种基于CRUSH的数据存储优化方法,其特征在于,包括以下步骤:根据数据特征对多个目标数据进行分类存储;根据所述目标数据所属的类型,调整CRUSH策略;根据所述目标数据所属的类型,优化写操作映射关系;根据调整后的CRUSH策略和优化后的写操作映射关系,将多个目标数据存储到相应的磁盘。
【技术特征摘要】
1.一种基于CRUSH的数据存储优化方法,其特征在于,包括以下步骤:根据数据特征对多个目标数据进行分类存储;根据所述目标数据所属的类型,调整CRUSH策略;根据所述目标数据所属的类型,优化写操作映射关系;根据调整后的CRUSH策略和优化后的写操作映射关系,将多个目标数据存储到相应的磁盘。2.根据权利要求1中所述的基于CRUSH的数据存储优化方法,其特征在于,在根据数据特征对多个目标数据进行分类存储的所述步骤中,如果所述目标数据为对事务有强一致性要求的数据,则将所述目标数据标识为第一类型数据;如果所述目标数据需要记录的日志数据小于预设值,则将所述目标数据标识为第二类型数据;如果所述目标数据不需要写日志,则将所述目标数据标识为第三类型数据。3.根据权利要求2中所述的基于CRUSH的数据存储优化方法,其特征在于,在根据所述目标数据所属的类型,优化写操作映射关系的所述步骤中,如果所述目标数据为第一类型数据,则将写操作记录保存到日志记录中;如果所述目标数据为第二类型数据,则将写操作记录保存到日志延迟写入记录中;如果所述目标数据为第三类型数据,则将写操作记录更新到Object上。4.根据权利要求1中所述的基于CRUSH的数据存储优化方法,其特征在于,在根据所述目标数据所属的类型,调整CRUSH策略的所述步骤中,将同一类型的目标数据放到指定区域,并且根据所述目标数据的用途以和重要等级指定...
【专利技术属性】
技术研发人员:陈希,陈俊雄,杨世登,吴志力,
申请(专利权)人:深圳市脉山龙信息技术股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。