一种混合存储阵列的构建方法技术

技术编号:15540451 阅读:61 留言:0更新日期:2017-06-05 10:19
本发明专利技术公开了一种混合存储阵列的构建方法,包括:S1:将混合阵列划分为三个区域zone‑Ⅰ(HDD存储区域)、zone‑Ⅱ(SSD随机小读存储区域)和zone‑Ⅲ(SSD随机小写存储区域);S2:利用参数request size、frequency和seek distance对数据历史访问行为进行分析;S3:将数据按条带分为三类S‑Ⅰ(冷数据以及顺序读写类型的热数据),S‑Ⅱ(随机小读类型的热数据)和S‑Ⅲ(随机小写类型的热数据);S4将S‑Ⅰ类数据重定位到zone‑Ⅰ,S‑Ⅱ类数据重定位到zone‑Ⅲ,S‑Ⅱ重定位到zone‑Ⅲ,能够在保证可靠性的同时合理分布数据,提高混合存储阵列的性能。

Construction method of mixed memory array

The invention discloses a construction method, a hybrid memory array includes: S1: hybrid array is divided into three regions of zone 1 (HDD Zone storage area), II (SSD random read storage area) and zone (SSD III random lowercase storage area); S2: size with parameter request seek, frequency and distance to analyze historical data access behavior; S3: the data in accordance with the S I divided into three categories (hot cold data and data read and write sequence type), S II (hot data type random read) and S III (hot data type random lowercase) S4; S class data relocation to zone 1, S class II data relocation to zone III, S II relocated to zone III, to ensure the reliability and reasonable distribution of data, improve the performance of hybrid storage arrays.

【技术实现步骤摘要】
一种混合存储阵列的构建方法
本专利技术属于计算机存储
,更具体地,涉及一种混合存储阵列的构建方法。
技术介绍
随着固态盘技术的发展,给整个存储领域的应用和研究带来了不小的影响。相对于机械磁盘,固态盘因其不需要磁头的寻道和旋转定位时间,有更好的随机访问性能,从而为从根本上解决传统磁盘低的随机访问性能问题提供了可能。此外作为电子器件的固态盘还具备功耗低、体积小、重量轻和抗震等优势。然而,由于价格、容量等方面的原因,在未来很长一段时间内固态硬盘仍然不可能在存储应用领域完全取代磁盘,因此利用磁盘和固态硬盘构建混合存储系统,充分利用两者各自的优势来提高存储系统的整体性能,成为目前主流的研究方向。磁盘阵列(RedundantArraysofIndependentDisks,RAID),有“独立磁盘构成的具有冗余能力的阵列”之意。它是由很多价格较便宜的磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。现有的磁盘阵列分为三类:由硬盘驱动器(HardDiskDrive,HDD)构建的传统RAID、由固态硬盘(SolidStateDisk,SSD)构建的RAID以及由HDD和SSD混合的RAID。随着SSD价格的降低,由SSD组成大容量的阵列已经成为可能,并被越来越多的人所接受。但是正如之前提到的SSD在价格和容量上仍然和HDD有着较大的差距,况且其自身的擦写以及寿命问题,使得将SSD和HDD共同组成大容量、高性能、高可靠性的混合阵列成为一种理想的解决思路。目前主要的混合阵列性能优化方法有以下几种:HP公司提出了一种混合阵列AutoRAID。不过,AutoRAID做的是基于HDD的RAID1和SSD的RAID5的混合。AutoRAID提出了两层的存储架构,上层组建RAID1来存放active数据来保证高性能,而下层组建RAID5来存放inactive数据以性能换取冗余度,降低存储成本。其主要思路是利用active数据的规模小但访问频度高对性能要求高的特点,和inactive数据规模大但访问度低、只要保证可靠性的特点,分别采用不同级别的RAID方式组织数据,从而兼顾性能和存储成本,但是仅仅是在HDD级的混合。谢涛等人提出了PEARL混合模型,在PEARL中,SSD和HDD一一对应组成混合磁盘对,所有HDD按某一RAID方式组织成阵列。PEARL将数据分为三类:读密集型、写密集型和读写混合型,写密集型放在HDD中,读密集型数据放在SSD,而读写混合型数据根据性能、能耗以及可靠性公式决定放在HDD还是SSD。该方案能够对性能、能耗和可靠性进行折衷考虑,但在性能优化上和很多方案一样忽略了SSD更好的随机读写性能优势。毛波等人提出的HPDA将若干个SSD(数据盘)和一个HDD的部分空间(parity盘)组成RAID4,剩余的HDD空间和另一个HDD组成一个RAID1作为写buffer来优化对SSD阵列的小写。该方案利用HDD缓存一些随机小写请求来提高SSD阵列的写性能,但是为区分数据的冷热,所有数据的写操作都要进行两次。因此,采用上述方式在提高混合存储阵列的性能方面存在一定的局限性。
技术实现思路
针对现有技术的以上缺陷,本专利技术提供了一种混合存储阵列的构建方法,其目的在于构建一种高性能的基于RAID5的混合阵列。通过将顺序读写请求数据放在zone-Ⅰ(一个HDD存储区域),将热的随机小读和小写请求分别放在zone-Ⅱ(SSD随机小读存储区域)和zone-Ⅲ(SSD随机小写存储区域),充分利用HDD高的顺序读写性能和SSD的随机读写性能来提高混合存储阵列的I/O性能,由此解决现有的提高混合存储阵列的性能存在一定局限性的技术问题。为实现上述目的,按照本专利技术的一个方面,提供了一种混合存储阵列的构建方法,包括以下步骤:S1:将混合阵列划分为三个区域zone-Ⅰ、zone-Ⅱ以及zone-Ⅲ,其中,zone-Ⅰ是由RAID5构成的一个HDD存储区域、zone-Ⅱ是由RAID0构成的一个SSD随机小读存储区域、zone-Ⅲ是由RAID5构成的一个SSD随机小写存储区域;S2:利用参数requestsize、frequency以及seekdistance计算出条带的性能收益值;S3:计算条带在预设时间内的读写比例,根据读写比例以及条带的性能收益值将数据按条带分为三类S-Ⅰ、S-Ⅱ以及S-Ⅲ,其中S-Ⅰ表示冷数据以及顺序读写类型的热数据、S-Ⅱ表示随机小读类型的热数据、S-Ⅲ表示随机小写类型的热数据;S4:按条带动态迁移数据,将S-Ⅰ类数据重定位到zone-Ⅰ,S-Ⅱ类数据重定位到zone-Ⅱ,S-Ⅲ重定位到zone-Ⅲ。优选地,步骤S2具体包括以下子步骤:S2-1:将文件系统下发的请求分为若干个物理地址连续的子请求;S2-2:获取各子请求的requestsize和seekdistance,利用公式:△P=(2Lp*[max(0,k-m)/k])*(1+t*S)计算出各子请求所涉及的条带的性能收益增量值△P,然后由公式P=P1+F*△P计算出各子请求所涉及的条带的性能收益值,其中,m表示requestsize,S表示seekdistance,Lp、k和t分别为预设的参数,2Lp表示预设的P的最大增量,2k表示预设的最大请求大小,t为seekdistance的权重因子,P1表示原始值,F表示访问频率frequency;S2-3:更新各子请求涉及到的所有条带的性能收益值。优选地,步骤S3具体包括以下子步骤:S3-1:统计条带在预设时间内的读写比例,若读写比例大于预设读操作阈值,则确定该条带为读密集型,否则为写密集型;S3-2:将性能收益值P低于第一预设值的条带作为S-Ⅰ类数据,将性能收益值P高于第一预设值的读密集型条带作为S-Ⅱ类数据,将性能收益值P高于第二预设值的写密集型条带作为S-Ⅲ类数据。优选地,步骤S4具体包括以下子步骤:S4-1:将zone-Ⅲ中的S-Ⅰ类和S-Ⅱ类数据迁往zone-Ⅰ;S4-2:将zone-Ⅰ中的S-Ⅱ类数据采用拷贝式方式迁往zone-Ⅱ,S-Ⅲ类数据采用交换式方式迁往zone-Ⅲ;S4-3:将zone-Ⅱ中的S-Ⅰ类数据迁回zone-Ⅰ,S-Ⅲ类数据迁往zone-Ⅲ。总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,主要有以下的技术优点:(1)采用requestsize、frequency和seekdistance参数识别随机小请求数据,提高了识别的准确度,同时识别策略充分考虑到数据的条带性,更适合于混合阵列环境。(2)通过数据分类识别,根据设备自身的性能特性合理对数据进行布局,充分利用存储资源,最大程度地优化了系统的I/O性能,做到对下层物理设备的感知存储。(3)多种RAID模式混合,在保证可靠性的同时降低存储开销。将zone-Ⅰ和zone-Ⅲ上的数据按RAID5组织,而zone-Ⅱ按RAID0组织,其条带数据的可靠性需要配合该条带在zone-Ⅰ上的其他数据和parity来保证,因为zone-Ⅱ区域上的I/O多为读操作,所以很少会访问条带的其他数据和parity。(4)将随机小请求数据分为读密集型和写密集本文档来自技高网
...
一种混合存储阵列的构建方法

【技术保护点】
一种混合存储阵列的构建方法,其特征在于,包括:S1:将混合阵列划分为三个区域zone‑Ⅰ、zone‑Ⅱ以及zone‑Ⅲ,其中,zone‑Ⅰ是由RAID5构成的一个HDD存储区域,zone‑Ⅱ是由RAID0构成的一个SSD随机小读存储区域,zone‑Ⅲ是由RAID5构成的一个SSD随机小写存储区域;S2:利用参数request size、frequency和seek distance计算出条带的性能收益值;S3:计算条带在预设时间内的读写比例,根据读写比例以及条带的性能收益值将数据按条带分为三类S‑Ⅰ、S‑Ⅱ以及S‑Ⅲ,其中,S‑Ⅰ表示冷数据以及顺序读写类型的热数据,S‑Ⅱ表示随机小读类型的热数据,S‑Ⅲ表示随机小写类型的热数据;S4:按条带动态迁移数据,将S‑Ⅰ类数据重定位到zone‑Ⅰ,S‑Ⅱ类数据重定位到zone‑Ⅱ,S‑Ⅲ重定位到zone‑Ⅲ。

【技术特征摘要】
1.一种混合存储阵列的构建方法,其特征在于,包括:S1:将混合阵列划分为三个区域zone-Ⅰ、zone-Ⅱ以及zone-Ⅲ,其中,zone-Ⅰ是由RAID5构成的一个HDD存储区域,zone-Ⅱ是由RAID0构成的一个SSD随机小读存储区域,zone-Ⅲ是由RAID5构成的一个SSD随机小写存储区域;S2:利用参数requestsize、frequency和seekdistance计算出条带的性能收益值;S3:计算条带在预设时间内的读写比例,根据读写比例以及条带的性能收益值将数据按条带分为三类S-Ⅰ、S-Ⅱ以及S-Ⅲ,其中,S-Ⅰ表示冷数据以及顺序读写类型的热数据,S-Ⅱ表示随机小读类型的热数据,S-Ⅲ表示随机小写类型的热数据;S4:按条带动态迁移数据,将S-Ⅰ类数据重定位到zone-Ⅰ,S-Ⅱ类数据重定位到zone-Ⅱ,S-Ⅲ重定位到zone-Ⅲ。2.根据权利要求1所述的方法,其特征在于,步骤S2具体包括以下子步骤:S2-1:将文件系统下发的请求分为若干个物理地址连续的子请求;S2-2:获取各子请求的requestsize和seekdistance,利用公式:△P=(2Lp*[max(0,k-m)/k])*(1+t*S)计算出各子请求所涉及的条带的性能收益增量...

【专利技术属性】
技术研发人员:谭支鹏冯丹徐高翔王芳安幸周炜陈俭喜
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1