在数据存储装置的异构组中分配对象的方法和设备制造方法及图纸

技术编号:2864236 阅读:220 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种在一个数据存储装置的异构组中分配对象的方法,该方法包含将每个对象分解成多个块,按照一个分配准则在不同的存储装置中分配所述块,该分配准则是:在所述存储装置的每一个中分配均包括一个或多个块的对象的片。按照本发明专利技术,用于管理对象片的分配的参数是一个称作弹性系数CF(i)的系数,代表备对象(i)的片的权重之间的差;定期地测量和计算代表每个对象引用率的可变性的值;按照一个向每个对象指派一个与其引用率的可变性成反比例的弹性系数的原则,在时刻(t)根据测量和计算的所述值,为每个对象计算一个要被指派给所述对象的期望弹性系数CFv(i);在时刻(t)为每个对象(i)测量和计算所述对象的真实弹性系数CFr(i),其代表所述对象各片的权重之间的差;在存储对象片的各块的装置之间引起一次移动,以便为每个对象(i)获得一个与所述对象的期望弹性系数CFv(i)对应的真实弹性系数CFr(i)。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种用于在数据存储装置的异构组中分配对象的方法和装置。在数据存储装置领域中的当前趋势是在被称作异构存储系统的、日益复杂的存储系统中存储信息。之所以被称作异构存储系统,是因为它们包括存储容量(存储装置中能存储的信息量)不同、或者带宽(能从存储装置器读取或向存储装置写信息的速率)不同的存储装置。按照惯例,在不同存储装置中存储信息的第一步,目前包含将每个对象划分成多个块,并按照某个分配准则在不同存储装置中分配所述块,包括在存储装置的每一个中分配对象片,其中每个对象片由一个或多个块组成。为了清楚起见,在整个文本(说明书和权利要求书)中使用以下术语—存储装置用于记录或获取数据的装置;—客户机访问在存储装置中存储的数据的装置;—数据组的引用率(popularity)与在此数据组被访问时存储装置与客户机之间每单位时间转移的数据量成正比例的值;—引用率的可变性(variability)表征数据组的引用率随时间变化的值;—块在存储装置中被连续存储的数据组;—对象具有可比较的、引用率的可变性的块组;—对象片(piece of object)所有属于同一个对象并被放置在同一个存储装置中的块组;—存储装置的负荷每单位时间在这个存储装置与客户机之间转移的数据组;—片的权重表示存储此片的存储装置中因为此片导致的工作负荷(workload)的值。该值可用多种方法估量,例如,以按存储装置的平均带宽划分的片尺寸来估量,以存储装置处理对这个片中的数据的读或写请求所用的平均时间来估量,等等。迄今为止所有开发都是用了基于两个主要原则的分配方法。第一个方法可称为平衡分配安置法,其根据的原则是,在每个存储装置中分配大小与所述存储装置的带宽成正比的对象片。这个方法因此倾向于充分使用存储装置的带宽。然而,这个方法的缺点是,有些存储装置比其它存储装置更快变满,因此,一旦一个存储装置是满的,则如果不使安置不平衡,就不再可能在其它存储装置中增加片。因此,在大多数情况下,这个方法并不能使一个异构组的存储容量被充分利用。尽管这种存储容量的损失难以估计,但是由于它是配置的一个函数,所以已经表明存储容量损失一般大于存储容量的25%,能多达约存储容量的80%。第二个方法可称为非平衡分配安置法,其根据的原则是,以充分利用存储装置组的存储容量的方式分配对象块,同时试图平衡这些存储装置上的工作负荷。然而,这个方法的主要缺点是,这种工作负荷的平衡不稳定,因为对象的引用率的变化往往干扰这种平衡。因此,对这个方法所做的大部分工作在于提出重新平衡工作负荷的解决方案。然而,这种重新平衡消耗带宽,并且实际上导致存储装置能同时处理的访问数的减少。总之,这第二个方法看起来使存储容量能被充分利用,但是却导致对带宽利用的显著减少(量级在50%,依所开发的重新平衡方法而改变)。迄今为止,对用于在数据存储装置的异构组中安置对象的方法所作的所有工作都旨在改善前述的安置方法的一个或另一个,即平衡分配安置法或非平衡分配安置法。然而,由于与这些安置方法每一个的设计相关联的特定缺点,这种工作全部已经导致了存储容量得不到充分利用的解决方案,或者是在低水平下利用带宽的解决方案。本专利技术建议减少这种缺点,其主要目的是提供一种在异构存储装置中分配对象的方法,致使既对存储容量的利用、又对所述存储装置的带宽利用的最优化。为此,本专利技术提出一种在数据存储装置的异构组中分配对象的方法,该方法用一个称作弹性系数CF(i)的系数,作为管理对象片的分配的参数,弹性系数代表对象(i)的各片的权重之间的差,在添加任何新的对象时,通过规定弹性系数的一个给定值,在所述存储装置中分配对象块,与此同时,对于被安置在存储装置组中的各对象—定期地测量和计算代表每个对象的引用率的可变性的值;—在时刻t根据测量和计算的前述值为每个对象计算一个期望的弹性系数CFv(i),该系数按照一个原则而被指派给所述对象,该原则是向每个对象指派一个与其引用率的可变性成反比例的弹性系数;—在时刻t为每个对象(i)测量和计算所述对象的真实弹性系数CFr(i),其代表所述对象各片的权量之间的差;—在存储各对象片的块的装置之间引起一次移动,以便为每个对象(i)获得一个与这个对象的期望弹性系数CFv(i)相对应的真实弹性系数CFr(i)。因此,本专利技术的基本原理是,用一个最好与引用率的可变性成反比、被称作弹性系数的系数作为管理这些移动的参数,定期地连续修改起初在不同存储装置中分配的对象片的权重。按照这个原理,弹性系数一般在两个极值CFmin(最小值)与CFmax(最大值)之间变化,确定不同的安置方式—如果CF(i)=CF min,对象(i)的所有片的权重相等,所使用的安置是平衡分配安置;—如果CF(i)=CF max,则对象(i)仅包括被安置在一个存储装置中的一个片,因此安置是纯粹的非平衡分配安置;—在这两个极值之间,不同的CF(i)值允许调整各片的权重,以便通过使CF(i)靠近CF min而获得负荷的更好平衡,或者以便通过使CF(i)靠近CF max而获得对存储容量的更好利用。本专利技术因此在于一种混合安置方法,其主要结果是优先按照非平衡分配安置法(CF(i)靠近CF max)安置具有稳定的(stable)引用率的对象,优先地按照平衡分配安置法(CF(i)靠近CF min)安置具有不稳定引用率的对象。实践中,对存储装置组进行的模拟已经显示,按照本专利技术的方法产生了大于80%的存储装置使用率和大于85%的带宽使用率。在一个有益的实施例中,按下式为每个对象(i)计算真实弹性系数CFr(i)CFr(i)=Pdev(i)/Pmean(i)其中Pmean(i)是对象(i)的各片权重的平均数,Pdev(i)是关于对象(i)的各片权重的平均数的标准偏差。在另一个有益的实施例中—在一个预备步骤中,将引用率的可变性的各预定值指派给不同块,将各所述块按引用率的可变性的降序分类,并通过被相邻分类的块的关联来创建这些对象;—在管理存储装置组的过程中,定期地按引用率的可变性的降序重新分类各块,这些块作为关于所述块的引用率和可变性的测量信息的函数。—由于按照本专利技术的方法特别在于为每个对象(i)计算理想弹性系数(期望弹性系数),并因此在于对对象进行工作,这个有益实施例导致创建包括具有非常相似的、引用率的可变性的块的对象,该实施例使得对所述对象的每一个的工作能被有效进行。此外,并且有益地,通过一种称为“决策梯形”的决策方法为每个对象(i)确定期望弹性系数CFv(i),“决策梯形”包括一个具有第一底和第二底的梯形,第一底由一个有刻度的轴组成,其向量是所述对象的引用率的可变性,第二底由一个有刻度的轴组成,其向量是所述对象的期望弹性系数,所述向量与前一个向量方向相反,所述决策方法包括如下步骤规定每个变量—即引用率的可变性和期望弹性系数—的上限和下限值,以便创建一个其两个边分别是由线段[var上限-CF下限]和[var下限-CF上限]组成的梯形,—如果可变性大于或等于var上限,则把这个可变性投影到到弹性系数的值CF下限上;—类似地,如果可变性小于或等于var下限,则把这个可变性投影到到值CF上限上;—如果可变性位于区间[var下限-var上限],则线性地把这个可变性投影到区间[CF下本文档来自技高网...

【技术保护点】
一种在数据存储装置的异构组中分配对象的方法,该方法包含将每个对象分解成多个块,按照一个分配准则在不同的存储装置中分配所述块,该分配准则是:在每个所述存储装置中分配包括一个或多个块的对象片,所述方法的特征在于,它用一个称作弹性系数CF(i)的系数,作为管理对象片的分配的参数,弹性系数代表各对象(i)的片的权重之间的差,在添加任何新对象时,通过规定一个给定的弹性系数值,来在所述存储装置中分配对象块,与此同时,对于被安置在存储装置中的各对象:-定期地测量和计算代表每个对象的引用率的可变性的值;-在时刻t根据测量和计算的前述值为每个对象计算一个期望弹性系数CFv(i),该系数按照一个原则而被指派给所述对象,该原则在于:向每个对象指派一个与其引用率的可变性成反比例的弹性系数;-在时刻t为每个对象(i)测量和计算所述对象的真实弹性系数CFr(i),其代表所述对象的片的权重之间的差;和-在存储对象片的块的装置之间引起一次移动,以便为每个对象(i)获得一个与这个对象的期望弹性系数CFv(i)相对应的真实弹性系数CFr(i)。

【技术特征摘要】
FR 2001-12-14 01/162041.一种在数据存储装置的异构组中分配对象的方法,该方法包含将每个对象分解成多个块,按照一个分配准则在不同的存储装置中分配所述块,该分配准则是在每个所述存储装置中分配包括一个或多个块的对象片,所述方法的特征在于,它用一个称作弹性系数CF(i)的系数,作为管理对象片的分配的参数,弹性系数代表各对象(i)的片的权重之间的差,在添加任何新对象时,通过规定一个给定的弹性系数值,来在所述存储装置中分配对象块,与此同时,对于被安置在存储装置中的各对象—定期地测量和计算代表每个对象的引用率的可变性的值;—在时刻t根据测量和计算的前述值为每个对象计算一个期望弹性系数CFv(i),该系数按照一个原则而被指派给所述对象,该原则在于向每个对象指派一个与其引用率的可变性成反比例的弹性系数;—在时刻t为每个对象(i)测量和计算所述对象的真实弹性系数CFr(i),其代表所述对象的片的权重之间的差;和—在存储对象片的块的装置之间引起一次移动,以便为每个对象(i)获得一个与这个对象的期望弹性系数CFv(i)相对应的真实弹性系数CFr(i)。2.如权利要求1所要求的分配方法,其中,为每个对象(i)计算真实弹性系数CFr(i),使得CFr(i)=Pdev(i)/Pmean(i)其中Pmean(i)是对象(i)的片的权重的平均数,并且Pdev(i)是关于对象(i)的片的权重的平均数的标准偏差。3.如权利要求1或2中任一个所要求的分配方法,其中—在一个预备步骤中,将引用率的可变性的各预定值指派给不同块,将各所述块按引用率的可变性的降序来分类,并通过各被相邻地分类的块的关联创建对象;—在管理存储装置组的过程中,定期地将各块按引用率的可变性的降序重新分类,所述块作为关于所述块的引用率和可变性的测量信息的函数。4.如权利要求1至3中任一个所要求的分配方法,其中,通过一种称为“决策梯形”的决策方法为每个对象(i)确定期望弹性系数CFv(i),“决策梯形”包括一个具有第一底和第二底的梯形,第一底由一个有刻度的轴组成,其向量是所述对象的引用率的可变性,第二底由一个有刻度的轴组成,其向量是所述对象的期望弹性系数,所述向量与前一个向量方向相反,所述决策方法包括如下步骤规定每个变量—即引用率的可变性和期望弹性系数—的上限和下限值,以便创建一个其两个边分别是由线段[var上限-CF下限]和[var下限-CF上限]组成的梯形,—如果可变性大于或等于var上限,则把这个可变性投影到到弹性系数的值CF下限上;—类似地,如果可变性小于或等于var下限,则把这个可变性投影到到值CF上限上;—如果可变性位于区间[var下限-var上限],则线性地把这个可变性投影到区间[CF下限-CF上限]上。5.如权利要求1至4中任一个所要求的分配方法,其中,为了为每个对象(i)获得一个对应于期望弹性系数CFv(i)的真实弹性系数CFr(...

【专利技术属性】
技术研发人员:A姆佐希C吉特尼特
申请(专利权)人:储存中介公司
类型:发明
国别省市:FR[法国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1