通过以下步骤收回数据存储存储器系统的数据存储存储器的空间:确定数据存储存储器中存储的数据的热度度量;确定与数据存储存储器中的数据的重新定位有关的重新定位度量;确定对于数据使热度度量与重新定位度量相关的数据的效用度量;以及使得其效用度量未达到效用度量阈值的数据可用于空间收回。因此,可以另外地驱逐或降低但是符合或超过效用度量阈值的数据被免除空间收回,并且替代地维持在数据存储存储器中。
【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】通过以下步骤收回数据存储存储器系统的数据存储存储器的空间:确定数据存储存储器中存储的数据的热度度量;确定与数据存储存储器中的数据的重新定位有关的重新定位度量;确定对于数据使热度度量与重新定位度量相关的数据的效用度量;以及使得其效用度量未达到效用度量阈值的数据可用于空间收回。因此,可以另外地驱逐或降低但是符合或超过效用度量阈值的数据被免除空间收回,并且替代地维持在数据存储存储器中。【专利说明】用于采用热度和重新定位度量的数据存储存储器的选择性空间收回的方法和系统
本专利技术涉及计算机实现的数据存储存储器,更具体地涉及存储器空间收回。
技术介绍
计算机实现的数据存储系统典型地包括其中代表主机计算机系统存储数据的各种类型的数据存储。存储控制响应于读和写请求控制对数据存储介质和存储器的存取。存储控制可以根据安排为各种冗余、存取速度和安全等级的数据存储存储器和设备指引数据,数据存储设备诸如高速缓冲存储器、非易失性存储、RAID(独立盘的冗余阵列),JBOD (磁盘簇)等。作为示例,国际商业机器公司(IBM? ) ESS (企业存储服务器),诸如DS8000?,具有称为“中央电子复合体”或“CECs”的计算机实体、高速缓冲存储器、非易失性存储等的冗余群集。在数据存储系统中,可以采用快速存储器作为用于存储最近存取过、频繁存取的、或有可能在不久的将来存取的数据或指令的高速缓冲存储器。代替被提取或重新计算,高速缓冲存储器中存储的数据可以被迅速存取,从而节省时间和资源二者。高速缓冲存储器可以提供在多个等级中。例如,高速缓冲存储器数据存储系统可以包括“第一”或“主要”高速缓冲存储器和“次级”高速缓冲存储器二者。典型地,第一高速缓冲存储器比次级高速缓冲存储器具有更快的存取并且比次级高速缓冲存储器每数据单元更昂贵,并且次级高速缓冲存储器比第一高速缓冲存储器具有更大的存储容量。例如,第一高速缓冲存储器包括DRAM ( “动态随机存取存储器”),然而次级高速缓冲存储器包括快闪存储器固态驱动器(SSD),诸如“Flash_Cache” (国际商业机器公司注册商标)。当存取数据时,计算系统或设备可以首先在第一高速缓冲存储器中查找数据,并且如果数据不存在于此,则在次级高速缓冲存储器中查找数据。当在任一存储器中数据不可用时,典型地从包括较慢存取速度的数据存储的主要数据存储(诸如,RAID、JBOD等)对数据进行存取。当读取数据时,典型地数据保留在主要数据存储中并且复制到第一高速缓冲存储器和/或次级高速缓冲存储器。如果第一高速缓冲存储器中的读取数据没有被迅速或频繁地存取,则其可以被降级到次级高速缓冲存储器或被驱逐。如果次级高速缓冲存储器中的读取数据没有被迅速或频繁地存取,则其可以被驱逐。当写入数据时,计算系统或设备可以将数据写入到第一高速缓冲存储器。如果没有迅速地或频繁地存取第一高速缓冲存储器中的写入数据,则该数据可以被降级到次级高速缓冲存储器。如果没有迅速地或频繁地从次级高速缓冲存储器存取数据,则可以将其降级到更慢存取速度的数据存储,诸如RAID、JBOD等。可替代地,写入数据在被数据存储系统接收之后可以尽快写入到主要数据存储。典型地,采用LRU(最近最少使用)算法来将数据降级到下一较低等级或从第一高速缓冲存储器或次级高速缓冲存储器驱逐数据。在一些存储器中,诸如次级高速缓冲存储器,数据以日志结构方式存储为(顺序地写入,要求在逻辑的基础上确定数据存储在哪的日志)大数据范围的页面。在LRU算法下查看数据页面,并且无效最近最少使用的页面。为了收回空间,系统将选择具有最多无效的页面的日志结构范围(log-structured extent,LSE),并且压缩有效页面,将其重新定位在新LSE中,留下一个或多个空闲LSE。重新定位招致大量的I/O (输入/输出)重新定位操作,因为许多LSE需要被读取并且一个或多个LSE在收回过程的每个迭代处被写入。
技术实现思路
提供方法、计算机实现的数据存储存储器系统和计算机程序产品用于收回数据存储存储器系统的数据存储存储器的空间。在本上下文中的“存储器”是必须无效、驱逐或降级数据以为新进入的数据腾出可用空间的任何类型的存储器,其示例是高速缓冲存储器。在计算机实现的数据存储存储器系统的一个实施例中,执行以下步骤:确定数据存储存储器中存储的数据的热度度量;确定与数据存储存储器中的数据的重新定位有关的重新定位度量;确定对于数据使热度度量与重新定位度量相关的数据的效用度量;使得其效用度量未达到效用度量阈值的数据可用于空间收回;以及其效用度量符合或超过效用度量阈值的数据免除空间收回。因此,可以另外地保存但是未达到效用度量阈值的数据被替代地无效,并且不必在数据存储存储器中重新定位。在进一步的实施例中,最近添加到数据存储存储器的数据被免除空间收回合格。在又进一步的实施例中,通过空间管理策略指定为不合格的数据被免除空间收回合格。在另一实施例中,从对于数据存储存储器的数据的效用度量的平均值确定效用度量阈值。在进一步的实施例中,跨一时间段或预定数量的已处理的请求确定对于数据存储存储器的数据的效用度量的平均值。在又一实施例中,从用于数据存储存储器的LRU列表中识别的对于数据存储的数据的效用度量的平均值动态地确定效用度量阈值。在另一实施例中,数据存储存储器中存储的数据是页面的形式,并且从对于具有与该试探空间收回牺牲品相似的热度度量的数据的页面的效用度量平均值,动态地确定对于数据的试探空间收回牺牲品页面的效用度量阈值。在另一实施例中,数据存储存储器中存储的数据在日志结构范围是页面的形式;以及该方法还包括:无效收回合格的数据页面选择具有最大数量的无效页面的至少一个日志结构范围,用于将其中有效的页面重新定位到另一日志结构范围中,以便收回选择的日志结构范围。在进一步的实施例中,热度度量基于对其热度度量正在被确定的数据的命中的数量;并且重新定位度量基于其重新定位度量正在被确定的数据重新定位到另一日志结构范围的次数。【专利附图】【附图说明】现在将参考附图仅通过示例的方式描述本专利技术的优选实施例,其中:图1是其中实现本专利技术的示例性网络和计算机实现的存储服务器系统的框图;图2是图1的计算机实现的数据存储存储器系统的图解示意;图3是通过图2的数据存储存储器系统存储的数据的范围的图解示意;以及图4是描绘操作图1和2的系统的示例性方法的流程图。【具体实施方式】在以下参考附图的描述中以优选实施例描述本专利技术,其中同样的数字代表相同或相似的元件。虽然按照实现本专利技术目的的最佳方式描述本专利技术,但是本领域的技术人员将认识到鉴于这些教导不脱离本专利技术的范围可以完成多种变化。参考图1,用计算机实现的数据存储系统110图示基于计算机的网络架构100的示例,计算机实现的数据存储系统110可以实现本文讨论的计算机实现的高速缓冲存储器数据存储系统和方法。仅以示例的方式呈现架构100,不意图对其限制。本文公开的计算机实现的高速缓冲存储器数据存储系统和方法可以应用于广泛的多种不同计算机、服务器、数据存储系统和网络架构。示例性的网络架构100可以包括耦接到网络(诸如,存储域网(SAN) 108)的一个或多个主机计算机系统102。网络108可以包括使用任何适当的协本文档来自技高网...
【技术保护点】
一种用于收回数据存储存储器系统的数据存储存储器的空间的方法,包括:确定所述数据存储存储器中存储的数据的热度度量;确定与所述数据存储存储器中的所述数据的重新定位有关的重新定位度量;确定对于所述数据使所述热度度量与所述重新定位度量相关的所述数据的效用度量;使得其效用度量未达到效用度量阈值的所述数据可用于空间收回;以及免除其效用度量符合或超过所述效用度量阈值的所述数据空间收回。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:LM格普塔,ES埃利弗塞里奥,I科尔特西达斯,胡晓宇,R普莱特卡,R哈斯,MT本哈斯,MJ卡洛斯,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US