用于在备份操作期间对关键数据对象存储进行优先级排序的方法和系统技术方案

技术编号:26170403 阅读:23 留言:0更新日期:2020-10-31 13:37
一种用于在复原操作期间对关键数据对象恢复进行优先级排序的方法和系统。具体地说,本文公开的所述方法和系统需要根据基于最接近关键的顺序次序对数据对象进行重新排序、等待从备份存储中读取并且因此在一个或多个数据对象队列中排队。能够通过在任何给定数据对象队列中排队的相邻数据对象对之间计算出的基于修正权重的欧几里得距离来导出所述基于最接近关键的顺序次序。另外,计算出的基于修正权重的欧几里得距离结合与所述相邻数据对象对相关联的数据关键性因子。通过以基于最接近关键的顺序次序对数据对象进行重新排序,首先能够恢复关键数据对象,从而避免在复原操作期间发生灾难时可能的关键数据丢失。

Method and system for prioritizing storage of critical data objects during backup operations

【技术实现步骤摘要】
用于在备份操作期间对关键数据对象存储进行优先级排序的方法和系统
技术介绍
现有的数据复原解决方案缺乏在复原操作期间确定数据恢复优先级的机制。也就是说,如果在复原操作完成期间或之前发生灾难,那么关键数据当在备份存储阵列中排队用于恢复时可丢失。附图说明图1示出根据本专利技术的一个或多个实施例的系统。图2A示出根据本专利技术的一个或多个实施例的备份存储系统。图2B示出根据本专利技术的一个或多个实施例的备份存储系统。图3示出根据本专利技术的一个或多个实施例的目标主机。图4示出描述根据本专利技术的一个或多个实施例的用于在复原操作期间对关键数据分组或数据块恢复进行优先级排序的方法的流程图。图5示出描述根据本专利技术的一个或多个实施例的用于在复原操作期间对关键数据文件恢复进行优先级排序的方法的流程图。图6示出根据本专利技术的一个或多个实施例的计算系统。具体实施方式现在将参考附图详细描述本专利技术的具体实施例。在本专利技术的实施例的以下详细描述中,阐述许多具体细节以便提供对本专利技术的更透彻理解。然而,对于本领域的普通技术人员而言将显而易见的是,本专利技术可在没有这些具体细节的情况下实践。在其它情况下,不再详细描述众所周知的特征,以避免不必要地使描述变复杂。在图1-6的以下描述中,在本专利技术的各种实施例中,关于一个图描述的任一组件可等效于关于任一其它图描述的一个或多个相似命名的组件。为简洁起见,将不关于每一图来重复这些组件的描述。因此,每一图的组件的每个实施例以引用的方式并入,并且假定为任选地存在于具有一个或多个相似命名的组件的每一其它图内。另外,根据本专利技术的各种实施例,对一个图的组件的任何描述应解释为任选实施例,其可除了关于任一其它图中的对应的相似命名的组件描述的实施例外再实施、与所述实施例一起实施或代替所述实施例加以实施。在整个申请中,序数(例如第一、第二、第三等)可用作元件(即,申请中的任何名词)的形容词。除非明确地公开,如通过使用术语“之前”、“之后”、“单一”和其它这类术语,否则序数的使用不一定暗示或创建元件的任何特定排序,也不将任何元件限制为仅单个元件。实际上,序数的使用是为了区分元件。借助于实例,第一元件不同于第二元件,并且第一元件可涵盖多于一个元件并且在元件的排序中接续(或先于)第二元件。通常,本专利技术的实施例涉及用于在复原操作期间对关键数据对象恢复进行优先级排序的方法和系统。具体地说,本专利技术的一个或多个实施例需要根据基于最接近关键的顺序次序对数据对象进行重新排序、等待从备份存储中读取并且因此在一个或多个数据对象队列中排队。可通过在任何给定数据对象队列中排队的相邻数据对象对之间计算出的基于修正权重的欧几里得(Euclidean)距离来导出基于最接近关键的顺序次序。另外,计算出的基于修正权重的欧几里得距离结合与相邻数据对象对相关联的数据关键性因子。通过以基于最接近关键的顺序次序对数据对象进行重新排序,可首先恢复关键数据对象,从而避免在复原操作期间发生灾难时可能的关键数据丢失。图1示出根据本专利技术的一个或多个实施例的系统。系统(100)可包括可操作地连接到一个或多个目标主机(104A-104N)的备份存储系统(BSS)(102)。以下描述这些组件中的每一个。在本专利技术的一个实施例中,BSS(102)可通过网络(未示出)(例如局域网(LAN)、如因特网的广域网(WAN)、移动网络等)直接或间接连接到一个或多个目标主机(104A-104N)。可使用有线和/或无线连接的任何组合来实施网络。在其中BSS(102)和一个或多个目标主机(104A-104N)间接连接的实施例中,可存在可便于通信的其它网络组件或系统(例如,交换机、路由器、网关等)。另外,BSS(102)和一个或多个目标主机(104A-104N)可使用有线和/或无线通信协议的任何组合彼此通信。在本专利技术的一个实施例中,BSS(102)可表示数据备份、存档和/或容灾存储系统。可使用一个或多个服务器(未示出)来实施BSS(102)。每个服务器可为物理服务器(即,其可位于在数据中心中)或虚拟服务器(即,其可位于在云计算环境中)。另外,在本专利技术的一个实施例中,可使用与图6中所示的示例性计算系统类似的一个或多个计算系统来实施BSS(102)。下面参考图2A和2B另外详细描述BSS(102)。在本专利技术的一个实施例中,每个目标主机(104A-104N)可表示可在其上执行一个或多个用户程序(未示出)的任何物理计算系统。举例来说,这些用户程序可实施大规模和复杂的数据处理;并且可并发为多个用户服务。另外,每个目标主机(104A-104N)可提供和管理各种计算资源(例如,计算机处理器、存储器、永久性和非永久性存储装置、网络带宽等)的分配以执行可在其上实例化的各种过程(或任务)。普通技术人员将理解,在不脱离本专利技术的范围的情况下,每个目标主机(104A-104N)可执行其它功能。目标主机(104A-104N)的实例可包括但不限于桌上型计算机、平板计算机、服务器、大型主机、智能手机或与图6中所示的示例性计算系统类似的任何其它计算系统。目标主机(104A-104N)在下面参考图3另外详细描述。虽然图1示出组件的配置,但在不脱离本专利技术的范围的情况下,可使用其它系统配置。图2A示出根据本专利技术的一个或多个实施例的备份存储系统(BSS)。本文描述的BSS(200)可以可操作地与下面参考图3描述的目标主机(未示出)连接。另外,BSS(200)可表示数据备份、存档和/或容灾存储系统,其包括备份存储阵列(202)、复原代理(206)、优先级权重评估器(208)、欧几里得距离计算器(212)、对象排序器(214)和发送缓冲器(216)。以下描述这些组件中的每一个。在本专利技术的一个实施例中,备份存储阵列(202)可指代一个或多个物理存储装置(未示出)的集合,在其上可合并各种形式的信息-例如备份用户程序数据(204)。每个物理存储装置可涵盖非暂时性计算机可读存储介质,在其上可全部或部分并且暂时或永久性地存储信息。借助于实例,每个物理存储装置可表示硬盘驱动器(HDD)、固态驱动器(SSD)、磁带存储系统或网络附加存储(NAS)。另外,在本专利技术的一个实施例中,备份存储阵列(202)可使用永久性(即,非易失性)存储装置来实施。永久性存储装置的实例可包括但不限于光学存储装置、磁性存储装置、NAND快闪存储器、NOR快闪存储器、磁性随机存取存储器(M-RAM)、自旋力矩磁性RAM(ST-MRAM)、相变存储器(PCM),或定义为非易失性存储类存储器(SCM)的任何其它存储装置。在本专利技术的一个实施例中,可合并在备份存储阵列(202)上的备份用户程序数据(204)可指代与可在目标主机(参见例如图3)上执行的任何给定用户程序(未示出)相关联的数据的任何粒度的拷贝。备份用户程序数据(204)可需要,例如,应用程序数据、用户数据、配置数据、元数据或一个或多个用户程序可与其进行交互的任何其它形式的数据。在本专利技术的一个实施例中,复原代理(206)可指代可在B本文档来自技高网...

【技术保护点】
1.一种用于对排队数据对象进行优先级排序的方法,其包含:/n识别包含以第一顺序次序排队的数据对象集的数据对象队列;/n对于所述数据对象队列中的每个数据对象:/n将所述数据对象映射到坐标空间中的数据点;/n对于所述数据对象队列:/n识别数据对象对集,每个数据对象对包含在所述数据对象队列中排队的一对相邻数据对象;/n对于所述数据对象对集中的每个数据对象对:/n计算在映射到所述数据对象对的所述坐标空间中的数据点对之间的距离;/n至少基于为每个数据对象对计算的所述距离,对在所述数据对象队列中排队的所述数据对象集进行排序;/n基于所述排序,获得以第二顺序次序排队的所述数据对象集;以及/n将以所述第二顺序次序排队的所述数据对象集发送到目标主机。/n

【技术特征摘要】
20190429 US 16/398,2111.一种用于对排队数据对象进行优先级排序的方法,其包含:
识别包含以第一顺序次序排队的数据对象集的数据对象队列;
对于所述数据对象队列中的每个数据对象:
将所述数据对象映射到坐标空间中的数据点;
对于所述数据对象队列:
识别数据对象对集,每个数据对象对包含在所述数据对象队列中排队的一对相邻数据对象;
对于所述数据对象对集中的每个数据对象对:
计算在映射到所述数据对象对的所述坐标空间中的数据点对之间的距离;
至少基于为每个数据对象对计算的所述距离,对在所述数据对象队列中排队的所述数据对象集进行排序;
基于所述排序,获得以第二顺序次序排队的所述数据对象集;以及
将以所述第二顺序次序排队的所述数据对象集发送到目标主机。


2.根据权利要求1所述的方法,其另外包含:
对于所述数据对象队列中的每个数据对象:
获得与所述数据对象相关联的数据关键性;和
基于所述数据关键性来识别所述数据对象的优先级权重,
其中为每个数据对象对计算的所述距离结合所述数据对象对的每个相邻数据对象的所述优先级权重。


3.根据权利要求2所述的方法,其中为每个数据对象对计算的所述距离为基于修正权重的欧几里得距离。


4.根据权利要求2所述的方法,其另外包含:
检查每个数据对象的标头信息,以获得与所述数据对象相关联的所述数据关键性,
其中所述数据对象为选自由数据分组和数据块组成的组中的一个。


5.根据权利要求2所述的方法,其另外包含:
使用选自由与所述数据对象相关联的文件类型和文件名组成的组中的至少一个对优先级分配对象执行查找,以获得与所述数据对象相关联的所述数据关键性,
其中所述数据对象为数据文件。


6.根据权利要求1所述的方法,其中所述坐标空间为二维笛卡尔坐标空间。


7.根据权利要求6所述的方法,其中将所述数据对象映射到所述二维笛卡尔坐标空间中的所述数据点包含:
将与所述数据对象相关联的队列号映射到所述数据点的横坐标;和
将与所述数据对象相关联的序列位置映射到所述数据点的纵坐标,
其中所述队列号识别所述数据对象位于的所述数据对象队列,
其中所述序列位置识别所述数据对象位于的相对于所述第一顺序次序的位置。


8.根据权利要求1所述的方法,其中所述第一顺序次序根据基于到达的方案对所述数据对象集进行排队。


9.根据权利要求1所述的方法,其中所述数据对象队列中的每个数据对象为选自由数据分组、数据块和数据文件组成的组中的一个。


10.一种非暂时性计算机可读介质(CRM),其包含计算机可读程序代码,所述计算机可读程序代码当由计算机处理器执行时使得所述计算机处理器能够:
识别包含以第一顺序次序排队的数据对象集的数据对象队列;
对于所述数据对象队列中的每个数据对象:
将所述数据对象映射到坐标空间中的数据点;
对于所述数据对象队列:
识别数据对象对集,每个数据对象对包含在所述数据对象队列中排队的一对相邻数据对象;
对于所述数据对象对集中的每个数据对象对:
计算在映射到所述数据对象对的所述坐标空间中的数据点对之间的距离;
至少基于为每个数据对象对计算的所述距离,对在所述数据对象队列中排队的所述数据对象集进行排序;
基于所述排序,获...

【专利技术属性】
技术研发人员:马哈什·R·A·文卡塔拉马纳车坦·巴图尔斯沃卢普·S·D·H希莱仕·乔普拉
申请(专利权)人:EMC知识产权控股有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1