本发明专利技术提供了用于在复制初始化中生成初始副本的方法和装置。在本发明专利技术的一个实施方式中,提供了一种用于在复制初始化中生成初始副本的方法,包括:接收从源节点向目标节点复制源卷以生成源卷的初始副本的请求;针对源卷中包括的至少一个源数据块中的当前源数据块,在目标节点中搜索与当前源数据块相对应的目标数据块;以及利用目标数据块更新初始副本。在本发明专利技术的一个实施方式中,提供了一种用于在复制初始化中生成初始副本的装置。采用本发明专利技术的方法和装置,可以尽可能地利用在目标节点中已经存在的数据块来生成源节点中的待复制的源卷的初始副本。
【技术实现步骤摘要】
本专利技术的各实施方式涉及数据复制(data replication),更具体地,涉及用于在 复制初始化(replication initialization)中生成初始副本(initial copy)的方法和装 置。
技术介绍
随着数据存储技术W及网络通信技术的发展,目前已经提出了分布式数据存储的 概念。在分布式数据存储中,数据不再位于单一的数据节点,而是可W分布在位于相同或者 不同物理地点的多个数据节点中。进一步,为了提供更加可靠的数据存储,在分布式数据存 储系统中,可W在多个数据节点中存储数据对象的多个备份,从而在部分数据节点出现故 障时,可W基于其他未出现故障的数据节点中的备份来恢复故障节点中的数据。 目前,数据库中的数据量随着用户需求的增长而变得越来越大。当在分布式数据 存储中的各个数据节点之间复制数据(例如,从北京的数据节点向上海的数据节点复制数 据)时,可能会花费数小时甚至数天的时间。尽管提高各个数据节点之间的带宽可W提高 数据复制的效率,然而,提高数据带宽需要大量人力和物力开销;此外,由于在各个数据节 点之间的数据传输量并不稳定,基于数据传输量的峰值需求来设置网络传输带宽,将造成 带宽资源的极大浪费。 复制初始化是指在不同数据节点之间第一次同步数据的步骤,在复制初始化期 间,需要将源节点中的全部数据拷贝至目标节点。在数据复制领域中,通常在复制初始化期 间需要较大的数据传输量,而当已经在目标节点中存在初始副本的情况下,则仅需要较小 的数据传输量即可确保目标节点与源节点的同步。因而,如何提高复制初始化的效率并且 在复制初始化期间快速地生成初始副本,成为数据复制领域的一个研究热点。
技术实现思路
因而,期望开发一种能够在复制初始化期间方便并且快速地生成初始副本的技术 方案,期望该技术方案可W尽可能地重用已经存在于目标节点中的数据块(data block), 并且基于该数据块和/或源节点中的其他数据块来在目标节点中生成源节点中的待复制 的源卷(source volume)的初始副本。 在本专利技术的一个实施方式中,提供了一种用于在复制初始化中生成初始副本的方 法,包括;接收从源节点向目标节点复制源卷W生成源卷的初始副本的请求;针对源卷中 包括的至少一个源数据块中的当前源数据块,在目标节点中搜索与当前源数据块相对应的 目标数据块;W及利用目标数据块更新初始副本。 在本专利技术的一个实施方式中,在目标节点中搜索与当前源数据块相对应的目标数 据块包括:获取与当前源数据块相关联的包括一个或者多个候选目标数据块的列表,候选 目标数据块是目标节点中的与当前源数据块具有历史拷贝关系的目标数据块;W及响应于 候选目标数据块与当前源数据块相匹配,将候选目标数据块标识为目标数据块。 在本专利技术的一个实施方式中,进一步包括:在源卷中选择与初始副本中的目标数 据块相对应的源数据块W外的源数据块,W形成源数据块集合;W及从源节点向目标节点 拷贝源数据块集合中的源数据块W更新初始副本。 在本专利技术的一个实施方式中,提供了一种用于在复制初始化中生成初始副本的装 置,包括:接收模块,配置用于接收从源节点向目标节点复制源卷W生成源卷的初始副本的 请求;搜索模块,配置用于针对源卷中包括的至少一个源数据块中的当前源数据块,在目标 节点中搜索与当前源数据块相对应的目标数据块;W及更新模块,配置用于利用目标数据 块更新初始副本。 在本专利技术的一个实施方式中,搜索模块包括:列表获取模块,配置用于获取与当前 源数据块相关联的包括一个或者多个候选目标数据块的列表,候选目标数据块是目标节点 中的与当前源数据块具有历史拷贝关系的目标数据块;W及第Η标识模块,配置用于响应 于候选目标数据块与当前源数据块相匹配,将候选目标数据块标识为目标数据块。 在本专利技术的一个实施方式中,进一步包括;集合形成模块,配置用于在所述源卷中 选择与所述初始副本中的目标数据块相对应的源数据块W外的源数据块,W形成源数据块 集合;W及拷贝模块,配置用于从所述源节点向所述目标节点拷贝所述源数据块集合中的 源数据块W更新所述初始副本。 采用本专利技术所述的方法和装置,可W在充分考虑目标节点中的数据块和源节点中 的数据的对应关系的情况下,尽可能地利用在目标节点中已经存在的数据块来在目标节点 中生成源卷的初始副本。【附图说明】 通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述W及其 他目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号 通常代表相同部件。 图1示意性示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器的 框图; 图2示意性示出了一个示例性的云计算环境; 图3示意性示出了云计算环境50 (图2)提供的一组功能抽象层; 图4Α-图4Β示意性示出了根据一个技术方案的用于在复制初始化中生成初始副 本的技术方案的图示; 图5Α-图5Β示意性示出了根据本专利技术的实施方式的用于在数据初始化中生成初 始副本的技术方案的图示; 图6示意性示出了根据本专利技术的一个实施方式的用于在数据初始化中生成初始 副本的方法的流程图; 图7示意性示出了根据本专利技术的一个实施方式的数据块的标签(1油el)的结构的 框图; 图8A-图8C示意性示出了根据本专利技术的一个实施方式的用于在数据初始化中生 成初始副本的技术方案的图示;W及 图9示意性示出了根据本专利技术的一个实施方式的用于在数据初始化中生成初始 副本的装置的框图。【具体实施方式】 下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开 的优选实施方式,然而应该理解,可W W各种形式实现本公开而不应被送里阐述的实施方 式所限制。相反,提供送些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的 范围完整的传达给本领域的技术人员。 首先应当理解,尽管本公开包括关于云计算的详细描述,但其中记载的技术方案 的实现却不限于云计算环境,而是能够结合现在已知或W后开发的任何其他类型的计算环 境而实现。 云计算是一种服务交付模式,用于对共享的可配置计算资源池进行方便、按需的 网络访问。可配置计算资源是能够W最小的管理成本或与服务提供者进行最少的交互就能 快速部署和释放的资源,例如可W是网络、网络带宽、服务器、处理、内存、存储、应用、虚拟 机和服务。送种云模式可W包括至少五个特征、至少Η个服务模型和至少四个部署模型。 [002引特征包括: 按需自助式服务;云的消费者在无需与服务提供者进行人为交互的情况下能够单 方面自动地按需部署诸如服务器时间和网络存储等的计算能力。 广泛的网络接入;计算能力可W通过标准机制在网络上获取,送种标准机制促进 了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字 助理PDA)对云的使用。 资源池:提供者的计算资源被归入资源池并通过多租户(multi-tenant)模式服 务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况 下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可W在较高抽象程度上 指定位置(例如国家、州或数据中必),因此具有位置无关性。 迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,W本文档来自技高网...
【技术保护点】
一种用于在复制初始化中生成初始副本的方法,包括:接收从源节点向目标节点复制源卷以生成所述源卷的所述初始副本的请求;针对所述源卷中包括的至少一个源数据块中的当前源数据块,在所述目标节点中搜索与所述当前源数据块相对应的目标数据块;以及利用所述目标数据块更新所述初始副本。
【技术特征摘要】
【专利技术属性】
技术研发人员:魏蜀曦,陈烨,李可召,郝若梦,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。