【技术实现步骤摘要】
文件备份装置及方法
本专利技术涉及数据备份,尤指一种文件备份装置及方法。
技术介绍
重复数据删除(datadeduplication)是一种通过移除重复数据块来压缩数据成为精简格式,并且使得数据可以更节约地存储于存储装置。就网络附加存储系统(Network-AttachedStorage,NAS)来说,数据存储的保护是个重大的技术问题。网络附加存储系统可以每天执行增量备份(incrementalbackup),只复制从上次备份以来改变的数据块(datachunk)。快速查找是企业数据保护的重要要求,通常需要高于1.28x104ops/s(operationspersecond,每秒操作数目)。在低成本系统中达到高速的数据块搜索是个严格的考验,因为系统中无法提供足够的随机存取存储器(RandomAccessMemory,RAM),用来存放存储装置中的数据块的索引。因此,本专利技术提出一种文件备份装置及方法,用来克服如上所述的限制。
技术实现思路
有鉴于此,如何减轻或消除上述相关领域的缺失,实为有待解决的问题。本专利技术提供一种文件备份装置的实施例,其包含:存储装置;及处理单元。处理单元依据上次修改信息分割来源数据流成为第一及第二数据流;于第一数据流上执行删除重复数据程序以产生及存储独特块至存储装置,并为第一数据流产生第一组组合索引的第一部分;从来源数据流的前一版本的第二组组合索引中复制相应于出现在第二数据流的逻辑位置的组合索引,作为第一组组合索引的第二部分;依据来源数据流的逻辑位置合并及存储第一组组合索引的第一及第二部分至存储装置,用于指出第一及第二数据流中的多 ...
【技术保护点】
1.一种文件备份装置,其特征在于,包含:存储装置;以及处理单元,耦接于该存储装置,用于依据上次修改信息分割来源数据流成为第一数据流及第二数据流;于该第一数据流上执行删除重复数据程序以产生及存储独特块至该存储装置,并为该第一数据流产生第一组组合索引的第一部分,该独特块相对于已经存储于该存储装置并且于删除重复数据程序中可搜索出的所有第一数据块是独特的;从该来源数据流的前一版本的第二组组合索引中复制相应于出现在该第二数据流的逻辑位置的组合索引,作为该第一组组合索引的第二部分;依据该来源数据流的逻辑位置合并该第一组组合索引的该第一部分及该第二部分;以及存储该合并后的第一组组合索引至该存储装置,用于指出该第一数据流及该第二数据流中的多个第二数据块实际存储于该存储装置的何处。
【技术特征摘要】
2017.10.27 US 62/577,738;2018.07.10 US 16/031,4821.一种文件备份装置,其特征在于,包含:存储装置;以及处理单元,耦接于该存储装置,用于依据上次修改信息分割来源数据流成为第一数据流及第二数据流;于该第一数据流上执行删除重复数据程序以产生及存储独特块至该存储装置,并为该第一数据流产生第一组组合索引的第一部分,该独特块相对于已经存储于该存储装置并且于删除重复数据程序中可搜索出的所有第一数据块是独特的;从该来源数据流的前一版本的第二组组合索引中复制相应于出现在该第二数据流的逻辑位置的组合索引,作为该第一组组合索引的第二部分;依据该来源数据流的逻辑位置合并该第一组组合索引的该第一部分及该第二部分;以及存储该合并后的第一组组合索引至该存储装置,用于指出该第一数据流及该第二数据流中的多个第二数据块实际存储于该存储装置的何处。2.如权利要求1所述的文件备份装置,其特征在于,该上次修改信息指出自从上次备份后哪些数据块或区域已经改变,以及每一该第一数据块的长度短于该数据块或区域的长度。3.如权利要求1或2所述的文件备份装置,其特征在于,该删除重复数据程序包含:将该第二数据流切分出该第二数据块;计算该第二数据块的指纹;于存储器中准备该第一数据块的采样索引及缓存索引;伴随该采样索引及该缓存索引使用二阶段搜索以辨认每个该第二数据块是独特或重复块;存储该独特块于该存储装置;以及为该第一数据流产生该第一组组合索引的该第一部分。4.如权利要求3所述的文件备份装置,其特征在于,该存储装置存储多个数据桶,每个数据桶存储部分的该第一数据块及该部分的该第一数据块的物理局部保留索引,或该部分的该第一数据块、该部分的该第一数据块的该物理局部保留索引及该部分的该第一数据块的关联历史探测邻块的探测逻辑局部索引;以及该处理单元搜索具有相同于该第一数据流中的逻辑位置的该第一数据块曾使用哪些数据桶以进行去重复操作,及搜集该搜索出的数据桶中的该物理局部保留索引,或该物理局部保留索引及该探测逻辑局部索引,作为该缓存索引。5.如权利要求3所述的文件备份装置,其特征在于,该热门采样索引包含通用采样索引及热门采样索引,以及该热门采样索引关联相同于该第一数据流的操作系统;以及该处理单元添加第一索引至该通用采样索引及从该通用采样索引移除第二索引;判断该第二索引的普及度是否大于该热门采样索引中的最小普及度;及当该第二索引的普及度大于该热门采样索引中的最小普及度时,将热门采样索引中具有最小普及度的索引取代为该第二索引。6.如权利要求3所述的文件备份装置,其特征在于,于第一搜索阶段,判断每个该指纹是否命中该采样索引及该缓存索引中的任何一个,将具有该命中指纹的每个第二数据块标示为重复块,并且扩充该缓存索引;以及于第二搜索阶段,判断每个该指纹是否命中该扩充后的缓存索引中的任何一个,将具有该命中指纹的每个第二数据块标示为重复块,并且将其余第二数据块标示为独特块。7.如权利要求6所述的文件备份装置,其特征在于,该缓存索引包含部分的该第一数据块的物理局部保留索引,及该部分的该第一数据块的关联历史探测邻块的探测逻辑局部索引;以及,当该指纹中的一个命中该探测逻辑局部索引,该处理单元从该存储装置添加包含该命中的探测逻辑局部索引的数据桶中的所有索引于该缓存索引。8.如权利要求6所述的文件备份装置,其特征在于,当该指纹中的一个命中采样索引,该处理单元从该存储装置添加该命中索引的邻近数据桶中的所有索引于该缓存索引。9.如权利要求6所述的文件备份装置,其特征在于,当该指纹中的一个没有命中该缓存索引及该采样索引以及上次命中索引的邻近数据桶中的索引没有存储于该缓存索引,该处理单元从该存...
【专利技术属性】
技术研发人员:许智程,谢昀达,林经纬,吕东烜,
申请(专利权)人:群晖科技股份有限公司,
类型:发明
国别省市:中国台湾,71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。