针对小块的可伸缩重复删除系统技术方案

技术编号：10068447 阅读：231 留言：0更新日期：2014-05-23 11:23

提供了在计算环境下以小数据块为工作对象的可伸缩重复数据删除的示范性方法、系统、和计算机程序产品实施例。在一个实施例中，仅举例来说，对于每个小数据块，根据出现在小数据块中的字符的表示与小数据块的频率的表示的组合生成签名。将该签名用于帮助选择要重复删除的数据。公开了另外的系统和计算机程序产品，它们具有相关优点。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】提供了在计算环境下以小数据块为工作对象的可伸缩重复数据删除的示范性方法、系统、和计算机程序产品实施例。在一个实施例中，仅举例来说，对于每个小数据块，根据出现在小数据块中的字符的表示与小数据块的频率的表示的组合生成签名。将该签名用于帮助选择要重复删除的数据。公开了另外的系统和计算机程序产品，它们具有相关优点。【专利说明】针对小块的可伸缩重复删除系统
本专利技术一般涉及计算机，尤其涉及在计算存储环境下要求细粒度分辨率(fine-grained resolution)以便能够访问小数据块的可伸缩重复删除(deduplication)。
技术介绍
在当今社会里，计算机系统是司空见惯的。在工作场所，在家里，或在学校都可以找到计算机系统。计算机系统可以包括数据存储系统或盘存储系统来处理和存储数据。每天都必须处理大量数据，当前的趋势暗示着在可预见的将来这些数量将继续日益增加。缓解该问题的有效途径是使用重复删除。重复删除系统所依据的概念是利用通过定位重复数据和只存储它的第一次出现，一而再地复制可用数据的大部分的事实。随后的副本用指向所存储出现的指针来取代，如果数据的确是重复的，则显著降低了存储要求。
技术实现思路
重复数据删除指的是减少和/或消除冗余数据。在重复数据删除中，使用分块方法将可以是文件、数据流、或一些其它形式的数据的数据对象分解成称为块(chunk)的一个或多个部分。在重复数据删除过程中，分别减少或消除数据的重复副本，留下数据的最少量冗余副本或单个副本。使用重复删除过程提供了像降低所需存储容量和扩大网络带宽那样的各种好处。由于这些和其它好处...

【技术保护点】
一种以小数据块为工作对象的可伸缩重复数据删除的方法，该方法包含：对于每个小数据块，根据出现在小数据块中的字符的表示与小数据块的频率的表示的组合生成签名，其中将该签名用于帮助选择要重复删除的数据。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：L阿罗诺维克，R阿舍，M赫希，ST克莱因，E梅里，Y托芙，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人