本申请公开了一种基于git的数据备份方法及系统,由于该方法包括:先接收需要备份的多个数据单元,然后设定所述多个数据单元中的一个数据单元为标准数据单元,再利用git分别确定其他数据单元相对于所述标准数据单元的数据增量,再保存所述标准数据单元和所述数据增量,最后删除所述其他数据单元。本申请提供的上述基于git的数据备份方法及系统,能够高效的利用存储空间,降低存储成本。
【技术实现步骤摘要】
本专利技术属于数据备份
,特别是涉及一种基于git的数据备份方法及系统。
技术介绍
当今社会,互联网信息行业高速发展,每天产生的数据数以EB计。在这么多的数据中,有很多是很重要的数据,需要做数据备份。由于需要备份的数据规模庞大,因此就需要占用大规模的存储空间,导致存储成本较高。通过研究发现,有些数据之间具有较大的关联性,例如,两个需要备份的数据大部分是相同的,而只有小部分有所不同,但现有技术中对二者进行存储时,依然是分别进行存储,这就造成了极大的空间浪费,因此为了达到节省存储空间的目的,如何高效的利用存储空间就变得尤为重要。
技术实现思路
为解决上述问题,本专利技术提供了一种基于git的数据备份方法及系统,能够高效的利用存储空间,降低存储成本。本专利技术提供的一种基于git的数据备份方法,包括:接收需要备份的多个数据单元;设定所述多个数据单元中的一个数据单元为标准数据单元;利用git分别确定其他数据单元相对于所述标准数据单元的数据增量;保存所述标准数据单元和所述数据增量;删除所述其他数据单元。优选的,在上述基于git的数据备份方法中,所述设定所述多个数据单元中的一个数据单元为标准数据单元之前,还包括:在备份服务器创建git仓库。优选的,在上述基于git的数据备份方法中,所述设定所述多个数据单元中的一个数据单元为标准数据单元之后,还包括:将标准数据单元添加到git仓库的主分支。优选的,在上述基于git的数据备份方法中,所述利用git分别确定其他数据单元相对于所述标准数据单元的数据增量包括:通过git工具将其他数据单元与所述标准数据单元作比较,找出其他数据单元相对于所述标准数据单元的数据增量。优选的,在上述基于git的数据备份方法中,所述保存所述标准数据单元和所述数据增量包括:保存所述标准数据单元,并将所述数据增量进行打包和区别保存。本专利技术提供的一种基于git的数据备份系统,包括:接收模块,用于接收需要备份的多个数据单元;设定模块,用于设定所述多个数据单元中的一个数据单元为标准数据单元;确定模块,用于利用git分别确定其他数据单元相对于所述标准数据单元的数据增量;保存模块,用于保存所述标准数据单元和所述数据增量;删除模块,用于删除所述其他数据单元。优选的,在上述基于git的数据备份系统中,还包括:创建模块,用于在备份服务器创建git仓库。优选的,在上述基于git的数据备份系统中,还包括:添加模块,用于将标准数据单元添加到git仓库的主分支。优选的,在上述基于git的数据备份系统中,所述确定模块中包括:比较单元,用于通过git工具将其他数据单元与所述标准数据单元作比较,找出其他数据单元相对于所述标准数据单元的数据增量。优选的,在上述基于git的数据备份系统中,所述保存模块包括:第一保存单元,用于保存所述标准数据单元;第二保存单元,用于将所述数据增量进行打包和区别保存。通过上述描述可知,本专利技术提供的上述基于git的数据备份方法及系统,由于先接收需要备份的多个数据单元,然后设定所述多个数据单元中的一个数据单元为标准数据单元,再利用git分别确定其他数据单元相对于所述标准数据单元的数据增量,再保存所述标准数据单元和所述数据增量,最后删除所述其他数据单元,因此能够高效的利用存储空间,降低存储成本。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例提供的第一种基于git的数据备份方法的示意图;图2为数据服务器向备份服务器传递需要备份数据单元的示意图;图3为利用git确定数据增量的示意图;图4为数据恢复的流程图;图5为本申请实施例提供的第一种基于git的数据备份系统的示意图。具体实施方式本专利技术的核心思想在于提供一种基于git的数据备份方法及系统,能够高效的利用存储空间,降低存储成本。下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本申请实施例提供的第一种基于git的数据备份方法如图1所示,图1为本申请实施例提供的第一种基于git的数据备份方法的示意图。该方法包括如下步骤:S1:接收需要备份的多个数据单元;在该步骤中,可以利用备份服务器接收需要备份的数据,其中数据接收包括定时接收和实时接收两种方式,以每次接收的数据为一个数据单元。S2:设定所述多个数据单元中的一个数据单元为标准数据单元;在该步骤中,不同的数据单元之间有部分相同的数据,可以从中选取一个数据单元作为标准数据单元,其他的数据单元均与其有部分相同数据。S3:利用git分别确定其他数据单元相对于所述标准数据单元的数据增量;在该步骤中,利用git技术确定出数据增量,就不再需要将相同的数据部分都进行保存,从而节省大量存储空间,也提高存储效率。S4:保存所述标准数据单元和所述数据增量;在该步骤中,由于不同数据单元之间有部分相同数据,因此不需要对重复数据进行保存,只需要保存其他数据单元和标准数据单元之间的差异就可以,这部分数据比较小,从而达到备份数据的同时又节省存储空间的效果。S5:删除所述其他数据单元。在该步骤中,将其他数据单元删除,仅仅保留标准数据单元和数据增量,这就大大降低了所需的存储空间,保证存储的效率足够高。另外需要说明的是,当需要某个数据单元时,将对应的数据增量,应用到所述标准数据单元,就能够得到对应的额数据单元,这就是所需要的数据。通过上述描述可知,本申请实施例提供的上述第一种基于git的数据备份方法,由于先接收需要备份的多个数据单元,然后设定所述多个数据单元中的一个数据单元为标准数据单元,再利用git分别确定其他数据单元相对于所述标准数据单元的数据增量,再保存所述标准数据单元和所述数据增量,最后删除所述其他数据单元,因此能够高效的利用存储空间,降低存储成本。本申请实施例提供的第二种基于git的数据备份方法,是在上述第一种基于git的数据备份方法的基础上,还包括如下技术特征:所述设定所述多个数据单元中的一个数据单元为标准数据单元之前,还包括:在备份服务器创建git仓库。具体的,参考图2,图2为数据服务器向备份服务器传递需要备份数据单元的示意图,其中,备份服务器上预装git仓库,所有的数据单元都将数据传输至所述git仓库中,然后有git仓库对数据做后续处理。本申请实施例提供的第三种基于git的数据备份方法,是在上述第二种基于git的数据备份方法的基础上,还包括如下技术特征:所述设定所述多个数据单元中的一个数据单元为标准数据单元之后,还包括:将标准数据单元添加到git仓库的主分支。在这种情况下,保证git仓库暂存区没有要提交的数据。本申请实施例提供的第四种基于git的数据备份方法,是在上述第三种基于git的数据备份方法的基础上,还包括如下技术特征:所述利用git分别确定其他数据单元相对于所述标准数据单元的数据增量包括:如图本文档来自技高网...
【技术保护点】
一种基于git的数据备份方法,其特征在于,包括:接收需要备份的多个数据单元;设定所述多个数据单元中的一个数据单元为标准数据单元;利用git分别确定其他数据单元相对于所述标准数据单元的数据增量;保存所述标准数据单元和所述数据增量;删除所述其他数据单元。
【技术特征摘要】
1.一种基于git的数据备份方法,其特征在于,包括:接收需要备份的多个数据单元;设定所述多个数据单元中的一个数据单元为标准数据单元;利用git分别确定其他数据单元相对于所述标准数据单元的数据增量;保存所述标准数据单元和所述数据增量;删除所述其他数据单元。2.根据权利要求1所述的基于git的数据备份方法,其特征在于,所述设定所述多个数据单元中的一个数据单元为标准数据单元之前,还包括:在备份服务器创建git仓库。3.根据权利要求2所述的基于git的数据备份方法,其特征在于,所述设定所述多个数据单元中的一个数据单元为标准数据单元之后,还包括:将标准数据单元添加到git仓库的主分支。4.根据权利要求3所述的基于git的数据备份方法,其特征在于,所述利用git分别确定其他数据单元相对于所述标准数据单元的数据增量包括:通过git工具将其他数据单元与所述标准数据单元作比较,找出其他数据单元相对于所述标准数据单元的数据增量。5.根据权利要求1-4任一项所述的基于git的数据备份方法,其特征在于,所述保存所述标准数据单元和所述数据增量包括:保存所述标准数据单元,并将所述数据增量...
【专利技术属性】
技术研发人员:张伟,赵祯龙,薛昊原,刘洋,刘康,
申请(专利权)人:浪潮北京电子信息产业有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。