【技术实现步骤摘要】
一种确定数据存储占比的方法、装置及服务器
本专利技术涉及计算机
,尤其涉及一种确定数据存储占比的方法、装置及服务器。
技术介绍
近年来,随着计算机技术和互联网技术的快速发展,每天都有海量的数据产生,为了保证数据的安全,往往需要对数据进行备份存储。在数据备份处理过程中,备份数据的存储占比是影响数据备份速度和被备份的数据的精准程度的重要因数,目前现有技术还没有提供一种有效的方案可以快速的计算数据的存储占比以加快数据库的备份速度。因此,亟需一种有效可靠的方案来快速准确的确定出数据的存储占比。
技术实现思路
本专利技术提供了一种确定数据存储占比的方法、装置及服务器,可以快速准确的确定出各种类型数据的存储占比。一方面,本专利技术提供了一种确定数据存储占比的方法,所述方法包括:获取与文件数据中目标数据一一对应的标准数字型数据,所述文件数据中的目标数据为多种类型的数据;确定所述标准数字型数据的第一数值区间与目标数据块所对应的标准数字型数据的第二数值区间的交集数值区间,所述目标数据块为所述文件数据的任一数据块;基于预设哈希函数确定所述交集数值区间中的标准数字型数据在所述目标数据块所对应哈希表中的哈希下标区间,所述哈希表包括与哈希下标对应的标准数字型数据的出现次数;将所述哈希下标区间所对应的标准数字型数据的出现次数之和除以目标数据块中数据的总数量,得到所述目标数据在所述目标数据块中的存储占比。另一方面提供了一种确定数据存储占比的装置,所述装置包括:第一标准数字型数据获取模块,用于获取与文件数据中目标数据一一对应的标准数字型数据,所述文件数据中的目标数据为多种类型的数据;交 ...
【技术保护点】
1.一种确定数据存储占比的方法,其特征在于,所述方法包括:获取与文件数据中目标数据一一对应的标准数字型数据,所述文件数据中的目标数据为多种类型的数据;确定所述标准数字型数据的第一数值区间与目标数据块所对应的标准数字型数据的第二数值区间的交集数值区间,所述目标数据块为所述文件数据的任一数据块;基于预设哈希函数确定所述交集数值区间中的标准数字型数据在所述目标数据块所对应哈希表中的哈希下标区间,所述哈希表包括与哈希下标对应的标准数字型数据的出现次数;将所述哈希下标区间所对应的标准数字型数据的出现次数之和除以目标数据块中数据的总数量,得到所述目标数据在所述目标数据块中的存储占比。
【技术特征摘要】
1.一种确定数据存储占比的方法,其特征在于,所述方法包括:获取与文件数据中目标数据一一对应的标准数字型数据,所述文件数据中的目标数据为多种类型的数据;确定所述标准数字型数据的第一数值区间与目标数据块所对应的标准数字型数据的第二数值区间的交集数值区间,所述目标数据块为所述文件数据的任一数据块;基于预设哈希函数确定所述交集数值区间中的标准数字型数据在所述目标数据块所对应哈希表中的哈希下标区间,所述哈希表包括与哈希下标对应的标准数字型数据的出现次数;将所述哈希下标区间所对应的标准数字型数据的出现次数之和除以目标数据块中数据的总数量,得到所述目标数据在所述目标数据块中的存储占比。2.根据权利要求1所述的方法,其特征在于,当所述文件数据的多个数据块包括所述目标数据时,所述方法还包括:将所述哈希下标所对应的标准数字型数据的出现次数之和除以文件数据中数据的总数量,得到所述目标数据的在所述文件数据中的存储占比。3.根据权利要求1所述的方法,其特征在于,在获取与文件数据中目标数据一一对应的标准数字型数据之前,所述方法还包括:确定所述文件数据的数据块,所述数据块包括多种类型的数据;将所述文件数据的数据块中的多种类型的数据转换成标准数字型数据;基于预设哈希函数对数据块所对应的标准数字型数据进行哈希映射处理,构建所述数据块所对应的哈希表,所述哈希表包括与哈希下标对应的标准数字型数据的出现次数。4.根据权利要求3所述的方法,其特征在于,所述基于预设哈希函数对数据块所对应的标准数字型数据进行哈希映射处理,构建所述数据块所对应的哈希表包括:确定数据块所对应的标准数字型数据的分段间隔;确定所述数据块所对应的哈希元素数量;基于所述分段间隔和哈希元素数量对所述数据块所对应的标准数字型数据进行哈希映射处理,得到所述所对应的标准数字型数据的哈希下标;统计所述哈希下标所对应的标准数字型数据的出现次数;将标准数字型数据的出现次数与哈希下标一一对应,得到哈希表。5.根据权利要求4所述的方法,其特征在于,当所述文件数据的数据块中写入新数据时,所述方法还包括:将所述新数据转换成标准数字型数据;获取所述数据块中当前的最大标准数字型数据和最小标准数字型数据;计算所述最大标准数字型数据和所述最小标准数字型数据之差与所述分段间隔的比值;判断所述比值是否大于等于预设哈希扩充参数;当判断的结果为是时,调整所述数据块所对应的哈希表的哈希元素数量和所述预设哈希扩充参数。6.根据权利要求4所述的方法,其特征在于,当所述文件数据的数据块中写入新数据时,所述方法还包括:基于所述分段间隔和当前所对应的哈希元素数量对所述新数据的标准数字型数据进行哈希映射处理,得到新增哈希值;将所述新增哈希值存储至所述数据块所对应的哈希表。7.根据权利要求...
【专利技术属性】
技术研发人员:李海翔,李昊华,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。