【技术实现步骤摘要】
用于泛在存储系统的网络环境自适应编码方法及系统
[0001]本专利技术属于计算机存储
,具体涉及用于泛在存储系统的网络环境自适应编码方法及系统。
技术介绍
[0002]如今,常用的分布式存储系统大多采用数据中心式的多机架多服务器方案,在宏观物理形式上仍然是中心化的存储,导致数据的安全性和私密性受到挑战。而泛在存储采用去中心化架构,每个人都可以将自己设备(手机、平板、电脑甚至是智能汽车)上的空闲存储空间和带宽贡献/出租出去,成为泛在存储系统中的存储节点。然而,如此庞大的存储节点规模使得节点失效成为常态,导致数据持久性急速下降。因此,数据要想永久可靠地存储在泛在存储系统中,就必须采用一定的数据容错技术来维持泛在存储系统中的数据持久性。
[0003]目前,具有高持久性和低冗余性的纠删码泛在存储方案已经引起了人们的关注。例如,被广泛采用的RS(Reed
‑
Solomon)纠删码将大文件或原始数据切割成若干个固定大小的块,大小不够的用0来填充,之后对这些块进行(n,k)纠删编码,将每个块先均分成k个片段,然后将k个片段编码成n个片段。当丢失的片段小于等于n
‑
k时,只需任意k个片段即可恢复出相应的块。与三副本方案相比,它可将存储开销降低53%,同时将数据持久性提高一倍。
[0004]然而,在数据修复时,RS纠删码由于其过高的数据修复带宽开销导致耗费了大量的网络带宽。泛在存储系统中节点是不稳定的,节点抖动率表示了系统中节点下线的比例,所以修复会被更频繁地触发,导致整个存储 ...
【技术保护点】
【技术特征摘要】
1.用于泛在存储系统的网络环境自适应编码方法,其特征在于,包括如下步骤:S1,在RS纠删码的基础上扩展纠删码参数;S2,采用有限离散时间马尔科夫链建模,进行数据修复过程;S3,估计数据修复过程所占用的带宽开销比例和数据丢失率,得到最优修复带宽开销及慢速节点分布;S4,通过EAP算法,根据网络环境自适应调整纠删码参数,得到维持期望持久性的最优纠删码参数;S5,通过ORP算法,根据泛在存储系统当前节点抖动率和慢速节点比例的情况下,得到最低修复带宽开销且满足期望持久性的最优纠删码参数。2.根据权利要求1所述的用于泛在存储系统的网络环境自适应编码方法,其特征在于,步骤S1包括如下步骤:S11,在RS纠删码的基础上将纠删码参数(n,k)扩展为(k,m,o,n);其中,k为修复一个块所需的最少片段数;m为修复阈值;o为不考虑泛在存储系统中慢速节点时的最终片段个数;n为考虑泛在存储系统中慢速节点时的最终片段个数。3.根据权利要求2所述的用于泛在存储系统的网络环境自适应编码方法,其特征在于,步骤S2包括如下步骤:S21,设定状态表示泛在存储系统中一个块的冗余级别;节点抖动率PFR表示在泛在存储系统中一年内节点下线的比例,对于一个给定的节点,在单位时间步长内失效的概率为存活的概率为1
‑
α;S22,设定马尔科夫链共有o
‑
k+2个状态,即一个数据块b的o
‑
k个冗余级别,外加一个0级和一个死亡dead状态;用[o
‑
k](b)来表示数据块b的剩余冗余片段数,一个数据块以级别i丢失一个片段的概率用δ(i)表示,当[o
‑
k](b)≤m
‑
k时开始修复,并修复到o
‑
k个;S23,设定处于某一状态的概率收敛于一个唯一的平稳分布P,P(i)表示处于状态i的平稳概率;δ(0)表示一个数据块的冗余片段数为0时再丢失一个片段的概率,P(0)则表示一个数据块的冗余片段数为0时的平稳概率;马尔科夫链的平稳分布通过以下的稳定性方程进行计算:S24,将处于P(o
‑
k)级别的片段的比例简化为其中是n的调和函数;根据欧拉公式,得出H
n
≈ln(n);则当状态i处于m
‑
k<i≤o
‑
k时的数据块的比例表示为代入公式得:4.根据权利要求3所述的用于泛在存储系统的网络环境自适应编码方法,其特征在于,步骤S3包括如下步骤:
S31,定义修复带宽低效率ε(i),即需要传输来修复i个丢失片段的数据比例:ε(i)=(k+i
‑
1);当一个数据块需要修复时,丢失分片的数据量为o
‑
m;当只考虑需要传输的分片的比例时,平均带宽开销直接来自状态m
‑
k+1到状态m
‑
k的转换,所述转换的数据块的比例表示为:δ(m
‑
k+1)
·
P(m
‑
k+1),完成修复的平均块数为:R
av...
【专利技术属性】
技术研发人员:王明阳,宋罡,汪波,杨阿锋,刘涛,王军良,姚英彪,王明飞,马祥春,徐欣,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。