一种面向卫星云的分布式文件系统技术方案

技术编号:38151217 阅读:6 留言:0更新日期:2023-07-13 09:15
本发明专利技术通过分布式系统领域的方法,实现了一种面向卫星云的分布式文件系统。系统由5个组件组成:元数据管理模块、StorageEngine、Policy、客户端和卫星拓扑服务模块;其中元数据管理模块进行元数据存储,Storage Engine是数据存储模,Policy是策略模块,用户使用客户端与卫星云文件系统进行交互,卫星拓扑服务模块针对卫星云场景专门设计为卫星云文件系统提供卫星云的网络拓扑信息,各模块之间使用RPC通过专门的文件系统接口实现通信。本发明专利技术提供的方法针对卫星通信场景,保证元数据的高效读取和可靠性;利用卫星云的网络拓扑特征,最大程度地减少副本放置的通信代价和能量损耗;最大化降低访问时延。最大化降低访问时延。最大化降低访问时延。

【技术实现步骤摘要】
一种面向卫星云的分布式文件系统


[0001]本专利技术涉及分布式存储
,尤其涉及一种面向卫星云的分布式文件系统。

技术介绍

[0002]经过数十年的快速发展,起源于上世纪60年代的现代遥感技术及应用已经进入了新的阶段。遥感技术在农作物监测与产量估计、土地资源监控与调查、灾情监测与评估、海洋环境监测等多个领域具有重要的应用价值,与国民经济发展、生态环境保护以及国家安全具有十分紧密的关系。此外,在与人们日常生活息息相关的天气预报、地图导航以及空气质量监测等场景中,遥感技术都发挥了重要作用。近些年来,随着遥感技术的不断发展,其已经具备了新的特征:高空间分辨率、高时间分辨率以及高光谱分辨率等,并且应用领域也更加广泛,深入到军事、民用的方方面面。
[0003]当前的遥感卫星任务链获取信息的链条较长,主要包含地面任务规划、遥感数据星上存储、星地数据传输以及地面接收处理数据等环节。另外,遥感卫星只能在过境时将数据传输到地面站,受通信时长和通信带宽的影响,遥感数据落地时延单位为天级,这严重影响了遥感卫星的使用时效。
[0004]近几年,5G移动通信技术进入到大规模商用阶段,许多科研机构和公司已经着手探索研究下一代移动通信技术6G。星地一体融合组网是6G中的一项关键技术,即飞行在不同轨道高度的卫星、飞行在不同空域的飞行器以及地面网络组成全新的移动通信网络。星地一体融合网络可以通过天基、空基实现对偏远地区、海上和空中的按需覆盖,同时还可以通过地面网络实现城市内的常态化网络覆盖,具有很强的实用性,同时具备灵活组网、韧性抗毁等优势。
[0005]最近,卫星互联网方案在太空也得到了验证,该方案在太空中批量部署卫星,形成一个协同计算网络,未来有望利用该网络服务于城市建设、环境监测、防灾减灾以及应急通讯等多个领域中。另一方面,还可以按照需求对卫星边缘任务进行更新,例如:通过在轨AI模型的推理,来比较山体在暴雨前后图片的变化,以期提前探查发现山体坍塌或者发生其他地质灾害的风险,提前向相关部门发出预警,帮助人们做好应急准备。因此建设一个云计算资源管理与服务系统对卫星互联网有重大意义,可以利用协同卫星的网络、存储和计算能力,使数据得到快速处理和落地,突破数据传输时延长的瓶颈。
[0006]建设卫星云的一个关键点就是整合存储资源,由于遥感影像都是大文件,且数据类型多样,非常适合利用分布式文件系统来存储。并且经过多年的发展,分布式文件系统已经很成熟,可以提供文件资源统一视图,具有海量存储,可扩展性好,冗余副本,高可用等特点。但是卫星云上的节点载核计算能力有限,并且网络拓扑也不同于传统的数据中心拓扑,是一种典型的Torus网络。Torus这种网络结构允许节点和多个邻居通信,节点之间通信有多条路由路径,这会使网络有更好的网络联通性,较强的容错能力和鲁棒性。并且由于卫星轨道的运动特征,卫星之间的距离也会变化,这对于设计分布式文件系统提出了挑战。
[0007]综上所述,本专利技术必须考虑卫星节点载核资源受限的特点,充分利用卫星云的网
络拓扑和运动特征,设计面向卫星云的分布式文件系统,提高系统的性能和可用性。
[0008]低轨卫星指近地轨道卫星,近地轨道又称LEO(Low Earth Orbit)的高度一般在2000公里以下,由于低轨卫星距离地面较近,因此速度也较快,目前绝大多数遥感卫星、通信卫星和空间站都采用近地轨道。
[0009]一般来说星地通信采用无线电信号,而卫星星座之间通过卫星间链路(Intersatellite Link,ISL)相互连接,ISL连接着不同轨道的卫星和相同轨道的卫星。同一轨道内的卫星之间的距离在整个连接中是固定的,但不同轨道间卫星的距离是随着卫星的移动而变化的。尽管卫星移动会导致网络拓扑结构发生变化,但已建立的连接必须在网络中保持,其中每颗卫星在其轨道平面内连接到其后继卫星和前驱卫星,以及距每个相邻平面最近的卫星。并且由于太空环境下真空中光的传播速度比光纤快47%,因此与地面网络相比,卫星网络可以显着降低网络延迟。
[0010]虽然卫星尽管具有高移动性,但网络的实际拓扑不会改变,显而易见,一个星座可以建模为N
×
M的2D Torus网络,其中N是轨道的数量,M是轨道内卫星的数量。
[0011]随着卫星通信网络的进步,人们也在思考更多的可能性,比如LEO边缘计算。在边缘计算中,计算和存储资源嵌入网络中并靠近消费者,以提供低访问延迟、增加吞吐量、增加隐私和降低成本等。对于LEO卫星网络,网络边缘是卫星星座本身,因为卫星直接与用户设备(地面站)通信。因此很多人提出使用LEO Edge,通过向LEO卫星添加计算和存储资源,以构建CDN或物联网预处理等边缘应用程序。
[0012]而目前在卫星上支持大型存储的系统很少,CubeSat是一个先驱,CubeSat是一种用于太空研究的小型卫星,这种卫星价格较低,可以在更短的时间内完成更多的工作。但是CubeSat的存储、计算和通信能力有限,单个CubeSat本身无法完成很多工作,因此需要建立CubeSat集群。
[0013]CubeSat分布式文件系统(CDFS)就是为CubeSat集群设计的分布式存储系统,以支持后续的分布式处理。而现有的分布式文件系统,如Google文件系统、Hadoop分布式文件系统和Lustre都是为使用可靠的有线通信介质连接的分布式系统而设计的。这些文件系统并不适合在CubeSat集群上存储数据,因为传统的分布式文件系统假设通信媒介是可靠的,并且它们是专为使用机架以平面或分层方式组织节点的系统而设计的,其通信成本不是很高。而对于太空中的CubeSat集群,传统的分布式文件系统设计会带来巨大的通信开销、消耗大量电力。CDFS通过一系列的方案克服了上述问题,包括负载均衡、传输时复制和基于树的路由和聚合来控制消息减少等措施。
[0014]Cloud Constellation计划建立一个名为Space

Belt的基于低地球轨道(LEO)卫星的云基础设施,该基础设施计划为互联网服务提供商、电信业务等大型企业和政府机构提供安全的数据存储。为了解决普遍存在的全球数据不安全危机,该系统将利用LEO轨道卫星和安全地面网络的组合,允许客户在太空中安全地存储大量敏感和关键任务数据。这种系统的优点很容易被识别,因为它可以通过以下方式保护高价值数据:1.与互联网和地面租用线路完全绝缘;2.将其从网络攻击和秘密活动中解放出来;3.保护它免受地球上的自然灾害和重大事件的影响;4.解决所有管辖问题;5.规避违反隐私法规的风险。
[0015]现有方案基于天基云设计了数据存储基础的分层结构,其中数据存储层中,数据集存储在分布式服务器集群中,这些服务器部署在LEO卫星上,在每颗LEO卫星中,至少应将
一台服务器嵌入到机载单元中。然后每台服务器托管一个或多个虚拟机(VM),其中可以执行一些流行的数据存储技术,如HBase、Hive和HDFS,以提供数据管理功能。目前完全基于卫星的大规模存储系统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向卫星云的分布式文件系统,其特征在于:系统由5个组件组成:元数据管理模块、Storage Engine、Policy、客户端和卫星拓扑服务模块;其中元数据管理模块以TiKV架构为基础的元数据存储模型进行元数据存储,同时采用元数据高可用设计将元数据切分成不同的数据块,并设计元数据编码方法和元数据缓存机制,保证元数据集群的负载均衡和数据的高效访问,同时设计元数据服务以建立无状态元数据节点;Metadata Engine为元数据引擎,由元数据服务器组成,所述元数据服务器无状态;Storage Engine是数据存储模块,由全部卫星组成,每一个卫星都是块服务器,采用元数据节点的选取策略、针对低延迟访问场景的副本放置策略优化和拓扑感知的副本放置策略保存和读写块数据;Policy是策略模块,针对卫星云场景进行,为所述元数据管理模块提供元数据的存储模型选择,为所述Storage Engine提供元数据节点的选取策略和拓扑感知的副本放置策略,针对低延迟访问场景的副本放置策略优化;用户使用客户端与卫星云文件系统进行交互;卫星拓扑服务模块针对卫星云场景专门设计为卫星云文件系统提供卫星云的网络拓扑结构、星间链路距离、星地通信区间信息,为机制和策略提供输入参数;卫星云文件系统需要根据网络拓扑结构进行最优的副本放置策略选择,同时系统各模块之间使用RPC进行通信,系统之间通过专门的文件系统接口实现客户端与卫星云文件系统的交互。2.如权利要求1所述的一种面向卫星云的分布式文件系统,其特征在于:所述元数据存储模型将元数据信息建模为键值对,用分布式KV存储系统TiKV存储,采用目录项表和索引节点表两个表来存储目录树信息,所述目录项表用于存储目录树中的内容,以多叉树结构转化成KV形式存储,多叉树的键值在首部存储父目录的索引节点Id;所述索引节点表用于存储中的索引节点信息,键值为索引节点Id,采用引用计数方法实现硬链接。3.如权利要求2所述的一种面向卫星云的分布式文件系统,其特征在于:所述元数据高可用设计使用multi

raft

group的副本机制,将数据按照键值的范围划分成大致相等的切片,每一个切片会有多个副本,其中一个副本是Leader,提供读写服务,存储节点通过调度节点对这些切片以及副本进行调度,以保证数据和读写负载都均匀地分散在各个存储节点上。4.如权利要求3所述的一种面向卫星云的分布式文件系统,其特征在于:所述无状态元数据节点建立方法为:主数据服务存储统一接入TiKV,块服务器通过主数据服务操作元数据,主数据服务并不实际存储数据,只缓存TiKV中的数据,同时主数据服务在内存中维护各个节点的负载情况,块服务器在启动时上报自己的网络地址,每个块服务器定期上报自身的负载信息,主数据服务在内存中维护了每个块服务器的信息。5.如权利要求4所述的一种面向卫星云的分布式文件系统,其特征在于:所述元数据节点的选取策略采用基于2D

Torus网络的资源放置算法,首先将网络拓扑看成一个无权图,也就是使D
M
=D
N
,用跳数来作为距离指标,这种被称为d

Hops放置,d为跳数,使用基本的2D

Torus资源放置算法,使得每一个节点到元数据节点的跳数都不会超过d,根据卫星云建模的N
×
M的2D

Torus网络拓扑,如果N和M都是k的倍数,并且k=2d2+2d+1,一个k
×
k的2D

Torus网络的完美放置位置是:[i,2d2i](mod k),i=0,1,...,(k

1)由于N和M未必是k的整数倍,而是N=pk+r和M=qk+s,并且0<s,r<k,因而构造(p+1)
×
(q+1)个k
×
k的2D

Torus子块,然后分别使用完美放置算法,最后删除k

r行和k

s列,当D
M
≠D
N
时,网络拓扑不是一个无权图,转化基本的2D

Torus资源放置算法,将N
×
M延伸成N
×
N,其中N>M,然后再压缩成N
×
M。6.如权利要求5所述的一种面向卫星云的分布式文件系统,其特征在于:所述拓扑感知的副本放置策略通过局部筛选,针对带宽、能量和负载均衡优化,加以使用最小生成树算法,来选取最优的副本放置方案:考虑带宽性能,则一个节点接受到数据后,会以该节点为圆心,固定的跳数或距离为半径,圈出一个区域,之后所做的任何选取策略,只能在区域内考虑;考虑能量性能,副本的复制路径对方法进行优化,采用链式复制的方式,将路径,选取最少中继点、将最多的副本放置位置作为存储中继的路径模式,作为优化策略;考虑负载均衡性能,则在副本放置时,获取区域内所有节点的负载分数。负载分数用LBF表示,输入:节点存储容量N
storage
,节点计算能力N
cpu
,节点通信带宽N
bandwidth
,节点剩余电力N
power
,总存储容量Total_Storage,总处理能力Total_Cpu,总通信带宽Total_Bandwidth,总电力Total_Power,存储权重W
storage
,计算权重W
cpu
,通信带宽W
bandwidth
,电力权重W
power
参数,通过如下步骤进行计算:LBF
storage
=N
storage
÷
Total_StorageLBF
cpu
=N
cpu
÷
Total_C...

【专利技术属性】
技术研发人员:沃天宇范坤
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1