一种基于两层SAC的连续小推力卫星轨道控制方法技术

技术编号：42985848 阅读：20 留言：0更新日期：2024-10-15 13:18

本发明专利技术公开了一种基于两层SAC的连续小推力卫星轨道控制方法，其涉及卫星轨道控制技术领域。本发明专利技术在卫星变轨过程中采用级联方式连接SAC—1网络模型和SAC—2网络模型，分别以目标轨道附近和最终目标位置为卫星小推力变轨目标，有效解决了小推力轨道转移与定点一体化控制问题，弥补了一次变轨导致轨道末端状态误差较大的不足；利用α和β两个方向角表示施加在卫星上的小推力，进一步完善了卫星转移过程的动力学建模；对于相同的轨道要素，在不同的级联网络中设置不同权重，同时SAC‑2网络模型将SAC‑1网络模型的输出作为输入，提高了卫星变轨精度；设计了一种卫星状态势函数辅助的奖励函数，有利于提升卫星变轨控制策略的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及卫星轨道控制，具体涉及一种基于两层sac的连续小推力卫星轨道控制方法。

技术介绍

1、全电推进卫星是新一代高轨卫星的重要发展方向之一。电推进卫星轨道控制的本质是连续小推力卫星轨道控制。传统化学燃料脉冲推进方式因其高冲量但燃料消耗大、控制精度受限等缺点，难以满足日益复杂的航天任务需求。而连续小推力系统，因其推力小、比冲高、燃料消耗少等优势，成为实现高精度轨道控制和长期驻留的重要手段。在采用现有技术的条件下，卫星从低地球轨道机动到地球静止轨道，通常涉及到轨道转移和定点两个轨道控制阶段。如何进行轨道转移和定点的一体化控制，从而进一步降低飞行时间和燃料消耗，是小推力轨道控制的一个亟待解决的技术难题。

2、现有的连续小推力卫星轨道控制方法，大多是单独分别研究轨道转移和定点各阶段的轨道控制问题，且控制目标和约束条件有所不同，造成小推力轨道控制过程繁琐；或在控制卫星机动过程中，同时改变倾角和高度以机动至目标轨道，一次性转移至目标轨道，从而造成误差较大，而推力偏航角变化不大，难以实现小推力卫星轨道转移与定点一体化控制的精度。

技术实现思路

1、针对现有技术中的上述不足，本专利技术提供的一种基于两层sac的连续小推力卫星轨道控制方法解决了现有技术仅单独分别研究轨道转移和定点各阶段的轨道控制方法，造成控制过程繁琐或同时改变倾角和高度以机动至目标轨道，一次性转移至目标轨道，从而造成误差较大的问题，难以实现小推力卫星轨道转移与定点一体化控制。

2、为了达到上述专利技术

3、提供了一种基于两层sac的连续小推力卫星轨道控制方法，其包括以下步骤：

4、s1、确定连续小推力卫星的轨道转移问题；

5、s2、基于轨道转移问题，建立对应的马尔科夫决策模型；

6、s3、利用sac—1网络模型对步骤s2中的马尔科夫决策模型进行处理，对连续小推力卫星施加连续机动，推送至目标轨道附近；

7、s4、将sac—1网络模型的输出输入至sac—2网络模型，对连续小推力卫星施加连续机动，推送至目标轨道。

8、进一步地，步骤s2中的马尔科夫决策模型mdp的公式为：

9、mdp＝{s,a,psa,r,γ}

10、s＝{s1,s2,…,sm}

11、sq＝{hq,hxq,hyq,exq,eyq,φq}

12、a＝{a1,a2,…,am}

13、aq＝{αq,βq}

14、r＝φ(st+1)-φ(st)-τ-5ξ+100d

15、其中，s表示状态空间，a表示动作空间，psa表示状态转移函数，r表示奖励函数，γ表示折扣因子，{s1,s2,…,sm}、sq分别表示第1个至第m个状态、第q个状态，{a1,a2,…,am}、aq分别表示第1个至第m个动作、第i个动作，αq、βq分别表示第q个状态和动作下的推力单位矢量在轨道面内的投影与径向的夹角、第q个状态和动作下的推力单位矢量与轨道面的夹角，hq、hxq、hyq分别表示第q个状态和动作下的连续小推力卫星的角动量大小和角动量在两个坐标轴的分量，exq、eyq分别表示第q个状态和动作下的偏心率矢量在xy轴方向上的分量，φi表示第q个状态和动作下的连续小推力卫星的真近点角，φ(st)、φ(st+1)分别表示状态st、st+1对应的状态势函数，τ、ξ、d表示常数。

16、进一步地，sac—1网络模型和sac—2网络模型采用级联的方式进行连接，并均包括串联的actor策略网络、critic值网络；其中，critic值网络包括critic当前值网络和critic目标值网络。

17、进一步地，步骤s3中的sac—1网络模型的训练过程包括以下步骤：

18、s3-1、初始化actor策略网络的网络参数θ、学习率α1、critic当前值网络的网络参数φ1和φ2、critic目标值网络的网络参数和以及critic值网络学习率α2；

19、s3-2、设置时间步长n，且初始化经验回放池容量b；

20、s3-3、利用actor策略网络与环境进行交互，得到对应当前时刻的状态st、动作at；

21、s3-4、基于当前时刻的状态st，通过连续小推力卫星执行动作at，得到对应的奖励rt；

22、s3-5、判断连续小推力卫星的运行角度是否达到时间步长n；若是则进入步骤s3-6；反之则进入步骤s3-9；

23、s3-6、计算连续小推力卫星的当前时刻的半长轴a、偏心率e和轨道倾角i；

24、s3-7、基于当前时刻的半长轴a、偏心率e和轨道倾角i，更新时间步长n；

25、s3-8、将状态、动作和奖励作为样本序列存储至经验回放池；

26、s3-9、重复步骤s3-3至步骤s3-8，直至获得n组样本序列；

27、s3-10、计算critic目标值网络的输出；

28、s3-11、计算actor策略网络、critic当前值网络和critic目标值网络对应的损失值lθ、

29、s3-12、基于损失值lθ、更新actor策略网络、critic当前值网络的网络参数；

30、s3-13、基于更新后的critic当前值网络，利用软更新对critic目标值网络的网络参数进行更新；

31、s3-14、重复步骤s3-1至步骤s3-13，直至达到预设训练次数。

32、进一步地，半长轴a的计算公式为：

33、

34、偏心率e的计算公式为：

35、

36、轨道倾角i的计算公式为：

37、

38、其中，ht表示当前时刻的状态st和动作at下的连续小推力卫星的角动量大小，μ表示地球引力常数，ext、eyt分别表示当前时刻的状态st和动作at下偏心率矢量在xy轴方向上的分量，hxt、hyt分别表示当前时刻的状态st和动作at下的角动量在两个坐标轴的分量。

39、进一步地，步骤s3-7包括以下步骤：

40、s3-7-1、判断当前时刻的半长轴a、偏心率e和轨道倾角i是否满足第一判断标准；若是则将时间步长n设置为0.1并进入步骤3-8；反之则进入步骤s3-7-2；其中，第一判断标准为：

41、

42、s3-7-2、判断当前时刻的半长轴a、偏心率e和轨道倾角i是否满足第二判断标准；若是则将时间步长n设置为1；反之则将时间步长n设置为10；进入步骤s3-8；其中，第二判断标准为：

43、a∈{atar±2100km}

44、e≤0.01

45、i≤0.1

46、其中，atar表示最小半长轴。

47、进一步地，步骤s3-10的公式为：

48、

49、其中，s'表示状态，a′θ表示动作，y(r,s',d)表示cr本文档来自技高网...

【技术保护点】

1.一种基于两层SAC的连续小推力卫星轨道控制方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的基于两层SAC的连续小推力卫星轨道控制方法，其特征在于：所述步骤S2中的马尔科夫决策模型MDP的公式为：

3.根据权利要求2所述的基于两层SAC的连续小推力卫星轨道控制方法，其特征在于：所述SAC—1网络模型和SAC—2网络模型采用级联的方式进行连接，并均包括串联的Actor策略网络、Critic值网络；其中，Critic值网络包括Critic当前值网络和Critic目标值网络。

4.根据权利要求3所述的基于两层SAC的连续小推力卫星轨道控制方法，其特征在于：所述步骤S3中的SAC—1网络模型的训练过程包括以下步骤：

5.根据权利要求4所述的基于两层SAC的连续小推力卫星轨道控制方法，其特征在于：所述半长轴a的计算公式为：

6.根据权利要求4所述的基于两层SAC的连续小推力卫星轨道控制方法，其特征在于：所述步骤S3-7包括以下步骤：

7.根据权利要求4所述的基于两层SAC的连续小推力卫星轨道控制方法，其特征

8.根据权利要求4所述的基于两层SAC的连续小推力卫星轨道控制方法，其特征在于：所述步骤S4中的SAC—2网络模型的半长轴a、偏心率e和轨道倾角i在奖励函数中的权重是SAC—1网络模型的半长轴a、偏心率e和轨道倾角i在奖励函数中的权重的三倍，其余过程采用与步骤S3相同的方法。

9.根据权利要求4所述的基于两层SAC的连续小推力卫星轨道控制方法，其特征在于：还包括步骤S5，对应的过程为：

...

【技术特征摘要】

1.一种基于两层sac的连续小推力卫星轨道控制方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的基于两层sac的连续小推力卫星轨道控制方法，其特征在于：所述步骤s2中的马尔科夫决策模型mdp的公式为：

3.根据权利要求2所述的基于两层sac的连续小推力卫星轨道控制方法，其特征在于：所述sac—1网络模型和sac—2网络模型采用级联的方式进行连接，并均包括串联的actor策略网络、critic值网络；其中，critic值网络包括critic当前值网络和critic目标值网络。

4.根据权利要求3所述的基于两层sac的连续小推力卫星轨道控制方法，其特征在于：所述步骤s3中的sac—1网络模型的训练过程包括以下步骤：

5.根据权利要求4所述的基于两层sac的连续小...

【专利技术属性】
技术研发人员：江秀强，郑鹏鑫，季袁冬，孙国皓，钟苏川，蔡鑫宇，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人