System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于MAPPO算法的多飞行器协同制导方法技术_技高网

一种基于MAPPO算法的多飞行器协同制导方法技术

技术编号:44424293 阅读:4 留言:0更新日期:2025-02-28 18:38
本发明专利技术涉及一种基于MAPPO算法的多飞行器协同制导方法,包括:建立多飞行器协同制导模型,所述多飞行器协同制导模型包括各飞行器动力学模型、过程约束模型、终端约束模型、倾侧角幅值约束模型;当剩余飞行航程大于等于500km时,设计基于改进预测校正的协同制导律,求解飞行器攻角与倾侧角制导指令:当剩余航程小于500km时,切换至基于MAPPO算法的协同制导律,求解飞行器攻角与倾侧角制导指令。本发明专利技术能够在较大时间差中精确到达中末交班点,并顺利实现时间协同任务。本发明专利技术对于状态扰动有着较强的鲁棒性,具有更大的时间协同范围和更好的时间协同制导能力。

【技术实现步骤摘要】

本专利技术属于飞行器制导控制领域,涉及一种基于mappo算法的多飞行器协同制导方法。


技术介绍

1、近年来,高超声速飞行器的快速发展引起了社会各界广泛关注,得益于其航程大、飞行速度快、弹道形式多样且不易预测等优势,在军事应用上具备巨大的发展潜力,美国、俄罗斯、德国、英国等发达国家均实施了多项研究计划,取得了一系列研究成果。然而,面对日益完善的反导防御系统,传统的单飞行器作战已经无法满足复杂战场环境下的作战任务需求,多飞行器协同作战必将成为未来战争中一种典型的作战样式。

2、多飞行器协同是指由多个同构或异构飞行器组成编队,根据任务需要进行时间维度和空间维度上的协同飞行。目前,对于多飞行器协同的研究大多集中于无人机集群协同,而对于高超声速飞行器协同研究相对不足。因此,融合高超声速飞行器的优势,开展多飞行器协同制导的研究,对于提升高超声速飞行器的跨越式发展具有重要意义。


技术实现思路

1、本专利技术解决的技术问题是:克服现有技术的不足,提出一种基于mappo算法的多飞行器协同制导方法。

2、本专利技术解决技术的方案是:

3、一种基于mappo算法的多飞行器协同制导方法,包括:

4、建立多飞行器协同制导模型,所述多飞行器协同制导模型包括各飞行器动力学模型、过程约束模型、终端约束模型、倾侧角幅值约束模型;

5、当剩余飞行航程大于等于500km时,设计基于改进预测校正的协同制导律,求解飞行器攻角与倾侧角制导指令:

6、当剩余航程小于500km时,切换至基于mappo算法的协同制导律,求解飞行器攻角与倾侧角制导指令。

7、优选的,多飞行器中,每个飞行器动力学模型如下:

8、

9、其中,r为飞行器的地心距,θ和φ分别表示飞行器的经度和纬度,v为飞行器速度,γ和ψ分别为飞行器的航迹角和航向角,σ为飞行器倾侧角,m为飞行器质量,g为重力加速度,l和d分别为飞行器的升力和阻力。

10、优选的,每个飞行器的过程约束模型包括热流率约束模型、过载约束模型、动压约束模型、准平衡滑翔条件约束模型;

11、热流率约束模型如下:

12、

13、式中,表示飞行器驻点处热流率;kq为热流率模型系数;为飞行器驻点处最大允许热流率,ρ为飞行器所在高度的大气密度,v为飞行器速度;

14、过载约束模型如下:

15、

16、式中,n为飞行器过载;nmax为最大允许过载;g0为海平面引力加速度,m为飞行器质量,g为重力加速度,l和d分别为飞行器的升力和阻力;

17、动压约束模型如下:

18、

19、式中,q为飞行器动压;qmax为最大允许动压;

20、准平衡滑翔条件约束模型如下:

21、

22、r为飞行器的地心距,σ为飞行器倾侧角。

23、优选的,设计基于改进预测校正的协同制导律,求解飞行器攻角与倾侧角制导指令,方法如下:

24、设计每个飞行器的预设攻角剖面;

25、求解每个飞行器的倾侧角幅值;

26、求解每个飞行器的倾侧角符号。

27、优选的,预设攻角α剖面具体形式如下:

28、

29、式中:αmax为最大攻角;αldmax为最大升阻比对应的攻角;v0为飞行器初始速度;vaoa1和vaoa2分别为分段点处飞行器速度,为中末交班点的理想速度。

30、优选的,求解每个飞行器的倾侧角幅值的方法如下:

31、预测剩余航程误差与时间误差,二者加权求解总体误差,利用割线法得到使得总体误差为零的倾侧角幅值。

32、优选的,求解每个飞行器的倾侧角符号的方法如下:

33、设计每个飞行器的航向角误差走廊,基于剩余飞行时间误差调节走廊宽度,当飞行器航向角误差超过飞行器航向角误差走廊边界时,飞行器倾侧角进行反转,即符号变化,从而确定飞行器倾侧角的符号。

34、优选的,基于mappo算法的协同制导律,具体如下:

35、(1)设计每个飞行器预设攻角剖面;

36、(2)设计每个飞行器的观测量、终端奖励和过程奖励;

37、(3)利用全连接神经网络建立所有飞行器的动作网络和评价网络,并对动作网络进行训练,过程如下:

38、s1、飞行器动作网络根据观测量实时输出飞行器倾侧角指令(包含幅值和符号),同时接收到环境反馈的过程奖励,并将与环境交互的数据储存在经验池中,直到飞行器时刻到达中末交班点,获取到终端奖励;在所有飞行器到达终端位置后,一个学习周期结束,经验池收集数据完成;

39、s2、利用经验池收集的数据采用集中式训练方式对飞行器动作网络进行训练:在训练过程中,从飞行器的经验池数据中随机抽取数据,更新评价网络的参数,并根据评价网络生成的值函数更新动作网络的参数;

40、s3、多次更新迭代后将经验池中的数据清零;

41、s4、返回步骤s1,重新开始新一轮的数据收集和算法训练过程,直至mappo算法收敛,动作网络参数训练完毕;

42、(4)各飞行器采用分布式执行的方式,基于训练获得的动作网络实时输出倾侧角指令,直到飞行器抵达中末交班点。

43、优选的,步骤(1)中,预设攻角α剖面具体形式如下:

44、

45、式中:αmax为最大攻角;αldmax为最大升阻比对应的攻角;v0为飞行器初始速度;vaoa1和vaoa2分别为分段点处飞行器速度;为中末交班点的理想速度。

46、优选的,步骤(2)中,每个飞行器的观测量为其中前六项表示飞行器的状态量;δr=r-rf为当前飞行器高度与终端高度的差值;δv=v-vf表示当前飞行器速度与终端速度的差值;δθ=θ-θf表示当前飞行器经度与终端经度的差值;表示当前飞行器纬度与终端纬度的差值;s为飞行器的剩余航程;为高度变化率。

47、优选的,步骤(2)中,每个飞行器的终端奖励如下:

48、

49、rrgoal为到达终端位置获取的奖励,rrdev表示飞行器到达终端位置时经纬度偏离中末交班点太远的惩罚值。

50、优选的,步骤(2)中,每个飞行器的过程奖励函数包括距离奖励、倾侧角约束奖励、时间约束奖励:

51、距离奖励rrgoto如下:

52、

53、其中,s表示飞行器的剩余航程;r0为地球半径;表示归一化处理;ktogo>0为常数;

54、倾侧角约束奖励rrdiff如下:

55、

56、其中σpre_cor表示预测校正制导产生的倾侧角;σmappo为mappo算法产生的倾侧角;kcomp>0为常数;

57、时间约束奖励rrtime如下:

58、rrtime=-ktime|ttogo-tco本文档来自技高网...

【技术保护点】

1.一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,包括:

2.根据权利要求1所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,多飞行器中,每个飞行器动力学模型如下:

3.根据权利要求1所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,每个飞行器的过程约束模型包括热流率约束模型、过载约束模型、动压约束模型、准平衡滑翔条件约束模型;

4.根据权利要求1所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,设计基于改进预测校正的协同制导律,求解飞行器攻角与倾侧角制导指令,方法如下:

5.根据权利要求4所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,预设攻角α剖面具体形式如下:

6.根据权利要求4所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,求解每个飞行器的倾侧角幅值的方法如下:

7.根据权利要求4所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,求解每个飞行器的倾侧角符号的方法如下:

8.根据权利要求1所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,基于MAPPO算法的协同制导律,具体如下:

9.根据权利要求8所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,步骤(1)中,预设攻角α剖面具体形式如下:

10.根据权利要求8所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,步骤(2)中,每个飞行器的观测量为其中前六项表示飞行器的状态量;Δr=r-rf为当前飞行器高度与终端高度的差值;ΔV=V-Vf表示当前飞行器速度与终端速度的差值;Δθ=θ-θf表示当前飞行器经度与终端经度的差值;表示当前飞行器纬度与终端纬度的差值;S为飞行器的剩余航程;为高度变化率。

11.根据权利要求8所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,步骤(2)中,每个飞行器的终端奖励如下:

12.根据权利要求8所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,步骤(2)中,每个飞行器的过程奖励函数包括距离奖励、倾侧角约束奖励、时间约束奖励:

13.根据权利要求12所述的一种基于MAPPO算法的多飞行器协同制导方法,其特征在于,基于MAPPO算法的协同制导律中,ttogo是通过解析式算出来的飞行器的剩余飞行时间,解析表达式表示如下:

...

【技术特征摘要】

1.一种基于mappo算法的多飞行器协同制导方法,其特征在于,包括:

2.根据权利要求1所述的一种基于mappo算法的多飞行器协同制导方法,其特征在于,多飞行器中,每个飞行器动力学模型如下:

3.根据权利要求1所述的一种基于mappo算法的多飞行器协同制导方法,其特征在于,每个飞行器的过程约束模型包括热流率约束模型、过载约束模型、动压约束模型、准平衡滑翔条件约束模型;

4.根据权利要求1所述的一种基于mappo算法的多飞行器协同制导方法,其特征在于,设计基于改进预测校正的协同制导律,求解飞行器攻角与倾侧角制导指令,方法如下:

5.根据权利要求4所述的一种基于mappo算法的多飞行器协同制导方法,其特征在于,预设攻角α剖面具体形式如下:

6.根据权利要求4所述的一种基于mappo算法的多飞行器协同制导方法,其特征在于,求解每个飞行器的倾侧角幅值的方法如下:

7.根据权利要求4所述的一种基于mappo算法的多飞行器协同制导方法,其特征在于,求解每个飞行器的倾侧角符号的方法如下:

8.根据权利要求1所述的一种基于mappo算法的多飞行器协同制导方法,其特征在于,基于mappo算...

【专利技术属性】
技术研发人员:张旭辉汪韧解春雷马超越曹严刘治东侍野王静轩王敬功韩卫波
申请(专利权)人:中国航天科技创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1