一种基于强化学习的飞机大迎角失速改出方法技术

技术编号：37047319 阅读：30 留言：0更新日期：2023-03-29 19:25

本发明专利技术属于人工智能技术领域，涉及一种基于强化学习的飞机大迎角失速改出方法。本发明专利技术在TD3算法基础上，采用一种更加贴合飞机失速场景实际的奖励函数，在仿真模拟器环境中，根据强化学习算法要素，构建强化学习交互环境，同时使用一种基于混合模型的奖励机制，在强化学习交互环境中，强化学习算法通过与仿真模拟环境进行交互，完成训练，将得到的模型参数固化，形成失速改出算法模型；实现了效果良好的失速改出控制。本发明专利技术是以强化学习算法为手段，通过改进强化学习算法(TD3)，面向飞机失速改出场景进行相关参数、模型的设计，以实现仿真环境下飞机失速改出方法的智能化，提高改出效率。效率。效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于强化学习的飞机大迎角失速改出方法

[0001]本专利技术属于人工智能
，涉及一种基于强化学习的飞机大迎角失速改出方法。

技术介绍

[0002]在飞机以一定速度飞行过程中，飞机迎角超过临界迎角时，飞机升力系数下降，升力与重力不能平衡，飞机可能发生失速。飞机失速可能导致危险发生，甚至导致致命事故。给飞行带来严重隐患。长期以来，飞机失速改出问题一直是航空安全领域攻克的主要方向，在现代飞机中，采用了许多方法改出失速，最大限度保障人员安全。
[0003]失速改出与诸多因素相关，失速改出非常复杂。波音737Max客机安装了防止失速的装置MCAS(Manuever Characteristics Augumentation System)。MCAS在飞机处于自动驾驶，且襟翼收上，机组没有给出安定面配平指令的情况下，此时迎角超过临界迎角时将激活MCAS。临界迎角是基于空速和高度计算得出。MCAS输出使得飞机低头的安定面配平指令，以高速模式控制安定面，增强俯仰操纵系统。同时，MCAS启动后，配平指令将旁通停止驾驶杆指令，直接送到配平限制电门。因此，即使拉杆无法切断MCAS发出的机头向下配平的信号。
[0004]除了波音737Max之外，还有空客的客机也安装了迎角保护装置。在大迎角的情况下指令飞机下俯。如果此时飞机迎角探测器发生故障，不能给飞机迎角减小的信号造成飞机控制计算机认为没有达到指令的效果，从而进一步指令飞机下俯，最终导致飞机进入持续下俯，最终发生致命事故。
[0005]由于飞机失速的复杂性...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的飞机大迎角失速改出方法，其特征在于，包括以下步骤：S1、在仿真模拟器环境中，根据强化学习算法要素，构建强化学习交互环境，包括输入算法的状态参数空间和动作空间；S2、搭建用于失速改出的强化学习算法框架：奖励函数和基于混合模型的奖励机制；S3、在强化学习交互环境中，强化学习算法通过与仿真模拟环境进行交互，完成训练，将得到的模型参数固化，形成失速改出算法模型；S4、在仿真模拟飞行中，当出现失速现象时，将状态参数输入失速改出算法模型，经通信交互将得到的动作指令输出，由模拟器执行，逐渐实现失速改出。2.根据权利要求1所述的基于强化学习的飞机大迎角失速改出方法，其特征在于，所述S1状态参数空间包括仿真模拟器攻角、俯仰角、偏航角、滚转角、俯仰角速率、偏航角速率。3.根据权利要求1所述的基于强化学习的飞机大迎角失速改出方法，其特征在于，所述S1算法输出的动作空间包括升降舵、方向舵、油门舵面操作数据。4.根据权利要求1所述的强化学习的飞机大迎角失速改出方法，其特征在于，所述S2奖励函数为一系列与状态变量有关的函数，每个状态分量相关的奖励值由局部分量与全局分量加权构成。5.根据权利要求4所述的强化学习的飞机大迎角失速改出方法，其特征在于，所述状态变量为攻角、俯仰角、偏航角、滚转角、俯仰角速率、偏航角速率。6.根据权利要求4所述的强化学习的飞机大迎角失速改出方法，其特征在于，奖励函数形式如下：Reward＝γReward
global
+(1
‑
γ)Reward
local
每个状态分量相关的奖励值由局部分量与全局分量加权得到，权重γ决定了在此次计算中全局分量与局部分量的重要程度，其中，全局分量的计算构成为：其中函数变量state
t
表示智能体当前该状态分量的值，系数stat
etarget
表示智能体该状态分量的目标值，k为放缩系数，ε为函数斜率缩放系数，通过调整它的大小，可...

【专利技术属性】
技术研发人员：王君秋，邢晨光，王经纬，谭健美，
申请(专利权)人：中国航空研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人