System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于PPO-Clip的四旋翼无人机吊挂抗摆控制方法技术_技高网

一种基于PPO-Clip的四旋翼无人机吊挂抗摆控制方法技术

技术编号:44453877 阅读:0 留言:0更新日期:2025-02-28 18:59
本发明专利技术属于深度强化学习以及自动化控制领域,尤其为一种基于PPO‑Clip的四旋翼无人机吊挂抗摆控制方法。本发明专利技术包括以下步骤:1)基于牛顿‑欧拉以及欧拉‑拉格朗日方法建立吊挂无人机系统数学模型;2)根据系统模型设计Backstepping‑PID控制器对无人机进行位姿控制;3)构建基于近端策略优化算法(PPO‑Clip)的深度强化学习框架,包括无人机经验序列的采样,奖励函数设计以及智能体训练等过程。本发明专利技术,通过设计基于PPO‑Clip算法的四旋翼无人机吊挂抗摆控制系统,设计合理的奖励函数引导无人机调整自身位置与姿态,使吊挂无人机在保证载荷短时间内停摆或收敛的条件下较高精度跟踪期望轨迹,从而提高四旋翼吊挂无人机的轨迹跟踪性能、载荷抗摆性能以及抗干扰性等性能。

【技术实现步骤摘要】

本专利技术涉及强化学习、自动控制领域,具体涉及到一种吊挂无人机飞行控制以及载荷抗摆控制方法。


技术介绍

1、旋翼吊挂无人机因其灵活性强,低风险且不受地理环境限制等优势广泛应用于物流运输、农业植保、救援减灾等领域。但由于无人机与吊挂载荷之间的动态耦合特性增加了系统的控制难度,不仅导致无人机位置控制精度下降,其载荷摆动还会严重威胁无人机的飞行安全,因此如何提高吊挂无人机系统的稳定性以及安全性是国内外研究的重要方向之一。

2、目前应用在吊挂无人机飞行上的传统抗摆控制方法多数都依赖于精确的数学模型参数,在面对不同的跟踪目标或是在复杂飞行环境中受到干扰时,载荷会因此产生较大的摆动,严重影响了无人机的轨迹跟踪性能以及稳定性,此时传统控制方法可能需要频繁的进行参数调整,从而导致控制性能下降。而强化学习因其能够实现高效、精准的自主决策与控制被广泛应用于无人机控制领域,但目前传统强化学习算法多为on-policy(在线策略),在样本利用率上不够高效,训练中还可能出现大幅度策略更新,导致无人机稳定性降低,如何利用强化学习使吊挂无人机快速适应跟踪目标与复杂环境的同时抑制载荷摆动的控制方法鲜有报道。


技术实现思路

1、本专利技术的目的是提供一种四旋翼无人机吊挂抗摆控制方法,通过ppo-clip算法训练actor-critic神经网络,利用剪切函数限制强化学习策略的更新幅度,避免在训练过程中出现策略的大幅度波动,使得无人机可以更加平滑地调整位置,最后通过优化策略网络输出控制动作来修正当前无人机的位置与姿态,该方法可以有效提高吊挂无人机的稳定性并抑制吊挂载荷的摆动。

2、为了实现上述目的,本专利技术采用如下技术方案:

3、一种基于ppo-clip的四旋翼无人机吊挂抗摆控制技术,其特征在于,设计backstepping-pid控制器调节无人机的位置和姿态,为强化学习提供稳定的训练条件。设计基于ppo-clip算法的吊挂无人机控制框架,引入新旧策略的概率比衡量策略变化,并利用剪切函数来限制策略更新的幅度,构造基于ppo-clip的四旋翼无人机吊挂载荷抗摆控制系统,包括以下步骤:

4、s1:通过建立惯性坐标系和机体坐标系对无人机的位置和姿态进行描述,在此基础上,忽略绳子质量以及空气阻力对无人机吊挂系统的影响,基于牛顿-欧拉和欧拉-拉格朗日建立四旋翼无人机吊挂系统数学模型。

5、s2:根据四旋翼无人机非线性、欠驱动、强耦合的特点,外环位置控制采用backstepping(反步法)控制器,内环姿态控制采用pid控制器。

6、s3:利用ppo-clip算法训练神经网络并不断更新优化策略网络参数θ和价值网络参数φ,根据优化的策略对吊挂无人机的输入轨迹进行修正。

7、s4:设定无人机的期望位置和期望偏航角,并在飞行过程中对载荷施加干扰,验证方法的抗扰能力。

8、综上所述,由于采用了上述技术方案,本专利技术的有益效果是:

9、经过算法轨迹修正后无人机跟踪轨迹更加平滑,跟踪速度更快,在无人机起飞阶段能够快速抑制载荷摆动,或是在跟踪弧形轨迹时能够使载荷迅速收敛至球面摆状态,并且在载荷受到干扰时无人机可以通过自主调整位置,减小载荷摆动频率以及载荷摆动对无人机稳定性的影响。

本文档来自技高网...

【技术保护点】

1.一种基于PPO-Clip的四旋翼无人机吊挂抗摆控制方法,其特征在于:基于Backstepping-PID控制技术设计无人机飞行控制系统,通过PPO-Clip算法训练actor-critic神经网络,利用算法中的剪切函数限制强化学习策略的更新幅度,最后通过调节无人机四个旋翼的升力,对无人机输入轨迹进行修正,形成闭环飞行控制系统,提高无人机轨迹跟踪性能的同时抑制吊挂载荷的摆动。

2.根据权利要求1所述的一种基于PPO-Clip的四旋翼无人机吊挂抗摆控制方法,其特征在于,基于牛顿-欧拉和欧拉-拉格朗日方法建立四旋翼吊挂无人机的八自由度非线性系统模型,设计一种以姿态为内环,抗摆,位置为外环的闭环控制系统。

3.根据权利要求2所述的一种基于PPO-Clip的四旋翼无人机吊挂抗摆控制方法,其特征在于,四旋翼吊挂无人机系统建模如下:

4.根据权利要求3所述的一种基于PPO-Clip的四旋翼无人机吊挂抗摆控制方法,其特征在于,设计Backstepping-PID控制器,建立基于PPO-Clip算法的吊挂无人机强化学习框架,观测无人机的状态,训练神经网络并更新策略网络和值函数网络的参数,设计基于PPO-Clip算法的四旋翼吊挂无人机闭环飞行控制系统,设计步骤如下:

5.根据权利要求4所述的一种基于PPO-Clip的四旋翼无人机吊挂抗摆控制方法,其特征在于,利用Backstepping-PID控制器调整无人机的位姿,再根据PPO-Clip算法优化后的修正策略对输入轨迹进行修正,步骤为:

...

【技术特征摘要】

1.一种基于ppo-clip的四旋翼无人机吊挂抗摆控制方法,其特征在于:基于backstepping-pid控制技术设计无人机飞行控制系统,通过ppo-clip算法训练actor-critic神经网络,利用算法中的剪切函数限制强化学习策略的更新幅度,最后通过调节无人机四个旋翼的升力,对无人机输入轨迹进行修正,形成闭环飞行控制系统,提高无人机轨迹跟踪性能的同时抑制吊挂载荷的摆动。

2.根据权利要求1所述的一种基于ppo-clip的四旋翼无人机吊挂抗摆控制方法,其特征在于,基于牛顿-欧拉和欧拉-拉格朗日方法建立四旋翼吊挂无人机的八自由度非线性系统模型,设计一种以姿态为内环,抗摆,位置为外环的闭环控制系统。

3.根据权利要求2所述的一种基于pp...

【专利技术属性】
技术研发人员:杜昊郭玉英邱桦霖
申请(专利权)人:西南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1