一种求解有约束最优控制问题的双环前向反向扫方法技术

技术编号：42683969 阅读：21 留言：0更新日期：2024-09-10 12:32

本发明专利技术涉及一种求解有约束最优控制问题的双环前向反向扫方法，属于无人系统技术领域，具体涉及一种基于最小必要条件的双环前向反向扫方法，求解由路径规划转换成的有约束非线性最优控制问题，是一种无人系统最优路径的规划方法。从最优控制问题出发提出最小必要条件，并根据最小必要条件将最优控制问题划分为四种类型，提出的双环前向反向扫方法分为内外环，外环置信区间算法用于处理最优控制问题划分的四种类型；内环带有Anderson加速的FBSM的算法替换了变分法得到的必要条件，使最优解的全局性得到体现。与现有方法相比，提出的双环前向反向扫方法能更快获得最优解，处理更多的约束问题，使无人系统获得满足动力学可行的最优路径。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种求解有约束最优控制问题的双环前向反向扫方法，属于无人系统，具体涉及一种基于最小必要条件的双环前向反向扫方法，求解由路径规划转换成的有约束非线性最优控制问题，是一种无人系统最优路径的规划方法。

技术介绍

1、无人系统是以下系统的统称，无人飞行器、无人车辆、无人舰船等智能化无人系统。在日常生活、生产和军事等各个方面无人系统都有相应的应用。至今无人系统的路径规划仍然是一个需要研究的课题，将无人系统路径规划看作最优控制问题，使用最优控制的求解方法进行求解，使得问题变得简单和容易。

2、最优控制是一种实现性能指标最优的有效控制方案，现已被广泛应用于物理、经济、工程、生物和其他的科学领域。随着研究不断的深入和应用领域的不断扩大，问题模型向复杂化、约束形式向多样化方向发展，使问题很难得到解析解，而非线性最优控制问题的数值解是对问题真实解的一种数值近似，一定程度能无限逼近真实解，这成为一些无法得到闭环解析解问题的理想解决方案。

3、非线性最优控制的数值求解方法逐渐形成三大类：动态规划、直接法和间接法。与其他两种方法相比，间接法具有灵活度高、收敛性快等特点。前向反向扫方法(简称fbsm)隶属于间接法，它的提出有效降低了对初值的高敏感度，并对算法的收敛性给予了理论证明。但还存在着一些缺点，例如随着约束的多样化缺少必要条件的解析表达，控制量更新仍然使用无约束控制的必要条件，这使得问题往往会陷入局部极值。

技术实现思路

1、本专利技术的技术解决问题是：克服现有技术

2、本专利技术的技术解决方案是：

3、一种无人系统最优路径的规划方法，该方法的步骤包括：

4、步骤1，将无人系统的路径规划问题表示成一个有约束非线性最优控制问题a，最优控制问题a为：

5、

6、其中，是无人系统的状态，n是状态维数，是无人系统的有界控制量，r是控制量维数，t0是初始时刻，tf是终端时刻，t∈[t0,tf]是时间区间内的某一时刻，是无人系统初始状态、终端状态和终端时间组成的向量，是控制量组成的任意集合，是状态x和控制u组成的开集合，q是等式的个数，m为不等式的个数，min是使代价函数最小；

7、并且最优控制问题a满足下面条件：

8、i)函数f(x,u)在内取值并在集合内是lipschitz连续，其一阶导数ft和fx在集合内也是lipschitz连续；

9、ii)函数ηj和在集合内连续可导；

10、步骤2，构建最优控制问题a的lagrange乘子函数j；

11、

12、其中，动力学等式满足φ(x(t0),x(tf),tf)是终端代价函数，l(x(t),u(t))是运行代价函数，α0,...,αm，β1,...,βq分别是lagrange乘子，m1是不等式在初始时刻的个数，m是不等式的总个数，q2是等式在初始时刻的个数，q是等式的总个数，0＜q1≤q2≤q3＜q，ηj(p)＝0(j＝q1,…,q3)是状态常值的等式约束，例如x(tf)＝xf，xf是终端状态常值，ηj(p)＝0(j＝1,...,q1-1,q3+1...,q)是其他类型的等式约束；

13、步骤3，从一般类的有约束非线性最优控制问题得出最小必要条件的解析表达式，在这之前需要确保解的存在，上面的lagrange乘子函数j满足下面条件：

14、i)这里存在kl＜∞和1≤γφ＜∞满足

15、ii)这里存在kl＜∞和1≤γl＜∞满足和|l(x1,u1)-l(x2,u2)|≤kl(‖x1-x2‖+‖u1-u2‖)；

16、其中和是至少nφ和nl阶可导，为正实数。

17、步骤4，获得有约束最优控制问题的最小必要条件，具体方法为：

18、一个最优过程w0＝(x0(t),u0(t))让问题a最小，这时存在一个集合λ＝(α,β,c,ψ(t))，α＝[α0,α1,...,αm]t≥0，ψ(t)在[t0,tf]上是n维lipschitz函数，哈密尔顿函数为h(ψ,x,u)＝l(x,u)+ψt(t)f(x,u)，终端代价函数为被违反的不等式约束为i＝1,...,m，其他类型等式约束为为其他类型等式约束的下标，状态常值的等式约束为ηj(p)＝0，j＝q1,…,q3为状态常值等式约束的下标，p＝(x(t0),x(tf),tf)，那么下面条件成立：

19、a)非平凡条件(α,β)≠(0,0)；

20、b)终端不等式和等式约束：进行数值迭代；

21、和

22、满足和公式中d是迭代次数，标量μ是正步长；

23、c)状态和协状态等式，

24、

25、d)横截端条件，

26、和

27、e)时不变系统哈密尔顿函数的常值性，t∈[t0,tf]，

28、

29、时变系统末端哈密尔顿函数值

30、f)最小值条件

31、

32、公式中

33、步骤5，根据上方得到的边界条件和终端约束，将问题a划分为四种类型，如表1所示。

34、表1

35、

36、

37、其中tf是终端时间，x0是无人系统初始时刻的状态，xf是无人系统终端时刻的状态，ψ(tf)是终端时刻的协状态，是终端代价函数关于终端状态的偏导数，h(·,tf)是末端哈密尔顿函数值，是终端代价函数关于终端时间tf的偏导数；

38、步骤6，问题a的四种类型对应着四种不同形式的横截断条件和末端哈密尔顿函数值，相应的问题a四种类型数值求解难度也不相同。由于加入了时间的可调整项和引入了哈密尔顿等式和时间的约束，类型3和类型4的数值求解难度增加。为了能求解问题a的四种不同类型，本专利技术提出一种双环前向反向扫的算法。

39、双环前向反向扫算法有内环和外环组成，内外环分别负责不同的工作.内环算法以末端协状态ψ(tf)和末端时间作tf为初始值，数值求解得到一条最优的控制轨迹；外环算法以终端状态x(tf)和哈密尔顿函数h(·,tf)与它们给定值作差(即使用两个差值)构造最优问题的代价函数；终端协状态ψ(tf)和终端时间tf是代价函数的独立变量；找到使代价函数最小的终端协状态ψ(tf)和终端时间tf；

40、内环算法和外环算法的数值求解过程分别见步骤7和8：

41、步骤7，设计内环数值算法。在内环中，本专利技术提出一种带有anderson加速的fbsm算法，由外环算法提供的终端协状态ψ(tf)和终端时间tf作为初始值去数值求解一条最优轨迹。具体步骤为：

42、步骤7.1：设置初始化控制误差ξ1，0<ξ1＜＜1，初始迭代k＝0，最大迭代kmax，在anders本文档来自技高网...

【技术保护点】

1.一种无人系统最优路径的规划方法，其特征在于该方法的步骤包括：

2.根据权利要求1所述的一种无人系统最优路径的规划方法，其特征在于：

3.根据权利要求2所述的一种无人系统最优路径的规划方法，其特征在于：

4.根据权利要求3所述的一种无人系统最优路径的规划方法，其特征在于：

5.根据权利要求4所述的一种无人系统最优路径的规划方法，其特征在于：

6.根据权利要求5所述的一种无人系统最优路径的规划方法，其特征在于：

7.根据权利要求6所述的一种无人系统最优路径的规划方法，其特征在于：

【技术特征摘要】

1.一种无人系统最优路径的规划方法，其特征在于该方法的步骤包括：

2.根据权利要求1所述的一种无人系统最优路径的规划方法，其特征在于：

3.根据权利要求2所述的一种无人系统最优路径的规划方法，其特征在于：

4.根据权利要求3所述的一种无人系统...

【专利技术属性】
技术研发人员：孙健，鲁科冰，李卓，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人