一种面向LQR抵近策略的控制律识别方法技术

技术编号：43249943 阅读：9 留言：0更新日期：2024-11-08 20:34

本发明专利技术公开了一种面向LQR抵近策略的控制律识别方法，属于航天器技术领域。方法包括基于非合作目标采用线性二次型控制构建最大似然估计模型；对最大似然估计模型进行优化，获取最优的控制系数估计值；根据最优的控制系数估计值，得到非合作目标的控制增益矩阵；根据非合作目标的控制增益矩阵，对非合作目标进行控制策略识别。本发明专利技术能够适应不同类型的非合作目标行为，提高了对非合作目标控制策略的准确性，保证交会任务的执行效率和安全性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及航天器，具体涉及一种面向lqr(linear quadraticregulator，线性二次型调节器)抵近策略的控制律识别方法。

技术介绍

1、随着航天器技术的不断发展和应用的广泛推广，航天器交会任务已成为航天领域的重要研究课题。在航天器交会任务中，与合作目标相比，非合作目标的控制策略常常是未知的，因此对非合作目标的行为进行准确识别和控制至关重要。

2、目前，传统的控制策略反演方法往往需要事先了解非合作目标的控制方式或采用模型预测等方法，这对于实际应用中未知非合作目标的情况下存在一定的局限性。因此，研究一种能够从观测数据中推断非合作目标控制策略的方法具有重要意义。wang等针对不完全信息条件下空间非合作目标追逃对策的最优控制问题，提出了一种将未知目标机动作为有色噪声处理的方法，将对策退化为强跟踪问题。尽管该方法能够处理未知目标机动，但其性能可能受到初始化参数的影响。不恰当的初始化参数可能导致算法收敛速度慢或无法收敛到最优解。并且，该方法将未知目标机动视为有色噪声，需要准确了解噪声的统计特性。如果噪声特性与实际情况不符，可能导致控制策略推断不准确。zhu等人将无迹卡尔曼滤波(ukf)的方法引入到航天器追逃中，估计支付函数中的权值参数，实时计算出最优的追踪控制律。ukf同样受到初始化参数的影响，不恰当的初始化可能导致滤波器性能下降或发散。同时，ukf虽然能够处理非高斯噪声，但如果噪声特性复杂或未知，可能导致状态估计不准确。而且，ukf的计算复杂度相对较高，特别是在处理高维状态空间和复杂模型时。这限制了其在实

3、然而受限于上述研究所采用的滤波算法容易受到初始化调参、噪声特性和计算复杂度等方面的限制和挑战，导致在实际航天器交会任务中，对非合作目标的控制策略识别和应对能力不高，最终直接影响交会任务的执行效率和安全性。

技术实现思路

1、针对现有技术中存在的在航天器交会任务中，由于对非合作目标的控制策略识别和应对能力不高，影响交会任务的执行效率和安全性的问题。本专利技术提供了一种面向lqr抵近策略的控制律识别方法，能够适应不同类型的非合作目标行为，提高了对非合作目标控制策略的准确性，保证交会任务的执行效率和安全性。

2、为达到上述目的，本专利技术采用了以下技术方案：

3、第一方面，本专利技术提供一种面向lqr抵近策略的控制律识别方法，包括：

4、基于非合作目标采用线性二次型控制构建最大似然估计模型；

5、对最大似然估计模型进行优化，获取最优的控制系数估计值；

6、根据最优的控制系数估计值，得到非合作目标的控制增益矩阵；

7、根据非合作目标的控制增益矩阵，对非合作目标进行控制策略识别。

8、作为本专利技术的进一步改进，所述基于非合作目标采用线性二次型控制构建最大似然估计模型，包括：

9、获取非合作目标的观测数据；

10、假设非合作目标采用线性二次型控制下的控制系数矩阵形式；

11、根据非合作目标的观测数据及控制系数矩阵形式，构建基于轨迹差的最大似然估计模型。

12、作为本专利技术的进一步改进，所述假设非合作目标采用线性二次型控制下的控制系数矩阵形式，包括：

13、在近圆轨道下，将控制量引入c-w方程，得到相对运动控制方程:

14、

15、选取空间状态控制量u＝[ux,uy,uz]t，则可得到相对运动控制方程的状态空间模型其中：

16、

17、已知威胁目标的线性状态方程，假设控制u(t)不受约束，在考虑控制过程中的平稳性、快速性、精确性以及能量消耗的情况下，可以取二次型性能指标为：

18、

19、其中，q和r为相应的权值矩阵，并且q为半正定对称矩阵，r为正定对称矩阵；

20、采用最小值原理求解，列写哈密尔顿函数：

21、

22、假设控制不受约束，控制方程满足：

23、

24、推导得u*(t)＝-r-1(t)·bt·λ*(t)

25、因为哈密尔顿函数的正则方程是线性的，而且横截条件中λ*(tf)和x*(t)存在线性关系，做出假设：任何时刻λ和x都存在线性关系：

26、λ*(t)＝p(t)·x*(t)

27、式中，p(t)是一个对称矩阵；

28、于是，存在矩阵黎卡提微分方程如下：

29、

30、由微分方程解得p(t)后，可以得到最优控制律为：

31、u*(t)＝-r-1(t)·bt·p(t)·x*(t)。

32、作为本专利技术的进一步改进，所述最大似然估计模型包括：

33、输入观测数序列个数为n的天基观测序列，采用最大似然估计来进行非合作目标连续控制策略反演，并使用观测数据来估计非合作目标控制系数，以使的估计得到的状态推演轨迹与观测的轨迹一致，从而估计得到的状态推演轨迹数据与观测的轨迹数据的均方误差最小化。

34、作为本专利技术的进一步改进，所述策略反演的流程如下：

35、当非合作目标采取lqr控制时，其权值矩阵k＝riccati(q,r)具有以下形式：

36、

37、式中，和为对非合作目标控制系数矩阵的估计，仅需要对非合作目标控制系数qr，qv和r进行估计，估计值记为和即可完成策略反演。

38、作为本专利技术的进一步改进，所述对最大似然估计模型进行优化，获取最优的控制系数估计值，包括：

39、基于遗传算法对最大似然估计模型进行优化，得到最优的控制系数估计值；

40、利用得到的非合作目标控制系数估计值，从而得到非合作目标的控制增益矩阵；

41、非合作目标的控制增益矩阵的系数计算过程如下：

42、采用如下相关系数来描述控制增益矩阵和k的相关程度，其中两个矩阵的相似度，越相似越接近1：

43、

44、其中，

45、根据非合作目标的控制增益矩阵，对非合作目标进行控制策略识别。

46、第二方面，本专利技术提供一种面向lqr抵近策略的控制律识别系统包括：

47、估计模型模块：用于基于非合作目标采用线性二次型控制构建最大似然估计模型；

48、最优估计模块：用于对最大似然估计模型进行优化，获取最优的控制系数估计值；

49、控制矩阵模块：用于根据最优的控制系数估计值，得到非合作目标的控制增益矩阵；

50、策略识别模块：用于根据非合作目标的控制增益矩阵，对非合作目标进行控制策略识别。

51、第三方面，本专利技术提供一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述本文档来自技高网...

【技术保护点】

1.一种面向LQR抵近策略的控制律识别方法，其特征在于，包括：

2.根据权利要求1所述的一种面向LQR抵近策略的控制律识别方法，其特征在于，所述基于非合作目标采用线性二次型控制构建最大似然估计模型，包括：

3.根据权利要求2所述的一种面向LQR抵近策略的控制律识别方法，其特征在于，所述假设非合作目标采用线性二次型控制下的控制系数矩阵形式，包括：

4.根据权利要求1所述的一种面向LQR抵近策略的控制律识别方法，其特征在于，所述最大似然估计模型包括：

5.根据权利要求4所述的一种面向LQR抵近策略的控制律识别方法，其特征在于，所述策略反演的流程如下：

6.根据权利要求1所述的一种面向LQR抵近策略的控制律识别方法，其特征在于，所述对最大似然估计模型进行优化，获取最优的控制系数估计值，包括：

7.一种面向LQR抵近策略的控制律识别系统，其特征在于，包括：

8.一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现权利要求1-6任一项所

9.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-6任一项所述一种面向LQR抵近策略的控制律识别方法的步骤。

10.一种计算机程序产品，其特征在于，包括计算机指令，该计算机指令被处理器执行时实现如权利要求1-6任一项所述一种面向LQR抵近策略的控制律识别方法的步骤。

...

【技术特征摘要】

1.一种面向lqr抵近策略的控制律识别方法，其特征在于，包括：

2.根据权利要求1所述的一种面向lqr抵近策略的控制律识别方法，其特征在于，所述基于非合作目标采用线性二次型控制构建最大似然估计模型，包括：

3.根据权利要求2所述的一种面向lqr抵近策略的控制律识别方法，其特征在于，所述假设非合作目标采用线性二次型控制下的控制系数矩阵形式，包括：

4.根据权利要求1所述的一种面向lqr抵近策略的控制律识别方法，其特征在于，所述最大似然估计模型包括：

5.根据权利要求4所述的一种面向lqr抵近策略的控制律识别方法，其特征在于，所述策略反演的流程如下：

6.根据权利要求1所述的一种面向lqr抵近策略的控制律识别方法，其特征在于，所述对最...

【专利技术属性】
技术研发人员：党朝辉，侯卓君，宝音贺西，叶东，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人