一种基于RVO策略和最优控制算法的混合型多智能体协同路径规划方法技术

技术编号:32001634 阅读:11 留言:0更新日期:2022-01-22 18:17
一种基于RVO策略和最优控制算法的混合型多智能体协同路径规划方法,属于自动化与控制技术领域。首先,根据待规划的智能体个数来确定参与规划的智能体数量,初始化各个智能体对应的初始和终端状态。其次,初始化协同路径规划过程中的计算步长,RVO策略与最优控制算法切换的阈值参数d。最后,依次检测各智能体当前位置与对应终端位置之间的距离与阈值d之间的关系:若智能体当前位置与对应终端位置之间的距离大于阈值d,采用RVO策略对该智能体进行轨迹规划;若距离小于或等于阈值d,采用最优控制算法对该智能体进行路径规划。本发明专利技术能够高精度的进行多智能体在线协同路径规划,所得到的结果能够严格符合终端约束要求,实现计算效率和精度之间的理想平衡。和精度之间的理想平衡。和精度之间的理想平衡。

【技术实现步骤摘要】
一种基于RVO策略和最优控制算法的混合型多智能体协同路径规划方法


[0001]本专利技术属于多智能体协同路径规划的自动化与控制
,涉及一种基于RVO(RVO: Reciprocal Velocity Obstacle)策略和最优控制算法的混合型多智能体协同路径规划方法。

技术介绍

[0002]多智能体协同路径规划是在保持相应约束,并使各个智能体在不与障碍物碰撞的情况下, 寻找一条从初始状态到终端状态的可行轨迹。较单个智能体的路径规划问题而言,多智能体 的协同路径规划问题存在的难点在于:
[0003](1)除了单个智能体路径规划过程中需要考虑的约束外,还需考虑不同智能体之间的避 碰约束,且随着智能体数量的增多,额外增加的避碰约束数量将急剧增加,其求解空间的维 度更高,从而使得求解难度更大、更复杂。
[0004](2)难以同时满足各个智能体的终端约束,即难以使得各个智能体均以要求的角度精确 到达各自的终端位置。
[0005]目前,对于多智能体的协同路径规划问题主要集中在无人机(UAV)和无人车(USV) 等领域,其中应用最广泛的方法有人工势场法、数学规划、人工智能算法、RVO策略、最优 控制方法、基于网格建模方法和基于优先级的协同策略等。上述方法可应用于多智能体的协 同路径规划问题,但难以在计算效率和精度之间达到理想的平衡。如基于数学规划、最优控 制方法等,虽然精度可以满足要求,但计算效率较低;人工势场法、RVO策略等,虽然计算 效率较高,但精度较低,尤其是难以使智能体精确到达终端位置。而在某些场景中,对智能 体的终端约束有严格的要求,即要求智能体能以预定的角度精确地到达终点,但除了最优控 制方法外,上述方法均难以满足这样严苛的终端约束。
[0006]综上所述,目前,工程应用上迫切需要一种能兼顾计算精度和效率的、具有良好适用性 的多智能体的协同路径规划方法。

技术实现思路

[0007]为了解决多智能体协同路径规划方法难以兼顾计算效率和精度的问题,本专利技术结合RVO 策略和最优控制算法提出一种多智能体协同路径规划方法,该多智能体协同路径规划方法计 算效率高,能够实现在线协同路径规划,且规划结果能够严格满足各个智能体终端约束多智 能体。
[0008]为了达到上述目的,本专利技术采用的技术方案为:
[0009]一种基于RVO策略和最优控制算法的混合型多智能体协同路径规划方法,包括以下步骤:
[0010]步骤1:根据待规划的智能体个数来确定参与规划的智能体数量M(M∈N
+
),初始化 各个智能体对应的初始和终端状态,如初始和终端处的位置、角度、速度等。对于第i(i∈N
+
) 个智能体,其初始状态记为终端状态记为
[0011]步骤2:初始化协同路径规划过程中的计算步长δT,以及RVO策略与最优控制算法切 换的阈值参数d(d≥0)。
[0012]步骤3:依次检测各智能体当前位置与对应终端位置之间的距离与阈值d之间的关系, 从而判断是采用RVO策略,还是采用最优控制算法对智能体进行路径规划。具体如下:
[0013]步骤3

1:初始化时间迭代次数k,令k=1;初始化RVO策略和最优控制算法切换次数j, 令j=0。
[0014]步骤3

2:在[t0+(k

1)δT,t0+kδT]内,初始化智能体序号i,令i=1,其中,t0表示 起始时间。
[0015]步骤3

3:检测智能体i当前位置与对应终端位置之间的距离。
[0016]对于智能体i,将智能体i采用圆心为其几何中心位置 半径R的特征圆进行描述,计算智能体i在 t0+(k

1)δT时刻的位置与对应终端位置之间的距离S
i
(t0+(k

1)δT),具体计算方 法为:
[0017][0018]其中,分别表示描述智能体i特征圆圆心的横纵标和纵坐标;分别表示智能体i 终端位置的横纵标和纵坐标。
[0019]步骤3

4:若智能体i当前位置与对应终端位置之间的距离S
i
(t0+(k

1)δT)大于阈值d, 则采用RVO策略对智能体i进行轨迹规划,并存储其轨迹、时间数据。若智能体i当前位置 与对应终端位置之间的距离S
i
(t0+(k

1)δT)小于或等于阈值d,则转入步骤3

5,采用最优 控制算法对智能体进行路径规划。步骤3

5:将该智能体i当前时刻的状态(包括位置、角度、 速度)作为初始边界条件X
i
(t0+(k

1)δT),确定各个智能体的运动学、控制、状态约束条件。
[0020]对于第i个智能体,令其状态空间为x
i
、控制变量为u
i
,建立该智能体的运动学方程:
[0021][0022]其中,t为时间变量。
[0023]对于第i个智能体,将该智能体对状态变量和控制变量施加的约束表示为如下不等式形式:
[0024]C(X
i
,U
i
,t)≤0
ꢀꢀꢀꢀꢀꢀ
(3)
[0025]步骤3

6:建立智能体i轨迹规划的最优控制模型
[0026]根据公式(1)、(2),建立如下智能体i轨迹规划的最优控制模型:
[0027][0028]其中,w为终端时间权重因子;t
f
表示末端时间。
[0029]步骤3

7:求解最优控制模型
[0030]根据公式(4),采用最优控制算法对其进行求解,优化得出最小末端时间及对应的路径数 据,并在接下来的时间步长内将其视为按照由最优控制算法所得到路径运动的动态障碍物。 同时,令j=j+1。
[0031]步骤4:若j<M,且i<M

j,i=i+1,返回步骤3

3;若j<M,且i≥M

j,令k=k+1, 转入步骤3

2;若j≥M,退出并输出每个智能体基于RVO策略和最优控制算法得到的轨迹。
[0032]进一步的,所述步骤3

4中所述的最优控制算法包括伪谱法、保辛伪谱算法等。
[0033]相对于现有技术,本专利技术有益效果为:
[0034]本专利技术能以更高的精度和效率在线的进行多智能体的协同路径规划,所得到的结果可严 格符合终端约束要求,从而实现计算效率和精度之间的理想平衡。所得结论可直接应用于工 程实际,具有更好的工程许用性,且具有很强的可操作性和可行性,便于实际应用。
附图说明
[0035]图1为本专利技术的整体思路图。
[0036]图2为本专利技术的4个智能体的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于RVO策略和最优控制算法的混合型多智能体协同路径规划方法,其特征在于,包括以下步骤:步骤1:根据待规划的智能体个数确定参与规划的智能体数量M,其中M∈N
+
,初始化各个智能体对应的初始状态和终端状态;对于第i个智能体,其初始状态记为终端状态记为其中i∈N
+
;步骤2:初始化协同路径规划过程中的计算步长δT,以及RVO策略与最优控制算法切换的阈值参数d,其中d≥0;步骤3:依次检测各智能体当前位置与对应终端位置之间的距离与阈值d之间的关系,判断是采用RVO策略,还是采用最优控制算法对智能体进行路径规划,具体如下:步骤3

1:初始化时间迭代次数k,令k=1;初始化RVO策略和最优控制算法切换次数j,令j=0;步骤3

2:在[t0+(k

1)δT,t0+kδT]内,初始化智能体序号i,令i=1,其中,t0表示起始时间;步骤3

3:检测智能体i当前位置与对应终端位置之间的距离;对于智能体i,将智能体i采用圆心为其几何中心位置半径R的特征圆进行描述,计算智能体i在t0+(k

1)δT时刻的位置与对应终端位置之间的距离S
i
(t0+(k

1)δT),具体计算方法为:其中,分别表示描述智能体i特征圆圆心的横纵标和纵坐标;分别表示智能体i终端位置的横纵标和纵坐标;步骤3

4:若智能体i当前位置与对应终端位置之间的距离S
i
(t0+(k

1)δT)大于阈值d,则采用RVO策略对智能体i进行轨迹规划,并存储其轨迹、时间数据;若智能体i当前位置与对应终端位置之间的距离S
i
(t0+(k

1)δT)小于或等于阈值d,则转入步骤3

【专利技术属性】
技术研发人员:刘洁董献洲高岚岚雷霆徐卫国彭超徐浩樊硕邱凯施展
申请(专利权)人:中国人民解放军军事科学院战争研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1