离散控制围拦函数改进优化方法、优化系统、终端及介质技术方案

技术编号:33153629 阅读:17 留言:0更新日期:2022-04-22 14:09
本发明专利技术属于控制围栏函数技术领域,公开了一种离散控制围拦函数改进优化方法、优化系统、终端及存储介质,根据离散化形式的控制围栏函数约束要求,定义可行状态集;根据多个任务约束优化求解情况,动态调整控制围栏函数的γ

【技术实现步骤摘要】
离散控制围拦函数改进优化方法、优化系统、终端及介质


[0001]本专利技术属于控制围栏函数
,尤其涉及一种离散控制围拦函数改进优化方法、优化系统、终端及存储介质。

技术介绍

[0002]目前,控制围栏函数的定义与控制不变集的概念密切相关,如果存在一个控制函数π:使得对于任意的起始条件x(0)∈IS,总能满足则称集合IS为控制不变集。给定一个闭集假定集合C满足:
[0003][0004][0005][0006]式中,Int(C)和分别表示集合C的内部和边界,h:为一连续可微函数,如果对于所有的满足并且满足:
[0007][0008]则称h(x)为控制围栏函数。式中γ(
·
)为类

K函数,即γ(
·
)满足严格的单调递增并且γ(0)=0,在实际应用中,常取γ(
·
)为常系数的线性函数,即γ(h(x))=γh(x)。从定义可以看出,如果h(x)的初始值h(x)≥0,则由于总是大于指数衰减,因此总能保证h(x)≥0,具有前向不变性,也就是说,集合{x|h(x)≥0}是系统的控制不变集。
[0009]此外,控制围栏函数与控制李雅普诺夫函数也密切相关,在非线性控制中,如果本专利技术需要保证系统的稳定性,即x(t)

0,为了解决直接求解系统状态来判断系统的稳定性难题,控制李雅普诺夫函数通过构建一个控制器,如果它能使得一个正定函数V(x):趋近于零,则可以间接判定系统的稳定性。控制器如果满足则可以证明系统将稳定收敛,V(x
*
)=0,即x
*
=0。借助函数V,并通过构建控制器满足就可以间接的确保系统的稳定性。与控制李雅普诺夫函数的思路相似,控制围栏函数通过构建控制器来间接保证系统的前向不变性,在使用控制围栏函数时,可以通过将任务约束描述成h(x)≥0的形式,借助控制围栏函数前向不变性的理念,通过优化控制量,来间接保证任务约束得到满足。这里值得注意的是,控制李雅普诺夫函数要求而不仅仅是来保证系统的稳定收敛速度,与此类似,控制围栏函数这一约束要求只是满足系统前向不变性的一个保守子集,当多个用控制围栏函数表达的任务约束同时施加影响时,可能会
导致优化算法得不到可行解的情形。因此,亟需一种新的基于离散时间控制围栏函数的离散控制围拦函数改进优化方法。
[0010]通过上述分析,现有技术存在的问题及缺陷为:(1)现有控制围栏函数的约束要求只是满足系统前向不变性的一个保守子集,当多个用控制围栏函数表达的任务约束同时施加影响时,可能会导致优化算法得不到可行解的情形。
[0011](2)现有技术中,面对复杂动态场景的多智能体运动轨迹数据规划中,传统方法由于问题维度急剧增加,运行效率及运动细节要求难以满足。使得获得的多智能体运动轨迹数据准确度低下。

技术实现思路

[0012]针对现有技术存在的问题,本专利技术提供了一种离散控制围拦函数改进优化方法、优化系统、终端及存储介质,具体设计一种基于可优化的离散时间控制围栏函数的离散控制围拦函数改进优化方法。
[0013]本专利技术是这样实现的,一种基于离散时间控制围栏函数的离散控制围拦函数改进优化方法,所述基于离散时间控制围栏函数的离散控制围拦函数改进优化方法包括以下步骤:
[0014]步骤一,根据离散化形式的控制围栏函数约束要求,定义可行状态集;
[0015]步骤二,根据多个任务约束优化求解情况,动态调整控制围栏函数的γ
k

[0016]步骤三,将控制围栏的γ
k
作为一代优化的变量,得到可优化控制围栏函数;
[0017]步骤四,将离散形式的控制围栏函数约束要求进行更改,并直接对h(x
t+k|t
)对任务约束的满足程度进行优化;
[0018]步骤五,在优化目标中引入S
k
相关的偏好目标,使仿真优化得到的复杂动态场景的多智能体运动路径数据符合偏好。
[0019]进一步,所述步骤一中的的离散化形式为:
[0020]h
t+Δt

h
t


γh
t

[0021]根据离散化形式的控制围栏函数约束要求,定义某一仿真时间点t+k对应的可行状态集为:
[0022]S
CBF,k
={x∈X:h(x
t+k+1
)≥(1

γ
k
)h(x
t+k
)};
[0023]式中,可行状态集的范围由h(x
t+k
)和γ
k
共同决定,显然γ
k
越大,对下一时刻h(x
t+k+1
)的要求就越低;反之,γ
k
越小,对下一时刻h(x
t+k+1
)的要求就越高。
[0024]进一步,所述步骤二中,在已有的控制围栏函数定义中,γ
k
为一事先确定的超参数;如果γ
k
设置不够合理,将造成无可行解的情况,故控制围栏函数中的γ
k
根据多个任务约束优化求解的实际情况,进行动态调整。
[0025]进一步,所述步骤三中,将控制围栏中的γ
k
作为一代优化的变量,称之为可优化的控制围栏函数。
[0026]进一步,所述步骤四中,根据可行状态集的描述公式,在γ
k
固定后,当前时刻的h(x
t+k
)也会对h(x
t+k+1
)施加限制,如果当前时刻点的h(x
t+k
)较大,则会造成h(x
t+k+1
)也必须取较大值才能满足CBF约束要求,而实际上前向不变性的本质要求只是h(x
t+k+1
)≥0,提出将
离散形式的控制围栏函数约束要求更改为:
[0027][0028]式中,S
k
为新引入的优化变量,用于取代(1

γ)h(x
t
),直接对h(x
t+k|t
)对任务约束的满足程度进行优化,称之为GOCBF,从而更加直接的对多个任务约束进行调整,进而提升可行解空间的范围。
[0029]进一步,所述步骤五中的在优化目标中引入S
k
相关的偏好目标,所述步骤五中的在优化目标中引入S
k
相关的偏好目标,使仿真优化得到的复杂动态场景的多智能体运动路径数据符合偏好包括:
[0030]在优化目标中引入S
k
相关的偏好目标,所述偏好目标包括Φ(S
k
)=(S
T

S0)W
S
(S

S0),从而使仿真优化得到的运动路径符合偏好。
[0031]本专利技术的另一目的在于提供一种应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于离散时间控制围栏函数的离散控制围拦函数改进优化方法,其特征在于,所述基于离散时间控制围栏函数的离散控制围拦函数改进优化方法包括以下步骤:步骤一,根据离散化形式的控制围栏函数约束要求,获得可行状态集;步骤二,根据多个任务约束优化求解条件,动态调整控制围栏函数的γ
k
;步骤三,将控制围栏的γ
k
作为一代优化的变量,得到可优化控制围栏函数;步骤四,将离散形式的控制围栏函数约束要求进行更改,并直接对h(x
t+k|t
)对任务约束的满足程度进行优化;步骤五,在优化目标中引入S
k
相关的偏好目标,使仿真优化得到的复杂动态场景的多智能体运动路径数据符合偏好。2.如权利要求1所述的基于离散时间控制围栏函数的离散控制围拦函数改进优化方法,其特征在于,所述步骤一中的的离散化形式为:h
t+Δt

h
t


γh
t
;根据离散化形式的控制围栏函数约束要求,定义某一仿真时间点t+k对应的可行状态集为:S
CBF,k
={x∈X:h(x
t+k+1
)≥(1

γ
k
)h(x
t+k
)};式中,可行状态集的范围由h(x
t+k
)和γ
k
共同决定。3.如权利要求1所述的基于离散时间控制围栏函数的离散控制围拦函数改进优化方法,其特征在于,所述步骤二中在已有的控制围栏函数定义中,γ
k
为预确定的超参数,控制围栏函数中的γ
k
根据多个任务约束优化求解的实际情况,进行动态调整。4.如权利要求1所述的基于离散时间控制围栏函数的离散控制围拦函数改进优化方法,其特征在于,所述步骤三中将控制围栏中的γ
k
为可优化的控制围栏函数。5.如权利要求1所述的基于离散时间控制围栏函数的离散控制围拦函数改进优化方法,其特征在于,所述步骤四中将离散形式的控制围栏函数约束要求更改为:式中,S
k
为新引入的优化变量,用于取代(1

γ)h(x
t
),直接对h(x
t+k|t
)对任务约束的满足程度进行优化。6.如权利要求1所述的基于离散时间控制围栏函数的离散控制围拦函数改进优化方法,其特征在于,所述步骤五中的在优化目标中引入S
k
相关的偏好目标,使仿真优化得到的复杂动态场景的多智能体运动路径数据符合偏好包括:在优化目标中引入S...

【专利技术属性】
技术研发人员:李石磊袁志民李猛杨智超叶清王甲生何涛
申请(专利权)人:中国人民解放军海军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1