System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于具有连续和离散变量的非线性系统的模型预测控制的顺序凸化方法技术方案_技高网

用于具有连续和离散变量的非线性系统的模型预测控制的顺序凸化方法技术方案

技术编号:42434185 阅读:7 留言:0更新日期:2024-08-16 16:45
为了控制混合动力学系统,预测反馈控制器公式化混合整数非线性规划(MINLP)问题,该MINLP问题包括表示混合动力学系统的操作的连续元素的连续优化变量的非线性函数、以及表示混合动力学系统的操作的离散元素的整数优化变量的一个或多个线性函数。将MINLP问题公式化成确保操作的离散元素仅存在于MINLP问题的线性函数中的可分离格式。通过使用解的空间中的包括当前解猜测的一部分的部分凸化的多次迭代,来对MINLP问题进行求解。部分凸化在没有近似MINLP的线性函数的情况下生成MINLP的非线性函数的凸近似,以生成经部分凸化的MINLP。

【技术实现步骤摘要】
【国外来华专利技术】

本公开总体上涉及基于混合整数非线性优化的控制,并且更特别地,涉及用于具有操作的连续元素和离散元素的由非线性动力学描述的系统的模型预测控制的顺序凸化方法和设备。


技术介绍

1、诸如模型预测控制(mpc)之类的基于优化的决策、规划和控制技术允许其中可以直接考虑系统动力学、系统要求和约束的基于模型的设计框架。该框架已被扩展到包括连续决策变量和离散决策变量两者的混合动力学系统,其提供了对大范围问题进行建模的强有力的技术,例如,所述系统包括具有模式切换的动力学系统或具有量化致动的系统,其具有逻辑规则、时间逻辑规范或避障约束的问题。然而,最后所得到的优化问题是高度非凸的,并因此在实践中难以求解,这是因为它们包含仅采用离散值(例如,二元(binary)或整数值)的变量。当使用非线性系统动力学、一个或多个非线性约束函数和/或非线性目标函数时,可以将最后所得到的最优控制问题(ocp)公式化为混合整数非线性规划(minlp)问题,其是非常困难的非确定性多项式问题(np-hard)并因此在计算上难以求解。

2、通常,混合整数非线性模型预测控制(minmpc)需要非凸minlp的解,即,即使在使例如由于非线性系统动力学、非线性约束函数和/或目标函数的完整性约束松弛之后,优化问题也是非凸的。用于minlp的最成功的全局优化算法需要目标函数和约束函数的凸性,因此其不能被用于将minmpc问题求解为全局最优性。即使对于非凸minlp存在全局优化算法(例如,使用可因式分解问题的松弛),它们通常在计算上也非常昂贵,并因此对于minmpc的实时实现通常还不实用。

3、混合系统的决策、规划或控制旨在求解每一个采样时刻的minlp,以实现实时minmpc应用。因而,一些方法为此集中于近似或试探式(heuristic)技术,以在严格的定时要求内找到minlp的可行但(可能)次优的解。一些现有技术基于凸minlp的全局算法,其可以被用于例如使用外部近似或混合分支定界(hybrid branch-and-bound,hb&b)方法来找到非凸minlp的近似解。特别是对于非凸minmpc,已经基于外凸化结合凑整(rounding)方案提出了一种实时迭代(rti)算法的变体。然而,当不等式约束直接取决于离散决策变量时,后一种方法需要求解具有消失约束的数学规划,这特别具有挑战性。

4、例如使用顺序凸规划(scp)或顺序二次规划(sqp)方法的顺序凸化技术形成了求解一般非线性规划(nlp)问题的流行技术。特别地,顺序凸化技术已经被成功地用于具有平滑非线性动力学、非线性约束函数和/或不等式约束的非线性模型预测控制(nmpc)的实时实现。然而,需要将这些方法扩展到具有操作的连续元素和离散元素两者的系统的nmpc,即,在minmpc中包括连续决策变量以及整数和/或二元决策变量。

5、在近来的现有工作中,提出了一种混合整数顺序二次规划(misqp)方法,其基于对连续优化变量和整数优化变量两者使用信任区域半径。该方法在每次迭代需要混合整数二次规划(miqp)子问题的解,这可以例如使用现有技术的分支定界(branch-and-bound,b&b)优化方法来高效地求解。然而,标准misqp方法依赖于整数变量对minlp具有平滑影响的假设,即,将整数变量递增1导致函数值的小改变。然而,后一种假设对于minmpc通常不成立,这是因为例如受约束的优化问题可能包括对最优控制轨迹具有较大影响的二元变量。

6、因此,需要一种更一般地适用于minmpc问题的顺序凸化方法,这是本专利技术中描述的系统和方法的目标。


技术实现思路

1、本专利技术的实施方式基于一个或多个混合整数凸规划(micp)子问题的序列的解,其中,各个子问题的准备是基于部分凸化技术来执行的,以便在所提出的minmpc控制器的各个采样时刻计算混合整数非线性最优控制问题的可行但可能次优的解。可以将各个micp子问题的解用于计算对所有整数决策变量和/或二元决策变量的最优解猜测的更新、以及连续决策变量的新的搜索方向。另外,基于整数决策变量和/或二元决策变量的经更新的值以及基于连续决策变量的新的搜索方向,可以在混合整数顺序凸规划(miscp)优化算法的每次迭代中更新连续决策变量的当前解猜测。

2、本专利技术的一些实施方式基于这样的实现,即,可以将任何minlp以可分离格式重新公式化为不同的但在数学上等效的minlp,其中,所有整数决策变量和/或二元决策变量线性地进入所有约束和目标函数中。例如,通过定义一个或多个辅助连续优化变量以确保所有整数决策变量和/或二元优化变量线性地进入约束和目标函数中,可以实现后一种重新公式化。具体地,可以以可分离格式存在于minmpc公式化的约束和目标函数中的所有非线性函数因此仅取决于连续优化变量。本专利技术的一些实施方式基于这样的实现,即,可以将minmpc公式化中的约束和目标函数对所有整数决策变量和/或二元决策变量的后一种线性相依性用于避免平滑度要求,即,将整数变量递增1导致函数值的小改变,这限制了用于minmpc的标准misqp算法的适用性。

3、在所提出的miscp优化算法的每次迭代中,使用部分凸化技术来准备micp子问题。本专利技术的一些实施方式基于这样的实现,即,由于minmpc公式化中的约束和目标函数对所有整数决策变量和/或二元决策变量的线性相依性,致使部分凸化技术只需要应用于平滑非线性函数。在本专利技术的一些实施方式中,部分凸化技术基于可能存在于minmpc公式化的约束和目标函数中的所有平滑非线性函数的局部线性化,基于miscp算法的当前迭代中的连续优化变量的解猜测。另选地,在本专利技术的其它实施方式中,可以使用部分凸化技术来计算minmpc问题公式化的一个或多个不等式约束中的非线性函数的更一般的凸近似,从而导致混合整数二次约束二次规划(miqcqp)子问题中的凸二次不等式约束,或者混合整数二阶锥规划(misocp)子问题中的凸二阶锥约束。

4、本专利技术的实施方式基于这样的实现,即,由于过去几十年在用于micp的目前发展水平的解算器的开发中已经取得的进展,因此在所提出的miscp算法的每次迭代中,micp子问题的解可以相对快速地计算。例如,可以将分支定界方法用于高效地求解混合整数二次规划(miqp)或混合整数线性规划(milp)子问题。用于miqp和/或milp的目前发展水平的分支定界方法可以包括具有早期终止和不可行性检测的凸解算器、高级原始试探法、分支策略、预求解操作、以及剪切生成技术,以有效地减小分支定界搜索树的大小,并因此减少为了计算各个miqp/milp的全局最优解而需要求解的凸松弛的量。

5、本专利技术的一些实施方式基于这样的实现,即,可以以特定的方式来执行每次miscp迭代中的连续决策变量的更新,以确保在计算minlp问题的可行但可能次优的解方面取得一定量的进展。本专利技术的一些实施方式使用基于优值函数的全局化策略,该优值函数对连续决策变量和离散决策变量两者的值的解猜测的最优性和约束满足的组合进行本文档来自技高网...

【技术保护点】

1.一种用于控制具有非线性动力学以及操作的连续元素和离散元素的混合动力学系统的预测反馈控制器,所述预测反馈控制器包括:至少一个处理器;以及存储器,所述存储器上存储有指令,所述指令在由所述至少一个处理器执行时,使所述预测反馈控制器:

2.根据权利要求1所述的预测反馈控制器,其中,所述混合动力学系统包括由表示所述控制命令的操纵输入信号控制的装置,其中,所述输入信号指定所述混合动力学系统的所述操作的所述连续元素的值、以及所述混合动力学系统的所述操作的所述离散元素的值,其中,所述连续元素包括电压、压力、力、转矩、转向角度、速度、以及温度中的一个或组合,并且其中,所述离散元素包括能量水平、经量化的阀输入、换档、接通/断开致动、车道选择、以及避障决策变量中的一个或组合。

3.根据权利要求1所述的预测反馈控制器,其中,所述处理器被配置成:

4.根据权利要求1所述的预测反馈控制器,其中,为了执行所述部分凸化,所述处理器被配置成:

5.根据权利要求4所述的预测反馈控制器,其中,通过使用符号微分、数值微分或算术微分来评估所述平滑非线性函数的一个或多个一阶和/或更高阶方向导数,从而通过所述平滑非线性函数在所述MINLP问题的所述解空间内的所述当前解猜测的局部邻域中的局部约束线性化或线性二次目标近似来计算所述凸近似。

6.根据权利要求1所述的预测反馈控制器,其中,为了更新所述迭代的所述当前解猜测,所述预测反馈控制器被配置成:

7.根据权利要求6所述的预测反馈控制器,其中,所述步长大小值处于0与1之间,并且基于使所述MINLP问题的所述解的最优性和可行性平衡的优值函数来为所述迭代选择所述步长大小值,使得所述优值函数的值在所述基于顺序凸化的优化过程的至少两次迭代之间减小。

8.根据权利要求7所述的预测反馈控制器,其中,所述步长大小值是基于迭代线搜索过程从初始步长大小值1开始选择的,其中,所述预测反馈控制器执行所述迭代线搜索过程的一次或多次迭代以选择所述步长大小值,并且每次迭代都被配置成:

9.根据权利要求7所述的预测反馈控制器,其中,所述优值函数是目标函数以及一个或多个惩罚函数的组合,所述一个或多个惩罚函数在所述MINLP问题中被应用于所述等式约束中的各个等式约束的违反以及所述不等式约束中的各个不等式约束的违反。

10.根据权利要求6所述的预测反馈控制器,其中,所述经部分凸化的MINLP的所述MICP问题包括一个或多个信任区域不等式约束,从而确保所述连续优化变量的所述搜索方向低于信任区域半径值。

11.根据权利要求10所述的预测反馈控制器,其中,为了更新所述迭代的所述当前解猜测,所述处理器被配置成:

12.根据权利要求11所述的预测反馈控制器,其中,为了基于所述经部分凸化的MINLP的所述MICP问题的所述解来更新所述信任区域半径值,所述处理器被配置成:

13.根据权利要求1所述的预测反馈控制器,其中,使用分支定界B&B优化方法来计算所述经部分凸化的MINLP的MICP问题的全局最优解。

14.根据权利要求13所述的预测反馈控制器,其中,所述MICP问题是混合整数线性规划MILP子问题、混合整数二次规划MIQP子问题、混合整数二次约束二次规划MIQCQP子问题或者混合整数二阶锥规划MISOCP子问题。

15.根据权利要求6所述的预测反馈控制器,其中,所述整数优化变量的所述当前值在所述基于顺序凸化的优化过程的一次或多次迭代之后固定,并且为了在所述基于顺序凸化的优化过程的一次或多次迭代中更新所述当前解猜测,所述预测反馈控制器被配置成:

16.根据权利要求15所述的预测反馈控制器,其中,所述CP问题是凸线性规划LP子问题、凸二次规划QP子问题、凸二次约束二次规划QCQP子问题或者凸二阶锥规划SOCP子问题。

17.根据权利要求1所述的预测反馈控制器,其中,使用同伦型惩罚方法,来惩罚在所述基于顺序凸化的优化过程的至少两次迭代之间的、所述整数优化变量中的一个或多个整数优化变量的值的基于正权重值的改变。

18.根据权利要求17所述的预测反馈控制器,其中,所述同伦型惩罚方法在所述经部分凸化的MINLP的所述MICP问题的目标函数中添加一个或多个惩罚项,以便加速所述基于顺序凸化的优化过程向所述MINLP问题的可行和/或最优解的收敛。

19.根据权利要求17所述的预测反馈控制器,其中,所述同伦型惩罚方法向所述经部分凸化的MINLP的所述MICP问题的所述不等式约束添加多个线性和/或平滑非线性不等式约束中的一个或组合,以便加速所述基于顺序凸化的优化...

【技术特征摘要】
【国外来华专利技术】

1.一种用于控制具有非线性动力学以及操作的连续元素和离散元素的混合动力学系统的预测反馈控制器,所述预测反馈控制器包括:至少一个处理器;以及存储器,所述存储器上存储有指令,所述指令在由所述至少一个处理器执行时,使所述预测反馈控制器:

2.根据权利要求1所述的预测反馈控制器,其中,所述混合动力学系统包括由表示所述控制命令的操纵输入信号控制的装置,其中,所述输入信号指定所述混合动力学系统的所述操作的所述连续元素的值、以及所述混合动力学系统的所述操作的所述离散元素的值,其中,所述连续元素包括电压、压力、力、转矩、转向角度、速度、以及温度中的一个或组合,并且其中,所述离散元素包括能量水平、经量化的阀输入、换档、接通/断开致动、车道选择、以及避障决策变量中的一个或组合。

3.根据权利要求1所述的预测反馈控制器,其中,所述处理器被配置成:

4.根据权利要求1所述的预测反馈控制器,其中,为了执行所述部分凸化,所述处理器被配置成:

5.根据权利要求4所述的预测反馈控制器,其中,通过使用符号微分、数值微分或算术微分来评估所述平滑非线性函数的一个或多个一阶和/或更高阶方向导数,从而通过所述平滑非线性函数在所述minlp问题的所述解空间内的所述当前解猜测的局部邻域中的局部约束线性化或线性二次目标近似来计算所述凸近似。

6.根据权利要求1所述的预测反馈控制器,其中,为了更新所述迭代的所述当前解猜测,所述预测反馈控制器被配置成:

7.根据权利要求6所述的预测反馈控制器,其中,所述步长大小值处于0与1之间,并且基于使所述minlp问题的所述解的最优性和可行性平衡的优值函数来为所述迭代选择所述步长大小值,使得所述优值函数的值在所述基于顺序凸化的优化过程的至少两次迭代之间减小。

8.根据权利要求7所述的预测反馈控制器,其中,所述步长大小值是基于迭代线搜索过程从初始步长大小值1开始选择的,其中,所述预测反馈控制器执行所述迭代线搜索过程的一次或多次迭代以选择所述步长大小值,并且每次迭代都被配置成:

9.根据权利要求7所述的预测反馈控制器,其中,所述优值函数是目标函数以及一个或多个惩罚函数的组合,所述一个或多个惩罚函数在所述minlp问题中被应用于所述等式约束中的各个等式约束的违反以及所述不等式约束中的各个不等式约束的违反。

10.根据权利要求6所述的预测反馈控制器,其中,所述经部分凸化的minlp的所述micp问题包括一个或多个信任区域不等式约束,从而确保所述连续优化变量的所述搜索方向低于信任区域半径值。

11.根据权利要求10所述的预测反馈控制器,其中,为了更新所述迭代的所述当前解猜测,所述处理器被配置成:

12.根据权利要求11所述的预测反馈控制器,其中,为了基于所述经部分凸化的minlp的所述micp问题的所述解来更新所述信任区域半径值,所述处理器被配置成:

13.根据权利要求1所述的预测反馈控制器,其中,使用分支定界b&b优化方法来计算所述经部分凸化的minlp的micp问题的全局最优解。

14.根据权利要求13所述的预测反馈控制器,其中,所述micp问题是混合整数线性规划milp子问题、混合整数二次规划miqp子问题、混合整数二次约束二次规划miqcqp子问题或者混合整数二阶锥规划misocp子问题。

15.根据权利要求6所述的预测反馈控制器,其中,所述整数优化变量的所述当前值在所述基于顺序凸化的优化过程的一次或多次迭代之后固定,并且为了在所述基于顺序凸化的优化过程的一次或多次迭代中更新所述当前解猜测,所述预测反馈控制器被配置成:

16.根据权利要求1...

【专利技术属性】
技术研发人员:R·奎因S·迪卡拉诺
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1