一种基于策略迭代的PID优化控制方法技术

技术编号:24496430 阅读:25 留言:0更新日期:2020-06-13 03:13
本发明专利技术涉及一种基于策略迭代的PID优化控制方法,首先建立主动悬架系统动力学模型,然后将上述微分方程描述成状态空间模型,设计包含PID控制策略和近似最优补充控制策略的组合控制方案,基于平方和规划技术的改进策略迭代算法,对PID参数进行整定,使系统达到更好的性能。

A PID optimal control method based on strategy iteration

【技术实现步骤摘要】
一种基于策略迭代的PID优化控制方法
本专利技术涉及一种主动悬架系统的控制方法,主要是基于强化学习思想优化非线性系统原有的PID控制参数,属于智能控制领域。
技术介绍
由于实现的简单性,鲁棒性和可靠性,PID控制在工业过程中被广泛使用。通常,设计PID控制器是一个多目标问题,一般会导致非凸问题。在过去的几十年中,研究人员已经提出了许多调节PID控制参数技术方法。作为传统的调节方法,试错法是调节PID控制参数的简便方法,但不能有效保证所需的控制性能。尽管Ziegler-Nichols方法很流行,并且在非线性系统中表现良好,但是对于高阶系统,此方法可能会导致较大的超调,较长的调节时间和振荡响应。此外,还存在许多其他调整PID参数方法,例如简化Ziegler-Nichols方法,极点配置方法以及增益和相位裕度方法。然而,大多数方法不适用于多输入多输出非线性系统。《基于SOS和策略迭代的多项式非线性系统H∞最优控制》(朱圆恒,赵冬彬,杨雄,张启超,《IEEETRANSACTIONSONCYBERNETICS》,2018年第2期第48卷)一文中提出了一种基于SOS的策略迭代方法来处理多项式非线性系统的近似H∞控制。尽管SOS多项式的成功吸引了ADP界的研究者的兴趣,但很少考虑基于SOS的PID参数调整和逼近最佳补偿控制的问题。
技术实现思路
要解决的技术问题面向主动悬架系统优化控制,本专利技术设计了一种基于策略迭代的PID参数优化控制方法,该方法能够确保主动悬架系统的稳定性,并且提升控制性能,从而为乘客提供更舒适的体验。技术方案一种基于策略迭代的PID优化控制方法,其特征在于步骤如下:步骤1:考虑到主动悬架系统动力学模型:其中,Me和Mf是车身和车轮的质量,xs和xw是车身和车轮的位移,Kd和Kf是弹性系数,Cd是悬架阻尼系数,r是道路干扰,u是液压执行器的控制力,fb(xs,xw)和fus(xs,xw)是高阶非线性函数;步骤2:考虑实际非线性函数影响,定义状态变量x1=xs,x3=xw,在不考虑道路扰动的情况下,将步骤1的微分方程描述成状态空间模型:其中x=[x1,x2,x3,x4]T,x1和x3分别是车身和车轮的位置,x2和x4是车身和车轮的速度,a1和a2为比例系数,这里考虑与车身和车轮位移相关的高阶非线性函数的影响;步骤3:为了使系统运行更平稳,给乘客提供更舒适的体验,提出如下组合控制方法;针对一类连续时间非线性系统,其描述如下:其中,是可测系统状态,是控制输入,是多项式向量,且有f(0)=0,是多项式矩阵;此非线性系统模型可以用来描述上述主动悬架系统;考虑系统总体控制策略为u(t)=uPID(t)+ua(t),其中uPID(t)为PID控制量,其初始策略可保持系统原有PID控制机制,ua(t)为附加的近似最优控制,在通过算法学习ua(t)的同时,优化原有的PID参数;PID控制器通常设计为控制器的时域解为uPID(x)=KPx+μI+μD(6)其中为了提高设计自由度,可以添加一些控制参数,设计以下实际运用的PID控制器。uPID(x)=KPx+KI1μI+KD1μD(7)步骤4:定义xa=[μI,μD,x]T,得到一个增广系统其中步骤5:针对以上增广系统,选择下面的性能指标函数:其中,Q(xa)是正定多项式函数,R(xa)是对称正定多项式矩阵,与ua(t)相关的成本函数为:然后,定义哈密顿函数为最优成本函数V*(xa,θ)为满足以下等式可得最优控制为其中,使得存在并且是唯一的;将代入(10),得到HJB方程为步骤6:算法:1:选择一个初始系统参数向量θ0,容许控制策略u0(xa)和一个标量∈>0,让i=0和V0=0;2:使用控制策略ua,i(xa),求解以下SOS问题以获得Vi(xa)3:控制策略更新为4:根据获得的Vi(xa),求解以下SOS问题以获取θi+1和5:控制策略更新为6:设置i=i+1并执行第2步,直到有益效果本专利技术提出的一种基于策略迭代的PID优化控制方法,有益效果如下:(1)针对一类仿射多项式非线性系统,提出了一种包含PID控制策略和近似最优补充控制策略的组合控制方案,基于平方和规划技术的改进策略迭代算法,对PID参数进行整定,使系统达到更好的性能;(2)待优化的PID参数的优化方向未知,现有的策略迭代方法很难直接用于求解本专利技术中考虑的主要问题,本专利技术给出一种新的扩展型平方和条件,便于解决变量耦合问题。附图说明图1本专利技术实施流程图具体实施方式现结合实施例、附图对本专利技术作进一步描述:基于策略迭代的PID参数优化控制方法,通过以下步骤实现:(a)考虑到主动悬架系统动力学模型:其中Me和Mf是车身和车轮的质量,xs和xw是车身和车轮的位移,Kd和Kf是弹性系数,Cd是悬架阻尼系数,r是道路干扰,u是液压执行器的控制力,fb(xs,xw)和fus(xs,xw)是高阶非线性函数。(b)考虑实际非线性函数影响,定义状态变量x1=xs,x3=xw,在不考虑道路扰动的情况下,将上述微分方程描述成状态空间模型:其中x=[x1,x2,x3,x4]T,x1和x3分别是车身和车轮的位置。x2和x4是车身和车轮的速度。a1和a2为比例系数。这里考虑与车身和车轮位移相关的高阶非线性函数的影响。(c)为了使系统运行更平稳,给乘客提供更舒适的体验,提出如下组合控制方法。针对一类连续时间非线性系统,其描述如下:其中是可测系统状态,是控制输入。是多项式向量,且有f(0)=0,是多项式矩阵。此非线性系统模型可以用来描述上述主动悬架系统。考虑系统总体控制策略为u(t)=uPID(t)+ua(t),其中uPID(t)为PID控制量,其初始策略可保持系统原有PID控制机制,ua(t)为附加的近似最优控制,在通过算法学习ua(t)的同时,优化原有的PID参数。PID控制器通常设计为控制器的时域解为uPID(x)=KPx+μI+μD(6)其中为了提高设计自由度,可以添加一些控制参数KI1、KD1,设计以下实际运用的PID控制器。uPID(x)=KPx+KI1μI+KD1μD(7)(d)定义xa=[μI,μD,x]T,得到一个增广系统其中(e)针对以上增广系统本文档来自技高网...

【技术保护点】
1.一种基于策略迭代的PID优化控制方法,其特征在于步骤如下:/n步骤1:考虑到主动悬架系统动力学模型:/n

【技术特征摘要】
1.一种基于策略迭代的PID优化控制方法,其特征在于步骤如下:
步骤1:考虑到主动悬架系统动力学模型:






其中,Me和Mf是车身和车轮的质量,xs和xw是车身和车轮的位移,Kd和Kf是弹性系数,Cd是悬架阻尼系数,r是道路干扰,u是液压执行器的控制力,fb(xs,xw)和fus(xs,xw)是高阶非线性函数;
步骤2:考虑实际非线性函数影响,定义状态变量x1=xs,x3=xw,在不考虑道路扰动的情况下,将步骤1的微分方程描述成状态空间模型:



其中
x=[x1,x2,x3,x4]T,






x1和x3分别是车身和车轮的位置,x2和x4是车身和车轮的速度,a1和a2为比例系数,这里考虑与车身和车轮位移相关的高阶非线性函数的影响;
步骤3:为了使系统运行更平稳,给乘客提供更舒适的体验,提出如下组合控制方法;针对一类连续时间非线性系统,其描述如下:



其中,是可测系统状态,是控制输入,是多项式向量,且有f(0)=0,是多项式矩阵;此非线性系统模型可以用来描述上述主动悬架系统;考虑系统总体控制策略为u(t)=uPID(t)+ua(t),其中uPID(t)为PID控制量,其初始策略可保持系统原有PID控制机制,ua(t)为附加的近似最优控制,在通过算法学习ua(t)的同时,优化原有的PID参数;
PID控制器通常设计为



控制器的时域解为uPID(x)...

【专利技术属性】
技术研发人员:范泉涌王冬生许斌
申请(专利权)人:西北工业大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1