System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于电动汽车控制,具体涉及一种基于强化学习的汽车稳定性协调控制方法。
技术介绍
1、新能源汽车的发展逐渐加快,其具有无污染、零排放、结构简单和易控制等独特优势。分布式驱动将电机直接安装在各个车轮的轮毂内部或轮边,通过电机直接驱动车轮且各个车轮的转矩独立可控,充分发挥电机响应速度快且转矩精确调节的优势,为车辆动力学控制提供更多的自由度。
2、分布式驱动电动汽车既可以控制四个驱动电机输出扭矩来满足汽车的纵向运动,也可以通过改变部分驱动电机的扭矩来实现侧向的附加横摆力矩和主动后轮转向等功能。在汽车低速行驶时,主动后轮转向可以提供与前轮转角方向相反的转角,减小车辆的转弯半径,增加汽车的灵活性;在高速行驶时,主动后轮转向可以提供与前轮转角方向相同的转角,以避免汽车侧滑。但在极限工况下,轮胎力趋于饱和状态,此时轮胎无法提供足够的侧向力来维持汽车稳定性,主动后轮转向系统也无法用于提高车辆的操纵稳定性,这时,可以通过改变轮胎的纵向力来形成一个横摆力矩对汽车进行控制,可以起到保持车辆稳定性的目的;但车辆作为复杂的非线性系统,如何将主动后轮转向与横摆力矩控制结合起来,提升车辆的在转向过程中的机动性和稳定性,从而保障车辆的安全性是亟待解决的问题。
技术实现思路
1、本专利技术针对现有技术中的不足,提供一种基于强化学习的汽车稳定性协调控制方法,能够对主动后轮转向与横摆力矩协调控制,以保证车辆的稳定性和安全性。
2、本专利技术提供了如下的技术方案:
3、提供一种
4、根据车辆的结构参数、车速和前轮转角利用线性二自由度模型,获取期望横摆角速度ωd和期望质心侧偏角βd;
5、根据期望横摆角速度ωd、实际横摆角速度、期望质心侧偏角βd和实际质心侧偏角通过滑模控制,获取附加横摆力矩δm和主动后轮转向转角δr;
6、基于建立的设定工况下车辆状态参数聚类图和当前车辆的状态参数,获取当前车辆的状态类型;所述状态类型为稳定状态、临界稳定状态和不稳定状态的一种;
7、构建强化学习的智能体和奖励函数,并不断训练智能体,直至输出附加横摆力矩δm和主动后轮转向转角δr各自的最优协同控制系数,以实现对电动汽车的协调控制;所述奖励函数包括稳定状态奖励、横摆角速度误差和质心侧偏角误差奖励、临界稳定状态奖励以及防抖动奖励。
8、可选地,所述车辆的结构参数、车速和前轮转角利用线性二自由度模型,获取期望横摆角速度ωd和期望质心侧偏角βd中:
9、所述线性二自由度模型形式为:
10、
11、其中,k1为车辆前轴的刚度,k2为车辆后轴的刚度,β为车辆质心侧偏角,vx为纵向车速,a为车辆质心到前轴的距离,b为车辆质心到后轴的距离,ωexp为线性二自由度模型输出的期望横摆角速度,δ为标准前轮转角,m为车辆质量,ay为车辆的侧向加速度,iz为车辆的转动惯量,为ωexp的导数;
12、所述线性二自由度模型输出的期望横摆角速度ωexp为:
13、
14、其中,k为汽车稳定性因数;
15、所述期望横摆角速度ωd和期望质心侧偏角βd为:
16、
17、其中,μ为附着系数,g为重力加速度,βd为期望质心侧偏角,sgn(δ)为标志前轮转角符号的判断函数,当前轮转角为正时,sgn(δ)为1,当前轮转角为负时,sgn(δ)为-1。
18、可选地,所述标准前轮转角δ为车辆两个前轮的车轮转角平均值;所述车辆两个前轮的车轮转角和纵向车速vx通过传感器获得;所述车辆转动惯量iz基于车辆的期望转矩td获取;所述车辆的期望转矩td为:
19、
20、其中,θ为油门踏板开度,timax为第i个轮毂电机峰值转矩。
21、可选地,所述根据期望横摆角速度ωd、实际横摆角速度、期望质心侧偏角βd和实际质心侧偏角通过滑模控制,获取附加横摆力矩δm和主动后轮转向转角δr,具体包括:
22、根据期望横摆角速度ωd和实际横摆角速度,设计横摆力矩控制器的滑模面,得到附加横摆力矩δm;
23、
24、根据期望质心侧偏角βd和实际质心侧偏角,设计主动后轮控制器的滑模面,得到主动后轮转向转角δr;
25、
26、其中,iz为车辆的转动惯量,cω为误差与误差变化率之间的相对权重系数,a为车辆质心到前轴的距离,b为车辆质心到后轴的距离,cf为车辆前轮的刚度,cr车辆后轮的刚度,vx为纵向车速,和分别为eω和eβ的导数,eω为横摆角速度的控制变量偏差,eβ为质心侧偏角的控制变量偏差,k0为趋近率常数,sω为滑模剪切函数。
27、可选地,所述基于建立的设定工况下车辆状态参数聚类图和当前车辆的状态参数,获取当前车辆的状态类型中,设定工况下车辆状态参数聚类图中一共有5个聚类中心,其中,最中间的簇为稳定状态,位于最中间簇左右两侧边缘的簇为不稳定状态,位于稳定状态和不稳定状态之间的簇为临界稳定状态;
28、所述车辆状态参数包括:侧向速度、侧向加速度、横摆角速度、质心侧偏角和轮胎侧偏角。
29、可选地,所述构建强化学习的智能体和奖励函数,并不断训练智能体,直至输出附加横摆力矩δm和主动后轮转向转角δr各自的最优协同控制系数,具体包括:
30、定义所述智能体的状态st为:
31、st={ω,δω,β,δβ,ay}
32、其中,δω为横摆角速度与实际横摆角速度之差,δβ为期望质心侧偏角与实际质心侧偏角之差,ω为实际横摆角速度,β为实际质心侧偏角,ay为侧向加速度;
33、定义动作at为后轮转角和附加横摆力矩的协同关系,表示如下:
34、at={κ,1-κ},κ∈[0,1]
35、其中,κ为主动后轮转向转角δr的协同控制系数,1-κ为附加横摆力矩δm的协同系数;
36、定义奖励函数rt为:
37、rt=a1rs+a2re+a3rcs+a4rc
38、其中,rs为稳定状态奖励,re为横摆角速度误差和质心侧偏角误差奖励,rcs为临界稳定状态奖励,rc为防抖动奖励,a1、a2、a3和a4分别为rs、re、rcs和rc的奖励系数。
39、可选地,所述稳定状态奖励rs包括对车辆当前时刻的状态奖励以及对车辆未来时刻的预测状态奖励,具体公式为:
40、rs=rs1+rs2+rs3+rs4
41、
42、其中,rs1为对于汽车当前时刻的状态奖励,rs2、rs3和rs4分别为预测的第一、第二和第三个时刻的汽车的状态奖励;dis1为车辆状态参数到聚类中心的欧式距离;t1、t2、t3和t4分别为rs1、rs2、rs3和rs4的调节系数;q为当前车辆所属聚类的类别;q=1为当前车辆为稳定状态,q=2orq=4为当前车辆为临界稳定状态,q=3和q本文档来自技高网...
【技术保护点】
1.一种基于强化学习的汽车稳定性协调控制方法,其特征在于,包括:
2.根据权利要求1所述的基于强化学习的汽车稳定性协调控制方法,其特征在于,所述车辆的结构参数、车速和前轮转角利用线性二自由度模型,获取期望横摆角速度ωd和期望质心侧偏角βd中:
3.根据权利要求2所述的基于强化学习的汽车稳定性协调控制方法,其特征在于,所述标准前轮转角δ为车辆两个前轮的车轮转角平均值;所述车辆两个前轮的车轮转角和纵向车速vx通过传感器获得;所述车辆转动惯量Iz基于车辆的期望转矩Td获取;所述车辆的期望转矩Td为:
4.根据权利要求1所述的基于强化学习的汽车稳定性协调控制方法,其特征在于,所述根据期望横摆角速度ωd、实际横摆角速度、期望质心侧偏角βd和实际质心侧偏角通过滑模控制,获取附加横摆力矩ΔM和主动后轮转向转角δr,具体包括:
5.根据权利要求1所述的基于强化学习的汽车稳定性协调控制方法,其特征在于,所述基于建立的设定工况下车辆状态参数聚类图和当前车辆的状态参数,获取当前车辆的状态类型中,
6.根据权利要求1所述的基于强化学习的汽车稳定
7.根据权利要求6所述的基于强化学习的汽车稳定性协调控制方法,其特征在于,所述稳定状态奖励rs包括对车辆当前时刻的状态奖励以及对车辆未来时刻的预测状态奖励,具体公式为:
8.根据权利要求6所述的基于强化学习的汽车稳定性协调控制方法,其特征在于,所述横摆角速度误差和质心侧偏角误差奖励re为:
...【技术特征摘要】
1.一种基于强化学习的汽车稳定性协调控制方法,其特征在于,包括:
2.根据权利要求1所述的基于强化学习的汽车稳定性协调控制方法,其特征在于,所述车辆的结构参数、车速和前轮转角利用线性二自由度模型,获取期望横摆角速度ωd和期望质心侧偏角βd中:
3.根据权利要求2所述的基于强化学习的汽车稳定性协调控制方法,其特征在于,所述标准前轮转角δ为车辆两个前轮的车轮转角平均值;所述车辆两个前轮的车轮转角和纵向车速vx通过传感器获得;所述车辆转动惯量iz基于车辆的期望转矩td获取;所述车辆的期望转矩td为:
4.根据权利要求1所述的基于强化学习的汽车稳定性协调控制方法,其特征在于,所述根据期望横摆角速度ωd、实际横摆角速度、期望质心侧偏角βd和实际质心侧偏角通过滑模控制,获取附加横摆力矩δm和主动后轮转向...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。