System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于学习的大扰流环境中机器人稳定跟踪控制方法技术_技高网

基于学习的大扰流环境中机器人稳定跟踪控制方法技术

技术编号:44244508 阅读:2 留言:0更新日期:2025-02-11 13:42
本发明专利技术属于机器人技术领域,涉及基于学习的大扰流环境中机器人稳定跟踪控制方法。本发明专利技术针对扰流环境中的不确定性提出了基于学习的稳定控制策略,通过容忍误差实现策略的结构变换,提高机器人在复杂多变的扰流环境中的适应性。相比现有技术,本发明专利技术不仅可以提高水下机器人轨迹跟踪控制策略的鲁棒性,而且由于策略与传感数据的结合,可以提高实际的工程应用价值。

【技术实现步骤摘要】

本专利技术属于机器人,涉及基于学习的大扰流环境中机器人稳定跟踪控制方法


技术介绍

1、水下机器人在海洋资源勘探、水下工程应用、海军战场监测以及水下精度制导等领域具有广泛应用前景。大多数水下机器人都要求末端执行器与水下物体或环境进行接触。尤其是面向扰流环境,在动力学高度非线性以及未知水动力效应存在的情况下,水下机器人的轨迹跟踪控制仍然具有一定的挑战性。然而,面向复杂的扰流环境,遥控操作需要具备较高的操作技能和经验,存在一定的局限性。相比而言,稳定的跟踪技术不仅可以使机器人精确地沿着预定的轨迹运动,而且能够根据环境的变化进行自主调整,这也将大大提高机器人在动态扰流环境中的工作效率。

2、如今,面向水下机器人的稳定跟踪控制,不少研究方法已经取得了一定的进展。一方面,针对简易环境或简易结构的机器人,基于传统的物理建模方式对机器人所处的环境进行精确描述,能够更准确地预测机器人的运动和环境变化。特别是,物理建模可以与传感器数据融合,例如水下声纳、水下相机等,以进一步优化机器人的控制策略。另一方面,针对复杂的水下运行环境,数据驱动建模方法弥补了物理建模困难的缺陷。通过大量的实测数据建立模型,使得机器人能够更灵活地适应各种复杂的水下环境,并处理非线性、非规则的水下运动和环境变化。此外,数据驱动建模方法能够在大规模数据集上进行离线训练,并在水下机器人运行时进行预测和推理。甚至,为了提高机器人在扰流环境中的适应性,通过模仿海洋生物的形态、运动机制和行为方式来提高跟踪控制的效率和准确性。这些方法的改进为提高水下机器人的精准控制提供了新的思路和方法。

3、然而,扰流环境下的机器人控制系统相当复杂,具有多个强约束,包括数学模型的复杂性、末端执行器的控制难度以及水流的扰动等等。在设计控制方案时,可能会面临一系列问题:环境可能是未知的,系统可能受到未知但有界的外部干扰,传感器测量并不总是准确的。一些研究也可能存在环境条件、任务需求和目标因素的限制,仅仅在特定场景下效果显著。特别是在动态扰流环境下,控制策略的收敛时间并不理想,甚至系统的收敛性难以保证。这些问题可能导致系统表现出不可预测的不稳定性,我们必须在设计控制器时考虑这些约束。而且,外部扰流使得控制器性能的快速退化加剧了操作任务的复杂性。因此,在动力学高度非线性以及未知水动力效应存在的情况下,水下机器人的跟踪控制仍然具有一定的挑战性。

4、专利cn112286227b提出一种基于微分跟踪器和扰动观测器的水下机器人轨迹控制方法及系统,通过构建水下机器人动力学模型与机器人扰动观测器,获得水下机器人轨迹跟踪控制器和水下机器人位置控制器,从而实现水下机器人轨迹控制。

5、专利cn111240345a基于双bp网络增强学习框架实现水下机器人轨迹跟踪,利用强化学习方法可以通过与环境的不断交互,将强化学习与双bp网络结合起来,在线调节水下机器人的速度和航向。

6、专利cn110209152b提供一种智能水下机器人垂直面路径跟随的深度强化学习控制方法。针对智能水下机器人所处海洋环境复杂多变,传统控制方法无法与环境主动进行交互的现象,使用确定性策略梯度通过分布式的方法来完成智能水下机器人的路径跟随控制任务。

7、专利cn107102644b提出一种基于深度强化学习的水下机器人轨迹控制方法及控制系统,获取水下机器人当前时刻的状态以及下一时刻的目标状态,然后输入至学习阶段最终学习得到的决策神经网络中,通过决策神经网络计算出水下机器人当前时刻需要的推进力。

8、在现有技术中,基于物理建模的方法通常需要对环境进行复杂的建模和求解,这可能需要大量的计算资源和时间。甚至,物理建模可能无法完全捕捉到扰流环境的复杂性和不确定性。基于离线学习(如神经网络等)与补偿控制器的结合实现水下机器人的轨迹跟踪控制。补偿作用的大小难以精确计算,甚至实时性也难以保证。同时,由于机器人在扰流环境中状态信息的误差大,训练过程可能面临陷入局部最优或学习能力不足的问题。


技术实现思路

1、本专利技术旨在提出一种基于学习的稳定跟踪控制策略,提高水下机器人在扰流环境中跟踪控制的鲁棒性。在视觉监测的辅助下,本专利技术直接以状态误差(包括跟踪误差和扰流误差)进行策略设计,基于学习的方式处理扰流环境中的不确定性。通过分析扰流环境下的状态误差,实现跟踪控制策略的设计。需要说明的是,本专利技术以状态误差直接对跟踪系统进行建模,能够使模型在不断变化的环境中迅速适应新的数据和情况,而无需重新训练整体模型。这种灵活性使得模型能够及时捕捉到环境中的变化,进而提高控制策略的收敛性和稳定性。

2、本专利技术的技术方案:

3、基于学习的大扰流环境中机器人稳定跟踪控制方法,具体步骤如下:

4、步骤1:采集示范数据;通过人工拖拽的方式采集机器人末端执行器在笛卡尔坐标系中的运行轨迹,包括实际轨迹和期望轨迹;

5、步骤1.1期望轨迹

6、机器人在三维空间中的期望轨迹状态ξr(t)由期望位置ξr(t)和期望角度θr(t)组成,即ξr(t)=[ξr(t),θr(t)]t,此时

7、ξr(t)=[ξxr(t),ξyr(t),ξzr(t)]t (1)

8、θr(t)=[θxr(t),θyr(t),θzr(t)]t (2)

9、其中,t表运行示时间索引,下角标x,y和z分别是x轴、y轴和z轴的符号标记,下角标r表示机器人的期望状态,即,ξxr(t),ξyr(t)和ξzr(t)分别表示机器人的末端执行器在x轴、y轴和z轴上的期望位置,θxr(t),θyr(t)和θzr(t)分别表示机器人的末端执行器在x轴、y轴和z轴上的期望角度,上角标t表示矩阵转置;机器人在三维空间中期望轨迹状态的速度状态表示为表示机器人在时刻t的期望速度,表示机器人在时刻t的期望角速度;

10、步骤1.2实际轨迹

11、机器人在三维空间中的实际轨迹状态ξ(t)由实际位置状态ξ(t)和实际角度状态θ(t)组成,即ξ(t)=[ξ(t),θ(t)]t,此时

12、ξ(t)=[ξx(t),ξy(t),ξz(t)]t (3)

13、θ(t)=[θx(t),θy(t),θz(t)]t (4)

14、式中,ξx(t),ξy(t)和ξz(t)分别表示机器人的末端执行器在x轴、y轴和z轴上的实际位置,θx(t),θy(t)和θz(t)分别表示机器人的末端执行器在x轴、y轴和z轴上的实际角度;此时,机器人在三维空间中实际速度状态表示为表示ξ(t)在时刻t对应的速度状态,表示θ(t)在时刻t对应的角速度状态;

15、步骤1.3实际轨迹与期望轨迹之间的误差

16、将跟踪误差与扰流误差统一称为状态误差e(t),满足关系

17、e(t)=ξr(t)-ξ(t) (5)

18、此时,状态误差的一阶导数为速度误差表示为

19、

20、设计一个适当的策略来计算速度校本文档来自技高网...

【技术保护点】

1.基于学习的大扰流环境中机器人稳定跟踪控制方法,其特征在在于,具体步骤如下:

【技术特征摘要】

1.基于学习的大扰流环境中机器人稳定跟踪...

【专利技术属性】
技术研发人员:欧勇盛师宝蔡海洋曲光昱陈翡
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1