当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于轨迹预测的自主水下航行器目标跟踪控制方法技术

技术编号:36513117 阅读:9 留言:0更新日期:2023-02-01 15:42
本发明专利技术公开了一种基于轨迹预测的自主水下航行器目标跟踪控制方法,基于TPENN神经网络进行目标轨迹预测,得到预测的逃逸目标轨迹;根据预测的逃逸目标轨迹,基于深度强化进行动态目标跟踪控制,实现安全避障、水流补偿和轨迹跟踪。本发明专利技术将轨迹预测问题转化为时间序列的预测问题,将TPENN神经网络模型引入目标轨迹预测之中,利用TPENN神经网络挖掘轨迹数据的内部相关性,解决轨迹预测难题;在动态逃逸目标轨迹预测的基础上,针对自主水下航行器非线性模型不确定特性和水流影响,借助强化学习方法的非线性、强学习,不依赖模型的特性,同时引入深度学习算法克服强化学习的维度灾难问题,从而实现航行器自主动态目标跟踪控制。制。制。

【技术实现步骤摘要】
一种基于轨迹预测的自主水下航行器目标跟踪控制方法


[0001]本专利技术属于水下航行器控制
,具体涉及一种基于轨迹预测的自主水下航行器目标跟踪控制方法。

技术介绍

[0002]深海水下追踪与博弈是未来水下无人战争的重要形式。自主水下航行器自带能源动力、航行范围广而深的特性,使其成为水下无人战争的重要载体,在海洋工程与海防军事领域有着十分广泛的应用前景,发挥着不可代替的作用。特别是基于水下动态目标跟踪控制技术,在国家海防安全领域得到高度关注,是水下逃逸目标追踪控制、敌对目标拦截围捕及各种水下博弈对抗研究的关键与核心技术。
[0003]目标跟踪是指自主水下航行器在控制律的激励下持续跟踪轨迹连续变化的目标,强调在指定时间到达指定位置,是一种严格考虑时间约束的动态跟踪。由于自主水下航行器自身非线性和模型不确定性的存在,早期普遍使用的PID控制、反步控制等依赖自主水下航行器模型的控制策略,很难实现精确的水下目标跟踪。近年来,针对自主水下航行器非线性和模型不确定性特性,新型变结构滑模控制、自适应控制、智能控制等得到了广泛关注。
[0004]然而,在水下目标跟踪控制研究中,通常将自主水下航行器的性能设置为与目标性能相同,甚至更优,采用跟随的方式能够实现对目标的跟踪。当自主水下航行器的性能比逃逸目标更差时,再采用跟随的方式很难实现目标跟踪。自主水下航行器系统本身的非线性、强耦合、模型不确定特性,水下海流及外界扰动因素影响,使得准确有效的自主水下航行器目标跟踪控制律的设计非常困难。现有控制策略中,要么将自主水下航行器简化为线性系统,要么训练样本难获取,无法满足在线跟踪目标的需求。因此,自主水下航行器在复杂海洋环境下的动态目标跟踪控制仍有很大的提升空间。

技术实现思路

[0005]本专利技术所要解决的技术问题是针对上述现有技术的不足,提供一种基于轨迹预测的自主水下航行器目标跟踪控制方法。
[0006]为实现上述技术目的,本专利技术采取的技术方案为:一种基于轨迹预测的自主水下航行器目标跟踪控制方法,包括步骤1、基于TPENN神经网络进行目标轨迹预测,得到预测的逃逸目标轨迹;步骤2、根据预测的逃逸目标轨迹,基于深度强化进行动态目标跟踪控制,实现安全避障、水流补偿和轨迹跟踪。
[0007]为优化上述技术方案,采取的具体措施还包括:上述的步骤1将逃逸目标当前时刻t时间序列轨迹坐标输入已学习的TPENN神经网络,得到逃逸目标未来时刻的预测轨迹坐标。
[0008]上述的TPENN神经网络包括输入层、隐含层、输出层和承接层;其中,承接层的激活函数为恒等函数,用于存储记忆隐含层单元上一时刻的输出,
当作一步延时算子;假设在时刻t,TPENN神经网络的输入是 U(t),隐含层的输出为 X(t), 整个网络的输出为Y(t),分别表示输入层与隐含层、承接层与隐含层、隐含层与输出层之间的连接权值,b和c分别代表隐含层和输出层的偏置,则神经网络的计算过程表示为
ꢀꢀꢀꢀꢀ
(6)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)神经网络采用时间反向传播算法进行学习和训练,其目标函数为
ꢀꢀ
(8)表示预期的输出;由于神经网络的输入是具有时间序列的历史数据,因此引入时间回归因子得到神经网络改进后的目标函数得到神经网络改进后的目标函数
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)其中,表示是打折率, 表示样本数量,表示迭代次数。
[0009]上述的TPENN神经网络的学习方式为:输入训练样本数据,根据BPTT算法,得到的偏导数, 其权重计算如式(11)所示:
ꢀꢀꢀꢀꢀ
(11)是学习步长;学习步长;分别表示第j层输出层的误差、第i层输入层的误差;通过神经网络的训练,得到TPENN神经网络的各项参数。
[0010]上述的步骤1通过水下声呐与光学传感器得到逃逸目标所有历史时刻位姿数据,作为TPENN神经网络学习训练样本。
[0011]上述的步骤2所述控制过程具体为:从预测的逃逸目标轨迹中获取期望的自主水下航行器位姿矢量
Elman Neural Network)神经网络模型引入目标轨迹预测之中,利用TPENN神经网络挖掘轨迹数据的内部相关性,解决轨迹预测难题;在动态逃逸目标轨迹预测的基础上,针对自主水下航行器非线性模型不确定特性和水流影响,借助强化学习方法的非线性、强学习,不依赖模型的特性,同时引入深度学习算法克服强化学习的维度灾难问题,从而实现航行器自主动态目标跟踪控制。
附图说明
[0017]图1为本专利技术的逃逸目标位置计算图;图2为本专利技术的TPENN 学习训练与运动轨迹预测生成图;图3为本专利技术的深度强化学习目标跟踪控制图;图4为本专利技术的DRL深度强化学习控制模型图;图5为本专利技术的TPENN轨迹预测流程图。
具体实施方式
[0018]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。
[0019]本专利技术中的步骤虽然用标号进行了排列,但并不用于限定步骤的先后次序,除非明确说明了步骤的次序或者某步骤的执行需要其他步骤作为基础,否则步骤的相对次序是可以调整的。可以理解,本文中所使用的术语“和/或”涉及且涵盖相关联的所列项目中的一者或一者以上的任何和所有可能的组合。
[0020]如图1

5所示,一种基于轨迹预测的自主水下航行器目标跟踪控制方法,包括:步骤1、基于TPENN神经网络进行目标轨迹预测,得到预测的逃逸目标轨迹;由于自主水下航行器和逃逸目标的航行速度不同,特别是逃逸目标航行速度快时,如果只是对动态目标被动跟随,很难跟踪上目标,这时需要准确预测逃逸目标未来的逃逸路径,实现主动跟踪。
[0021]在水下动态目标跟踪控制中,逃逸目标的运动状态具有一定的连续性,其运动轨迹不会发生跳变,这就说明其在某一时刻的位置与过去时刻的位置具有一定的相关性。
[0022]在目标之前的轨迹上按照一定的时间间隔选取若干个位置点,根据轨迹连续性的性质,利用前若干时刻的位置,对下一时刻的位置进行预测。
[0023]在本专利技术中将轨迹预测问题转化为时间序列的预测问题,将TPENN(Time Profit Elman Neural Network)神经网络模型引入目标轨迹预测之中,利用TPENN神经网络挖掘轨迹数据的内部相关性,解决轨迹预测难题。具体方法如下:逃逸目标坐标获取如图1所示,通过水下声呐与光学传感器,自主水下航行器与目标物及各类障碍物每一时刻的相对距离是确定的,根据坐标变换可以得到逃逸目标在每个时刻的位置坐标,从而得到逃逸目标所有历史时刻位姿数据,进而得到轨迹预测神经网络学习训练样本。
[0024]设为逃逸目标在惯性栅格坐标系中的坐标,为自主水下航行器在惯性栅本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于轨迹预测的自主水下航行器目标跟踪控制方法,其特征在于,包括步骤1、基于TPENN神经网络进行目标轨迹预测,得到预测的逃逸目标轨迹;所述TPENN神经网络包括输入层、隐含层、输出层和承接层;其中,承接层的激活函数为恒等函数,用于存储记忆隐含层单元上一时刻的输出,当作一步延时算子;假设在时刻t,TPENN神经网络的输入是U(t),隐含层的输出为 X(t),整个网络的输出为Y(t),分别表示输入层与隐含层、承接层与隐含层、隐含层与输出层之间的连接权值,b和c分别代表隐含层和输出层的偏置,则神经网络的计算过程表示为:
ꢀꢀꢀꢀ
(6)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)神经网络采用时间反向传播算法进行学习和训练,其目标函数为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)表示预期的输出;由于神经网络的输入是具有时间序列的历史数据,因此引入时间回归因子得到神经网络改进后的目标函数神经网络改进后的目标函数
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)其中,表示是打折率, 表示样本数量, 表示迭代次数;步骤2、根据预测的逃逸目标轨迹,基于深度强化进行动态目标跟踪控制,实现安全避障、水流补偿和轨迹跟踪;步骤2所述控制过程具体为:从预测的逃逸目标轨迹中获取期望的自主水下航行器位姿矢量,与自主水下航行器当前状态矢量比较,产生航向以及位置轨迹误差,并与自主水下航行器的状态信息整合生成状态误差向量,输入DRL深度强化学习模型中,根据强化学习算法输出最优的运动速度控制信号矢量,并与自主水下航行器输出速度信号矢量比较,产生自主水下航行器跟踪速度误差,输入变结构滑模动力学跟踪控制器SMC,由此产生自主水下航行器的动力学推进控制信号,驱动自主水下航行器的速度矢量矩阵跟踪自主水下航行器跟踪的运动学速度控制信号,通过坐标转换得到AUV实际位姿矢量
,从而实现自主水下航行器对动态目标的高效精准跟踪;其中,分别为自主水下航行器在惯性坐标系中期望的位置;分别为自主水下航行器对惯性坐标系中期望的横倾角、纵倾角和艏向角;分别为自主水下航行器在惯性坐标系中当前的位置;分别为自主水下航行器对惯性坐标系中当前的横倾角、纵倾角和艏向角;分别为自主水下航行器线速度矢量在载体坐标系中的3个分量;分别为自主水下航行器角速度矢量在载体坐标系中的3个分量。2.根据权利要求1所述的一种基于轨迹预测的自主水下航行器目标跟踪控制方法,其特...

【专利技术属性】
技术研发人员:曹翔孙长银吴巧云
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1