一种行李车的导航控制系统及控制方法技术方案

技术编号:35429607 阅读:8 留言:0更新日期:2022-11-03 11:33
本发明专利技术公开了一种行李车的导航控制系统及控制方法,所述系统包括人机交互单元、感知单元、路径规划单元和控制单元;路径规划单元根据获得的目标位置信息、环境信息和行李车的状态信息进行路径规划,当行李车检测不到动态障碍物时,则生成全局路径规划;当检测到动态障碍物时;根据机器学习算法生成局部路径规划;并将路径规划发送给控制单元及人机交互单元;控制单元根据路径规划的结果,控制行李车运送行李,用户可通过人机交互单元查看路径规划信息,并跟随行李车运行到目标位置,实现行李车的自动避障控制。本发明专利技术可实现行李车与用户携带的移动终端保持恒定的距离,生成平滑、安全高效的路径轨迹,实现有效的动态避障。实现有效的动态避障。实现有效的动态避障。

【技术实现步骤摘要】
一种行李车的导航控制系统及控制方法


[0001]本专利技术属于自动化
,尤其涉及一种行李车的导航控制系统及控制方法。

技术介绍

[0002]行李车能够帮助人们在出行或者工作中搬运各种行李物品,减轻乘客搬运负担,解放双手。然而现有的行李车多需要手推,这样不仅需要较多的人力付出,且人们在推车前行时由于双手被占用,因此很难同时去做别的事。而自动行李车也存在不能很好的跟随用户、避障及路径规划能力不足,容易陷入局部最优,导致碰撞或绕路等情况。

技术实现思路

[0003]本专利技术的目的在于提供一种行李车的导航控制系统及控制方法。能够实现行李车自动跟随、自动避障。
[0004]本专利技术的技术方案如下:一种行李车的导航控制系统,该系统包括:人机交互单元、感知单元、路径规划单元和控制单元;人机交互单元包括显示屏和语音输入模块,显示屏用于显示环境地图和路径规划信息;语音输入模块用于与用户进行语音交互,实现行李车的启动和停止,实现语音咨询功能;感知单元包括激光雷达、视觉传感器和车载状态传感器,通过激光雷达、视觉传感器和车载状态传感器获得行李车周围的环境信息、障碍物信息和行李车的状态信息,并构建环境地图;路径规划单元用于根据获得的行李车周围的环境信息、障碍物信息和行李车的状态信息进行路径规划,路径规划包括全局路径规划和局部路径规划,当行李车检测不到动态障碍物时,则根据全局路径规划行驶;当检测到动态障碍物时,则根据局部路径规划行驶;其中局部路径规划包括根据环境地图和检测的动态障碍物信息,对动态障碍物进行预测,并基于环境地图、障碍物预测结果、当前点和目标点的位置,在状态空间生成运动到多个轨迹状态的采样空间,并生成多个轨迹状态对应的多个控制动作;基于机器学习算法获得多个控制动作中的每个控制动作的预期奖赏,通过评价函数给路径评分,获得评分最高的轨迹为局部最优路径;并将路径规划发送给控制单元及人机交互模块;控制单元根据路径规划的结果,控制行李车运送行李,用户可通过显示屏查看路径规划信息,并跟随行李车运行到目标位置,实现行李车的自动避障控制。
[0005]进一步的,所述机器学习算法包括Actor网络和Critic网络,Actor网络用于确定路径状态对应的控制动作,形成新的运动状态;Critic网络用于基于给定的路径状态确定控制动作的奖赏;Actor网络根据当前粒子观测状态s和目标g选择合适的控制动作a,通过计算奖赏函数获得预期奖赏r后,状态从s转移到s

,将s,g,a,r,s

组合为一个元组X=(s,g,a,r,s

),并将其存放在经验回放池中;累积每步动作的预期奖赏来计算评价函数,,其中E为数学期望,为代价因子;根据贝尔曼方程迭代直至策略
参数收敛至最优;贝尔曼方程描述如下:,为t时刻行李车的观测状态,为控制策略在状态下的奖赏;为状态转移概率;为使状态得到最高奖赏的策略。
[0006]进一步,所述系统还包括:感知单元感知环境中的障碍物信息,并根据障碍物信息和行李车与用户携带的终端设备的距离,控制行李车的速度。
[0007]本专利技术提供一种行李车的导航控制方法,其特征在于,该方法包括如下步骤:步骤1:通过感知单元中的激光雷达、视觉传感器和车载状态传感器获得行李车周围的环境信息、障碍物信息和行李车的状态信息,并构建环境地图;步骤2:获取人机交互单元设置的目标位置;路径规划单元根据获得的目标位置信息、环境信息、障碍物信息和行李车的状态信息进行路径规划,路径规划包括全局路径规划和局部路径规划,当行李车检测不到动态障碍物时,则根据全局路径规划行驶;当检测到动态障碍物时,则根据局部路径规划行驶;其中局部路径规划包括根据环境地图和检测的动态障碍物信息,对动态障碍物进行预测,并基于环境地图、障碍物预测结果、当前点和目标点的位置,在状态空间生成运动到多个轨迹状态的采样空间,并生成多个轨迹状态对应的多个控制动作;基于机器学习算法获得多个控制动作中的每个控制动作的预期奖赏,通过评价函数给路径评分,获得评分最高的轨迹为局部最优路径;并将路径规划发送给控制单元及人机交互模块;步骤3:控制单元根据路径规划的结果,控制行李车运送行李,用户可通过人机交互模块的显示屏查看路径规划信息,并跟随行李车运行到目标位置,实现行李车的自动避障控制。
[0008]进一步的,所述机器学习算法包括Actor网络和Critic网络,Actor网络用于确定路径状态对应的控制动作,形成新的运动状态;Critic网络用于基于给定的路径状态确定控制动作的奖赏;Actor网络根据当前粒子观测状态s和目标g选择合适的控制动作a,通过计算奖赏函数获得预期奖赏r后,状态从s转移到s

,将s,g,a,r,s

组合为一个元组X=(s,g,a,r,s

),并将其存放在经验回放池中;累积每步动作的预期奖赏来计算评价函数,,其中E为数学期望,为代价因子;根据贝尔曼方程迭代直至策略参数收敛至最优;贝尔曼方程描述如下:,为t时刻行李车的观测状态,为控制策略在状态下的奖赏;为状态转移概率;为使状态得到最高奖赏的策略。
[0009]优选的,所述方法包括:通过感知单元感知环境中障碍物信息,根据障碍物信息和行李车与用户携带的终端设备的距离,控制行李车的速度。
[0010]优选的,所述全局路径规划基于改进的群优化算法生成,具体步骤包括:步骤2.1
对地图进行栅格化;每个栅格为可行驶或障碍物两种状态;对粒子种群进行初始化,包括种群规模、初始位置、初始速度及迭代次数;根据起点和目标点,生成多组初始路径点集,即多个粒子;步骤2.2使用适应度函数计算粒子适应度;步骤2.3更新粒子位置和速度;步骤2.4根据适应度函数,得到个体最优值和全局最优值;步骤2.5重复步骤2.2至步骤2.4,直到达到最大迭代次数;步骤2.6输出全局最优解;步骤2.7取输出的最优解作为路径点;使用三次样条处理路径点插值以生成平滑路径。
[0011]进一步的,所述适应度函数为:;其中X
k
={,,

,},X
k
为第k个粒子,每个粒子为一条路径,为第k个粒子的第i路径点,常数,,为避障函数,;其中为邻近路径点向量到障碍物中心的距离,表示第j个障碍物的半径,为障碍物的膨胀因子;为路径距离函数,,其中为起始点到终点的距离,为路径长度;为路径平滑度函数,,,i=1,2,

,n,其中为相邻路径的角度变化,范围为[0,π];为耗能函数,;;;其中,为路径点,分别表示路径点的坐标,为路径点的地势高度;>1>。
[0012]本专利技术提供的一种行李车导航控制系统及控制方法,具有如下有益效果:1、行李车能够与用户携带的移动终端保持恒定的距离。2、采用改进的群优化算法获得全局最优路径,对粒子群优化算法的适应度函数进行改进,通过对适应度函数的设置,考虑路径的耗能、避障能力、路径平滑度、路径长度、路径的堵塞程度,生成更加本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行李车的导航控制系统,其特征在于,该系统包括:人机交互单元、感知单元、路径规划单元和控制单元;人机交互单元包括显示屏和语音输入模块,显示屏用于显示环境地图和路径规划信息;语音输入模块用于与用户进行语音交互,实现行李车的启动和停止,实现语音咨询功能;感知单元包括激光雷达、视觉传感器和车载状态传感器,通过激光雷达、视觉传感器和车载状态传感器获得行李车周围的环境信息、障碍物信息和行李车的状态信息,并构建环境地图;路径规划单元用于根据获得的行李车周围的环境信息、障碍物信息和行李车的状态信息进行路径规划,路径规划包括全局路径规划和局部路径规划,当行李车检测不到动态障碍物时,则根据全局路径规划行驶;当检测到动态障碍物时,则根据局部路径规划行驶;其中局部路径规划包括根据环境地图和检测的动态障碍物信息,对动态障碍物进行预测,并基于环境地图、障碍物预测结果、当前点和目标点的位置,在状态空间生成运动到多个轨迹状态的采样空间,并生成多个轨迹状态对应的多个控制动作;基于机器学习算法获得多个控制动作中的每个控制动作的预期奖赏,通过评价函数给路径评分,获得评分最高的轨迹为局部最优路径;并将路径规划发送给控制单元及人机交互模块;控制单元根据路径规划的结果,控制行李车运送行李,用户可通过显示屏查看路径规划信息,并跟随行李车运行到目标位置,实现行李车的自动避障控制。2.根据权利要求1所述的控制系统,其特征在于,所述机器学习算法包括Actor网络和Critic网络,Actor网络用于确定路径状态对应的控制动作,形成新的运动状态;Critic网络用于基于给定的路径状态确定控制动作的奖赏;Actor网络根据当前粒子观测状态s和目标g选择合适的控制动作a,通过计算奖赏函数获得预期奖赏r后,状态从s转移到s

,将s,g,a,r,s

组合为一个元组X=(s,g,a,r,s

),并将其存放在经验回放池中;累积每步动作的预期奖赏来计算评价函数,,其中E为数学期望,为代价因子,为状态的控制策略;根据贝尔曼方程迭代直至策略参数收敛至最优;贝尔曼方程描述如下:,为t时刻行李车的观测状态,为控制策略在状态下的奖赏;为状态转移概率;为使状态得到最高奖赏的策略。3.根据权利要求1所述的控制系统,其特征在于,所述系统包括:感知单元感知环境中的障碍物信息,并根据障碍物信息和行李车与用户携带的终端设备的距离,控制行李车的速度。4.根据权利要求1所述的控制系统,其特征在于,所述路径规划单元基于改进的群优化算法生成全局路径规划,具体步骤包括:1)对地图进行栅格化;每个栅格为可行驶状态或障碍物状态;对粒子种群进行初始化,包括种群规模、初始位置、初始速度及迭代次数;根据起点和目标点,生成多组初始路径点集,即多个粒子;2)使用适应度函数计算粒子适应度;3)更新粒子位置和速度;4)根据适应度函数,得到个体最优值和全局最优值;5)重复步骤2至
4,直到达到最大迭代次数;6)输出全局最优解;7)取输出的最优解作为路径点;使用三次样条处理路径点插值以生成平滑路径。5.根据权利要求4所述的控制系统,其特征在于,所述适应度函数为:;其中X
k
={,,

,},X
k
为第k个粒子,每个粒子为一条路径,为第k个粒子的第i路径点,常数,,为避障函数,;其中为邻近路径点向量到障碍物中心的距离,表示第j个障碍物的半径,为障碍物的膨胀因子;为路径距离函数,,其中为起始点到终点的距离,为路径长度;为路径平滑度函数,,,i=1,2,

,n,其中为相邻路径的角度变化,范围为[0,π];为耗能函数,;;;其中为耗能系数,为路径点,分别表示路径点的坐标,为路径点的地势高度; >1>,其中为上坡时的耗能系数,为下坡...

【专利技术属性】
技术研发人员:马列马海兵沈亮马琼
申请(专利权)人:江苏天一航空工业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1