System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种拖拉机自动导航方法、装置、设备、介质及拖拉机制造方法及图纸_技高网

一种拖拉机自动导航方法、装置、设备、介质及拖拉机制造方法及图纸

技术编号:41824524 阅读:13 留言:0更新日期:2024-06-24 20:37
本发明专利技术涉及一种拖拉机自动导航方法、装置、设备、介质及拖拉机,该方法包括:根据各个目标点的位置信息、当前时隙每个所述目标点的追踪标识、当前时隙位于所述拖拉机的指定区域内的目标点的合并信息素和当前时隙所述拖拉机的当前位置信息,构建当前时隙所述拖拉机的状态空间;根据当前时隙所述拖拉机的状态空间,通过预先基于马尔可夫决策过程训练的自动导航模型,得到所述拖拉机在当前时隙对应的动作空间,以根据所述动作空间在所述待作业农田中进行自动导航。通过本发明专利技术的方法,在面对大规模农场以及复杂的地形条件时,运输拖拉机能够通过自适应导航到达各路径点,并且依次完成运输作业。

【技术实现步骤摘要】

本专利技术涉及农用机械,具体而言,本专利技术涉及一种拖拉机自动导航方法、装置、设备、介质及拖拉机


技术介绍

1、现有的无人驾驶农机主要基于路径规划,通过规划路径点信息来解决农机的自主作业问题。然而,该种方法由于适应性较差,在运输拖拉机动态不确定性的环境中应用并不实际。因此,针对运输拖拉机不确定性的作业场景,亟需通过农机感知周围环境,并自主做出决策来实现运输拖拉机的自动驾驶。

2、传统动态规划算法由于随着地块规模以及复杂度的上升,其规划难度也呈指数增加,这降低了动态规划的效率以及应用范围。由此,现有技术中,。亟需一种结合农机的周围环境进行自动导航的方案。


技术实现思路

1、本专利技术所要解决的技术问题是提供了一种拖拉机自动导航方法、装置及设备,旨在解决上述至少一个技术问题。

2、第一方面,本专利技术解决上述技术问题的技术方案如下:一种拖拉机自动导航方法,该方法包括:

3、获取拖拉机对应的待作业农田中各个目标点的位置信息、当前时隙每个所述目标点的追踪标识、当前时隙所述拖拉机的当前位置信息和所述待作业农田的环境信息,对于每个所述目标点,所述追踪标识表征了该目标点是否为所述拖拉机下一个追踪的目标点,所述环境信息表征了所述待作业农田的基础特征;

4、根据所述环境信息和各个所述目标点的位置信息,确定每个所述目标点对应的至少一个信息素,对于每个所述目标点,每个所述信息素表征了该目标点与环境信息之间的关联关系;

5、根据所述拖拉机的当前位置信息和各个所述目标点的信息素,确定当前时隙,位于所述拖拉机的指定区域内的目标点的合并信息素,所述合并信息素包括位于所述指定区域内的每个目标点的信息素,所述待作业农田包括所述指定区域;

6、根据各个目标点的位置信息、当前时隙每个所述目标点的追踪标识、当前时隙位于所述拖拉机的指定区域内的目标点的合并信息素和当前时隙所述拖拉机的当前位置信息,构建当前时隙所述拖拉机的状态空间,所述状态空间表征了所述拖拉机在当前时隙的相对于各个所述目标点的运动状态;

7、根据当前时隙所述拖拉机的状态空间,通过预先基于马尔可夫决策过程训练的自动导航模型,得到所述拖拉机在当前时隙对应的动作空间,以根据所述动作空间在所述待作业农田中进行自动导航,所述动作空间包括所述拖拉机在当前时隙的下一时隙对应的航向角、速度和目标点的身份标识。

8、本专利技术的有益效果是:先基于拖拉机对应的待作业农田中各个目标点的位置信息、当前时隙每个所述目标点的追踪标识、当前时隙所述拖拉机的当前位置信息和所述待作业农田的环境信息,构建当前时隙所述拖拉机的状态空间,通过该状态空间可表征拖拉机在当前时隙的相对于各个所述目标点的运动状态,且状态空间的确定考虑了环境信息的影响,然后基于当前时隙所述拖拉机的状态空间和预先基于马尔可夫决策过程训练的自动导航模型,可确定拖拉机在当前时隙对应的动作空间,以根据所述动作空间在所述待作业农田中进行准确的自动导航。并且,在面对大规模农场以及复杂的地形条件时,运输拖拉机能够通过自适应导航到达各路径点,并且依次完成运输作业。

9、在上述技术方案的基础上,本专利技术还可以做如下改进。

10、进一步,上述所述环境信息包括农田平整度和作业边界,所述根据所述环境信息和各个所述目标点的位置信息,确定每个所述目标点对应的至少一个信息素,包括:

11、对于每个所述目标点,根据所述农田平整度和所述目标点的位置信息,确定所述目标点对应的第一信息素,所述第一信息素表征了该目标点所在区域相对于水平面的起伏位置关系,所述关联关系包括所述起伏位置关系;

12、对于每个所述目标点,根据所述作业边界和所述目标点的位置信息,确定所述目标点对应的第二信息素,所述第二信息素表征了该目标点与所述作业边界的相对位置关系,所述关联关系还包括所述相对位置关系,该目标点对应的至少一个信息素包括所述第一信息素和所述第二信息素。

13、采用上述进一步方案的有益效果是,考虑到了拖拉机在作业过程中分别与农田平整度和作业边界之间的交互信息(第一信息素和第二信息素),从而使得在自动导航过程中,考虑到不同的环境信息的影响,使得导航效果更好。

14、进一步,上述自动导航模型是基于以下方式训练得到的:

15、获取拖拉机在当前时隙对应的状态空间和动作空间;

16、根据当前时隙对应的状态空间和动作空间,对初始模型进行训练,得到所述拖拉机在所述当前时隙的下一时隙对应的动作空间;

17、根据下一时隙对应的动作空间和当前时隙对应的动作空间,确定所述拖拉机到达所述下一时隙对应的目标点的时长;

18、根据所述拖拉机到达所述下一时隙对应的目标点的时长,确定所述拖拉机到达各个所述目标点所花费的实际时长;

19、根据所述实际时长和预设的最大允许任务完成时间,确定所述初始模型的损失函数值;

20、在所述损失函数值满足预设的结束条件时,将满足所述结束条件的初始模型确定为所述自动导航模型,在所述损失函数值不满足所述结束条件时,调整所述初始模型的模型参数,并根据调整后的模型参数重新训练所述初始模型,直到所述损失函数值满足所述结束条件。

21、采用上述进一步方案的有益效果是,在自动导航模型训练的过程中,以最大允许任务完成时间为优化目标,可尽可能提高运输效率,减少运输的时间消耗。

22、进一步,上述初始模型为td3网络模型。

23、采用上述进一步方案的有益效果是,td3网络模型为双延迟深度确定性策略梯度模型,能够实现运输拖拉机的自主高效导航作业。

24、进一步,上述根据所述实际时长和预设的最大允许任务完成时间,确定所述初始模型的损失函数值,包括:

25、根据所述实际时长和预设的最大允许任务完成时间,确定奖励函数值;

26、根据所述奖励函数值,确定所述初始模型的损失函数值。

27、采用上述进一步方案的有益效果是,在模型训练过程中,以奖励函数值的方式衡量训练精度,可更好的训练得到精度较高的模型。

28、进一步,上述环境信息包括作业边界,上述根据所述实际时长和预设的最大允许任务完成时间,确定奖励函数值,包括:

29、根据所述下一时隙对应的动作空间,确定所述拖拉机在下一时隙的位置信息;

30、根据所述拖拉机在下一时隙的位置信息和所述作业边界,确定所述拖拉机是否越过所述作业边界;

31、若所述拖拉机未越过所述作业边界,则根据所述实际时长和预设的最大允许任务完成时间,确定奖励函数值。

32、采用上述进一步方案的有益效果是,在确定奖励函数值的过程中,将拖拉机与作业边界之间的位置关系作为确定奖励函数值的一部分,可更加准确的确定奖励函数值。

33、第二方面,本专利技术为了解决上述技术问题还提供了一种拖拉机自动导航装置,包括:

34、获取模块,用于获取拖拉机对应的待本文档来自技高网...

【技术保护点】

1.一种拖拉机自动导航方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述环境信息包括农田平整度和作业边界,所述根据所述环境信息和各个所述目标点的位置信息,确定每个所述目标点对应的至少一个信息素,包括:

3.根据权利要求1所述的方法,其特征在于,所述自动导航模型是基于以下方式训练得到的:

4.根据权利要求3所述的方法,其特征在于,所述初始模型为TD3网络模型。

5.根据权利要求3所述的方法,其特征在于,所述根据所述实际时长和预设的最大允许任务完成时间,确定所述初始模型的损失函数值,包括:

6.根据权利要求3所述的方法,其特征在于,所述环境信息包括作业边界,所述根据所述实际时长和预设的最大允许任务完成时间,确定奖励函数值,包括:

7.一种拖拉机自动导航装置,其特征在于,包括:

8.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1-6中任一项所述的方法。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6中任一项所述的方法。

10.一种拖拉机,其特征在于,包括如权利要求8所述的电子设备。

...

【技术特征摘要】

1.一种拖拉机自动导航方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述环境信息包括农田平整度和作业边界,所述根据所述环境信息和各个所述目标点的位置信息,确定每个所述目标点对应的至少一个信息素,包括:

3.根据权利要求1所述的方法,其特征在于,所述自动导航模型是基于以下方式训练得到的:

4.根据权利要求3所述的方法,其特征在于,所述初始模型为td3网络模型。

5.根据权利要求3所述的方法,其特征在于,所述根据所述实际时长和预设的最大允许任务完成时间,确定所述初始模型的损失函数值,包括:

6.根据权利要求3...

【专利技术属性】
技术研发人员:国明乾孙鹏王辉李希金孙齐迟宇
申请(专利权)人:潍柴雷沃智慧农业科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1