基于多策略联合控制智能体的环境地图构建方法及装置制造方法及图纸

技术编号:33349922 阅读:45 留言:0更新日期:2022-05-08 09:53
本发明专利技术涉及一种基于多策略联合控制智能体的环境地图构建方法及装置,主要分为边界检测、全局探测和地图构建三个阶段。首先,采用改进的沿墙走策略探测未知环境的边界;其次,将边界包围的区域划分成栅格,利用简化的螺旋遍历策略依次将每个栅格中随机选取的目标点作为智能体运动的终点,并结合D*Lite算法控制智能体移动,减少完成未知环境全局探测的时间;最后,分别通过占位栅格地图算法和RBF神经网络生成未知环境的障碍物分布和浓度场分布。本发明专利技术通过联合多种策略控制智能体实现对整个未知环境的探测,提高了计算效率,能够完整、准确地构建出环境地图。确地构建出环境地图。确地构建出环境地图。

【技术实现步骤摘要】
基于多策略联合控制智能体的环境地图构建方法及装置


[0001]本专利技术属于信息科学与环境科学交叉领域,具体涉及一种基于多策略联合控制智能体的环境地图构建方法及装置。

技术介绍

[0002]环境监测对公众安全和生态系统的可持续性具有重要意义。污染源定位是环境监测应用中最关键的问题之一。通过定位污染源,可以及时采取有效措施阻止污染的进一步扩大、降低有害物质泄露的风险。近年来,基于智能体实现污染源的自动搜索和定位成为了新的研究方向。智能体污染源定位过程中涉及避障、路径规划等问题,需要事先知道监测环境的具体信息。而实际应用过程中,监测环境大多是未知的,这就需要通过智能算法控制智能体运动,快速、准确地构建环境地图。
[0003]环境地图构建是智能体利用自身携带的传感器探测环境信息并建立可识别模型的过程。目前,环境地图构建方法大致可以分为三类:基于几何地图的方法、基于拓扑地图的方法和基于栅格地图的方法。前两类方法在精度和实时性方面难以满足实际应用需求,而基于栅格地图的方法没有上述限制,可用于智能体的定位与导航,是当前应用最广泛的方法。基于栅格地图的方法主要包括快速SLAM(Simultaneous Localization And Mapping,同步定位与地图构建)、微型SLAM和Cartographer算法等。然而,上述三种方法都涉及运动估计和更新匹配,无法同时保证鲁棒性和计算效率,难以满足实际应用需求。此外,D*Lite算法常被用于未知环境下的动态路径规划,但该方法只能探测事先规划路径附近的栅格区域,无法完整探测整个环境,也无法解决目标点未知的情况。为了尽可能探测环境,往往需要多次应用,造成部分环境重复探测,降低了算法的计算效率。

技术实现思路

[0004]本专利技术要解决的技术问题在于,针对现有方法存在计算效率低、构建地图不完整等问题,提供一种能有效兼顾准确性与时效性的新方法。为实现该技术目的,本专利技术的技术方案是提供一种基于多策略联合控制智能体的环境地图构建方法及装置。
[0005]根据本专利技术的一个方面,本专利技术提供了一种基于多策略联合控制智能体的环境地图构建方法,包括以下步骤:
[0006]步骤S1:基于智能体感知模型,采用改进的沿墙走策略控制智能体沿未知环境的边界运动一周进行边界检测,根据边界检测过程中智能体的位姿和激光雷达的测量数据分析得到未知环境的边界;
[0007]步骤S2:将边界包围的区域划分为多个栅格,在每个栅格中随机选取一个目标点,采用简化的螺旋遍历策略依次将各所述目标点作为智能体运动的终点;
[0008]步骤S3:采用D*Lite算法动态规划智能体到达每个终点的路径,智能体按照规划轨迹依次到达目标点,进行全局探测;
[0009]步骤S4:基于全局探测过程中智能体的位姿和激光雷达的测量数据,采用占位栅
格地图算法生成未知环境的障碍物分布图;
[0010]步骤S5:基于智能体运动过程中记录的自身的位置信息和采集的污染物浓度对RBF神经网络进行训练,训练完成后,采用训练好的RBF神经网络拟合生成未知环境的浓度分布图;
[0011]步骤S6:结合障碍物分布图和浓度分布图,生成环境地图,完成未知环境的地图构建。
[0012]优选地,步骤S1中,所述智能体是一个搭载了两个超声波传感器、一个激光雷达、一个浓度传感器和一个光电编码器的移动载体;两个所述超声波传感器分别位于所述智能体的前方与右侧,用于探测前方和右侧是否有障碍物;所述浓度传感器、所述激光雷达和所述光电编码器处在智能体的中心位置,浓度传感器用于采集污染物浓度,激光雷达用于扫描整个环境并计算探测障碍物分布情况,光电编码器用于计算智能体的位姿,包括坐标和角度。
[0013]优选地,步骤S1中,所述改进的沿墙走策略包括:
[0014]将智能体放置在任意边界点处,前后向与边界平行,根据超声波传感器探测距离的结果控制智能体前进或转向,保证沿运动方向智能体始终在边界的左侧。
[0015]优选地,步骤S1中,所述改进的沿墙走策略包括:
[0016]令超声波传感器i的标志位为U
i
,取值为:
[0017][0018]其中,l是距离阈值,d是智能体与边界之间的距离,当U
i
取值为1时,则超声波传感器i朝向存在边界,反之,则没有边界;
[0019]智能体检测到不同的边界情况时,标志位U1U2有四种组合,即00、01、10和11;
[0020]设智能体当前运动方向是J,取值范围为0~3,分别对应下、右、上、左四个方向,则根据标志位组合控制智能体运动方向变化的公式为:
[0021][0022]其中ΔJ是运动方向变化值,即新的运动方向与当前运动方向取值的差值。
[0023]优选地,步骤S2中,所述简化的螺旋遍历策略包括:
[0024]选择顺时针方向,依次将各所述目标点作为智能体运动的终点,且保证每个栅格中的目标点仅能被访问一次。
[0025]优选地,步骤S4包括:
[0026]全局探测过程中设置激光雷达的扫描角度范围是

23
°
到23
°
,步进角为2.86
°
,即激光雷达的扫描范围被分为16个不同的扫描角度;
[0027]通过激光雷达扫描得到激光光束覆盖范围内的测量数据,采用占位栅格算法计算未知环境中每个点被障碍物占用的概率p(I|z
t
),具体公式为:
[0028][0029]其中,I表示被扫描的点,z
t
是在t时刻激光雷达的测量数据和智能体的位姿的集合,r
max
是激光雷达能够探测的最远距离,r
I
是激光雷达中心到I的距离,φ
I
是激光雷达与I之间的相对角度,φ
k
是与φ
I
最接近的扫描角度,k是该扫描角度的索引号,r
k
是φ
k
方向上激光雷达的探测距离,β为扫描的步进角,p
min
和p
max
是常数,满足0<p
min
<0.5<p
max
<1;
[0030]根据每个点被障碍物占用的概率更新t时刻I的置信度,并基于置信度计算占位概率,具体公式为:
[0031][0032]其中,C
t,I
和C
t

1,I
分别是t时刻和t

1时刻I的置信度,初始置信度C
0,I
=0,p
I
是I的占位概率,占位概率越接近0,I越可能为自由区域;反之,占位概率越接近1,I越可能为障碍物区域;
[0033]智能体按规划路径运动中不断更新激光雷达探测到的各个点的占位概率,生成未知环境的障碍物分布图。
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多策略联合控制智能体的环境地图构建方法,其特征在于,包括以下步骤:步骤S1:基于智能体感知模型,采用改进的沿墙走策略控制智能体沿未知环境的边界运动一周进行边界检测,根据边界检测过程中智能体的位姿和激光雷达的测量数据分析得到未知环境的边界;步骤S2:将边界包围的区域划分为多个栅格,在每个栅格中随机选取一个目标点,采用简化的螺旋遍历策略依次将各所述目标点作为智能体运动的终点;步骤S3:采用D*Lite算法动态规划智能体到达每个终点的路径,智能体按照规划轨迹依次到达目标点,进行全局探测;步骤S4:基于全局探测过程中智能体的位姿和激光雷达的测量数据,采用占位栅格地图算法生成未知环境的障碍物分布图;步骤S5:基于智能体运动过程中记录的自身的位置信息和采集的污染物浓度对RBF神经网络进行训练,训练完成后,采用训练好的RBF神经网络拟合生成未知环境的浓度分布图;步骤S6:结合障碍物分布图和浓度分布图,生成环境地图,完成未知环境的地图构建。2.如权利要求1所述的基于多策略联合控制智能体的环境地图构建方法,其特征在于,步骤S1中,所述智能体是一个搭载了两个超声波传感器、一个激光雷达、一个浓度传感器和一个光电编码器的移动载体;两个所述超声波传感器分别位于所述智能体的前方与右侧,用于探测前方和右侧是否有障碍物;所述浓度传感器、所述激光雷达和所述光电编码器处在智能体的中心位置,浓度传感器用于采集污染物浓度,激光雷达用于扫描整个环境并计算探测障碍物分布情况,光电编码器用于计算智能体的位姿,包括坐标和角度。3.如权利要求1所述的基于多策略联合控制智能体的环境地图构建方法,其特征在于,步骤S1中,所述改进的沿墙走策略包括:将智能体放置在任意边界点处,前后向与边界平行,根据超声波传感器探测距离的结果控制智能体前进或转向,保证沿运动方向智能体始终在边界的左侧。4.如权利要求1所述的基于多策略联合控制智能体的环境地图构建方法,其特征在于,步骤S1中,所述改进的沿墙走策略包括:令超声波传感器i的标志位为U
i
,取值为:其中,l是距离阈值,d是智能体与边界之间的距离,当U
i
取值为1时,则超声波传感器i朝向存在边界,反之,则没有边界;智能体检测到不同的边界情况时,标志位U1U2有四种组合,即00、01、10和11;设智能体当前运动方向是J,取值范围为0~3,分别对应下、右、上、左四个方向,则根据标志位组合控制智能体运动方向变化的公式为:其中ΔJ是运动方向变化值,即新的运动方向与当前运动方向取值的差值。
5.如权利要求1所述的基于多策略联合控制智能体的环境地图构建方法,其特征在于,步骤S2中,所述简化的螺旋遍历策略包括:选择顺时针方向,依次将各所述目标点作为智能体运动的终点,且保证每个栅格中的目标点仅能被访问一次。6.如权利要求1所述的基于多策略联合控制智能体的环境地图构建方法,其特征在于,步骤S4包括:全局探测过程中设置激光雷达的扫描角度范围是

23
°
到23
°
,步进角为2.86
°
,即激光雷达的扫描范围被分为16个不同的扫描角度;通过激光...

【专利技术属性】
技术研发人员:王勇肖德虎王博陈珺
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1