基于认知搜索策略的多机器人源搜索方案生成方法及系统技术方案

技术编号:32576686 阅读:44 留言:0更新日期:2022-03-09 17:06
本发明专利技术公开了一种基于认知搜索策略的多机器人源搜索方案生成方法及系统,本发明专利技术方法包括建立气体泄漏模型和传感器的探测模型;基于气体泄漏模型和传感器的探测模型,对泄漏源搜索过程建模;运用粒子滤波的方法表示泄漏源搜索过程中源项参数估计的迭代更新,建立基于认知搜索策略的寻源行动方案;针对实际障碍场景对寻源行动方案进行避障功能的改进;针对改进后的寻源行动方案与多机器人控制技术相结合,生成基于认知搜索策略的多机器人源搜索行动方案。本发明专利技术能够实现多机器人的气体泄漏源搜索,考虑到寻源过程中存在的不确定性,利用多机器人协同算法,控制多个机器人在大空间尺度的场景中进行协同寻源,可以有效的提高寻源效率和寻源准确率。效率和寻源准确率。效率和寻源准确率。

【技术实现步骤摘要】
基于认知搜索策略的多机器人源搜索方案生成方法及系统


[0001]本专利技术涉及机器人控制领域,具体涉及一种基于认知搜索策略的多机器人源搜索方案生成方法及系统,可适用于多种气体源搜索场景包括化工园区危害化学品泄漏事故寻源、住宅楼内瓦斯泄漏源搜索等需求。

技术介绍

[0002]各类危害气体泄漏事故的发生,会导致严重的人员伤亡和经济财产损失。为了维护人员安全,避免财产损失,快速的搜索泄漏源位置,并获取源项参数成为一项重要的工作。利用机器人等配备各种传感器的移动设备自主进行源搜索是一种有效的方法,机器人根据传感器采集到的信息一步一步地向泄漏源移动,直到找到泄漏源。在这过程中,如何生成具体的行动方案控制机器人的移动是急需探索的目标。对于气体泄漏源的感知和搜索问题,主要有四种方法可以支持行动方案的生成,即基于梯度的算法、仿生学算法、基于概率和地图的算法以及基于信息论原理的算法。
[0003]纯粹的基于气体浓度梯度的算法是该领域最原始的实现方法。这种方法利用浓度梯度将机器人引导至泄漏源所在位置,但由于真实环境下气体在扩散的过程中分布的不确定性受湍流等因素的影响较大,因此这种方法在真实场景下很难实现。仿生学算法是通过研究动物发现气味来源和进行路径规划的方法来实现的,这种方法同样需要稳定的浓度梯度,多被用于小场景的寻源实验。基于概率和地图的算法将气味源的位置建模为概率分布,通过连续的观测,概率分布将变为狄拉克函数,进而确定源位置所在。这类算法产生较晚且数学计算复杂,但因效果较好而被广泛研究,如利用粒子滤波方法在室内搜寻气体扩散源。
[0004]为了解决湍流环境下的源定位问题,基于信息论原理的认知搜索策略得到了广泛的研究和应用。这种策略利用概率估计来定位气味源,同时在不确定情况下使用基于信息状态的奖励函数进行序贯决策。具体而言,源搜索过程可以被描述为一个部分可观马尔可夫决策过程(POMDP),由三个元素组成:信息状态、行动集和奖励函数。Vergassola等人提出了最早的认知搜索策略Infotaxis算法,它采用基于网格的方法来维持信息状态。随后,研究人员采用基于粒子滤波的序贯蒙特卡洛框架代替了Infotaxis算法中基于网格的方法,从而使该算法可以估计源强和源位置。不同的认知搜索策略会采用不同的奖励函数。最初的Infotaxis算法设计了一个包含两项的奖励函数,以实现探索(Exploration)与开发(Exploitation)之间的权衡。哈钦森等人提出了另一种名为Entrotaxis的认知搜索算法该算法设计了一个基于最大熵抽样原则的奖励函数。这个奖励函数衡量了未来期望探测事件的不确定性,而不是Infotaxis算法中考虑的源项信息的不确定性。
[0005]气体泄漏源搜索场景的一个特点是空间尺度大。在这个场景中,使用单个机器人搜索扩散源可能会花费过多的时间,或者由于距离源较远,可能无法进行有效的迭代计算,导致找不到源。使用多机器人系统——多个机器人通过协调动作完成任务,可以有效地完成许多单个机器人难以完成的复杂任务。多机器人协作控制问题已经引起了广泛的关注。Soares等人提出了一种基于图的编队控制算法,该算法可以将机器人组织成任意的、进化
的形状,实现对气体扩散源溯源。由Jatmiko提出的基于粒子群算法的气味源定位算法,在改进的基于粒子群优化算法中结合趋化性和趋风性方法,可以在有障碍物的环境中定位源,解决动态对流扩散问题。此外,Hajieghrary和Ani提出了一种多机器人协作的“信息出租”策略来应对大规模的机器人。但是,考虑到寻源过程中存在的不确定性,如何控制多个机器人在大空间尺度的场景中进行协同寻源以提高寻源效率和寻源准确率,仍然有广阔的研究空间。

技术实现思路

[0006]本专利技术要解决的技术问题:针对现有技术的上述问题,提供一种基于认知搜索策略的多机器人源搜索方案生成方法及系统,本专利技术能够实现多机器人的气体泄漏源搜索,考虑到寻源过程中存在的不确定性,利用多机器人协同算法,控制多个机器人在大空间尺度的场景中进行协同寻源,可以有效的提高寻源效率和寻源准确率,适用于多种气体源搜索场景包括化工园区危害化学品泄漏事故寻源、住宅楼内瓦斯泄漏源搜索等需求。
[0007]为了解决上述技术问题,本专利技术采用的技术方案为:
[0008]一种基于认知搜索策略的多机器人源搜索方案生成方法,包括:
[0009]1)建立气体泄漏模型和传感器的探测模型;
[0010]2)基于气体泄漏模型和传感器的探测模型,对泄漏源搜索过程建模;
[0011]3)运用粒子滤波的方法表示泄漏源搜索过程中源项参数估计的迭代更新,建立基于认知搜索策略的寻源行动方案;
[0012]4)针对实际障碍场景对寻源行动方案进行避障功能的改进;
[0013]5)针对改进后的寻源行动方案与多机器人控制技术相结合,生成基于认知搜索策略的多机器人源搜索行动方案。
[0014]可选地,步骤1)中建立的气体泄漏模型的函数表达式为:
[0015][0016]上式中,V为平均风速,为y轴方向的梯度,c(r|θ0)为位置r={x,y}上的气体浓度,θ0={r0,Q}为泄漏源r0的位置r0={x0,y0}的源项参数,Q为扩散强度,D为气体有效扩散系数,Δc(r|θ0)为浓度的变化量,τ为气体分子寿命,δ为狄拉克函数。
[0017]可选地,步骤1)中建立的传感器的探测模型的函数表达式为:
[0018][0019]上式中,P(d(r)|θ0)为传感器在位置r={x,y}上的单位时间内接触到d次气体分子的概率,d为传感器在位置r={x,y}上的单位时间内接触到气体分子的次数,R(r|θ0)为传感器与气体分子在单位时间内的平均接触次数,且有:
[0020]R(r|θ0)=4πDac(r|θ0)
[0021]上式中,D为气体有效扩散系数,a为球形的传感器半径,c(r|θ0)为位置r={x,y}上的气体浓度,且有:
[0022][0023]上式中,c(r|θ0)为位置r={x,y}上的气体浓度,θ0={r0,Q}为泄漏源r0的位置r0={x0,y0}的源项参数,Q为扩散强度,V为平均风速,中间变量λ的函数表达式为:
[0024][0025]可选地,步骤2)包括:将需要被估计的源项参数为θ0={r0,Q}用概率密度函数来表示对源项参数的估计,将表示任意第k步后得到的信息状态的第k步的后概率密度函数P(θ
k
|D
k
)由前k步已经收集到的所有信息决定,其中θ
k
为第k步估计的源项参数,D
k
={d1(r1),d2(r2),

,d
k
(r
k
)}表示第k步在位置r
k
={x
k
,y
k
}的上收集到的所有信息,d1(r1)~d
k
(r
k
)分别为第1~k步得到的传感器读数;且初始的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于认知搜索策略的多机器人源搜索方案生成方法,其特征在于,包括:1)建立气体泄漏模型和传感器的探测模型;2)基于气体泄漏模型和传感器的探测模型,对泄漏源搜索过程建模;3)运用粒子滤波的方法表示泄漏源搜索过程中源项参数估计的迭代更新,建立基于认知搜索策略的寻源行动方案;4)针对实际障碍场景对寻源行动方案进行避障功能的改进;5)针对改进后的寻源行动方案与多机器人控制技术相结合,生成基于认知搜索策略的多机器人源搜索行动方案。2.根据权利要求1所述的基于认知搜索策略的多机器人源搜索方案生成方法,其特征在于,步骤1)中建立的气体泄漏模型的函数表达式为:上式中,V为平均风速,为y轴方向的梯度,c(r|θ0)为位置r={x,y}上的气体浓度,θ0={r0,Q}为泄漏源r0的位置r0={x0,y0}的源项参数,Q为扩散强度,D为气体有效扩散系数,Δc(r|θ0)为浓度的变化量,τ为气体分子寿命,δ为狄拉克函数。3.根据权利要求2所述的基于认知搜索策略的多机器人源搜索方案生成方法,其特征在于,步骤1)中建立的传感器的探测模型的函数表达式为:上式中,P(d(r)|θ0)为传感器在位置r={x,y}上的单位时间内接触到d次气体分子的概率,d为传感器在位置r={x,y}上的单位时间内接触到气体分子的次数,R(r|θ0)为传感器与气体分子在单位时间内的平均接触次数,且有:R(r|θ0)=4πDac(r|θ0)上式中,D为气体有效扩散系数,a为球形的传感器半径,c(r|θ0)为位置r={x,y}上的气体浓度,且有:上式中,c(r|θ0)为位置r={x,y}上的气体浓度,θ0={r0,Q}为泄漏源r0的位置r0={x0,y0}的源项参数,Q为扩散强度,V为平均风速,中间变量λ的函数表达式为:4.根据权利要求3所述的基于认知搜索策略的多机器人源搜索方案生成方法,其特征在于,步骤2)包括:将需要被估计的源项参数为θ0={r0,Q}用概率密度函数来表示对源项参数的估计,将表示任意第k步后得到的信息状态的第k步的后概率密度函数P(θ
k
|D
k
)由前k步已经收集到的所有信息决定,其中θ
k
为第k步估计的源项参数,D
k
={d1(r1),d2(r2),

,d
k
(r
k
)}表示第k步在位置r
k
={x
k
,y
k
}的上收集到的所有信息,d1(r1)~d
k
(r
k
)分别为第1~k步得到的传感器读数;且初始的后概率密度函数P(θ0)由先验知识预设得到,任意第k步的后验概率密度函数P(θ
k
|D
k
)利用贝叶斯公式根据下式进行更新:
上式中,P(θ
k
|D
k
‑1)为k

1步的后验概率密度,P(d
k
(r
k
)|θ
k
)为密度权重,P(d
k
(r
k
)|D
k
‑1)为归一化因子;考虑四连通情况下的可选行动集U为U={

,

,

,

},可选行动集U中的四个元素

,

,

,

分别表示行动的上下左右四个方向,将寻源机器人在每一步中采用奖励函数来计算可选行动集U中各候选位置上能获取到的信息增益I(u),并根据下式选取信息增益I(u)最大的位置u
*
作为下一位置,从而得到对泄漏源搜索过程的模型函数表达式如下式所示:上式中,u
*
为选取的下一位置,u为可选行动集U中的元素对应的候选位置,I(u)为候选位置上能获取到的信息增益,arg max表示选取信息增益I(u)最大的位置。5.根据权利要求4所述的基于认知搜索策略的多机器人源搜索方案生成方法,其特征在于,步骤3)包括:对任意第k步的后概率密度函数P(θ
k
|D
k
)进行采样产生N个带权值的随机样本{x
ki
,w
ki
}
i=1:N
,其中x
ki
表示第k步的第i个粒子对源项参数的估计,w
ki
为粒子x
ki
对应的权值,N个权值w
ki
总和为1,用N个带权值的随机样本{x
ki
,w
ki
}
i=1:N
作为粒子滤波方法的N个粒子近似表示第k步的后概率密度函数P(θ
k
|D
k
)为:上式中,δ为...

【专利技术属性】
技术研发人员:陈彬季雅泰吕欣赵勇刘忠王锐王昊冉何华肖军浩卢惠民
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1