基于超宽带系统的定位方法、装置、设备及存储介质制造方法及图纸

技术编号:37134972 阅读:10 留言:0更新日期:2023-04-06 21:33
本发明专利技术提供一种基于超宽带系统的定位方法、装置、电子设备及存储介质,该方法包括:在时刻n基于接收到的实际超宽带信号,计算获得目标节点在时刻n的实际位置和速度信息x

【技术实现步骤摘要】
基于超宽带系统的定位方法、装置、设备及存储介质


[0001]本专利技术涉及通信
,尤其涉及一种基于超宽带系统的定位方法、装置、设备及存储介质。

技术介绍

[0002]在室内环境中实现定位和跟踪可以使用认知处理方法。UWB(Ultra Wideband,超宽带)技术是目前备受关注的一种新型短距离高速率无线通信技术,通过发送纳秒级或纳秒级以下的超窄脉冲来传输数据,可以获得GHz级的数据带宽。超宽带技术可以应用于室内静止或者移动物体的精确定位和导航,包括人和大型物品,例如贵重物品仓储、矿井人员定位、机器人运动跟踪、汽车地库停车等。
[0003]但现有的室内定位跟踪无法感知真实环境的影响,因此导致定位预测不准确。

技术实现思路

[0004]本专利技术提供一种基于超宽带系统的定位方法、装置、设备及存储介质,用以解决现有技术中定位预测不准确的缺陷,提高定位预测的准确性。
[0005]本专利技术提供一种基于超宽带系统的定位方法,包括:
[0006]接收目标节点在时刻n发送的实际超宽带信号;
[0007]在所述时刻n基于接收到的实际超宽带信号,计算获得目标节点在时刻n的实际位置和速度信息x
n
、实际动作a
n
、和目标节点在时刻n的实际环境信息,a
n
与所述实际环境信息相关联;
[0008]基于所述目标节点在时刻n的实际位置和速度信息x
n
、实际动作a
n
、目标节点在时刻n的实际环境信息、目标节点在时刻n的预测位置和速度信息、以及时刻n的预测超宽带信号,对所述实际动作a
n
进行认知强化学习,更新价值函数,获得时刻n的动作a
n
对应熵的价值函数;
[0009]基于时刻n对应的认知策略π
n
或均匀分布,确定候选动作集合
[0010]获得候选动作集合中的每一个候选动作分别对应的预测超宽带信号,更新所述候选动作集合中的每一个候选动作分别对应熵的价值函数J
n+1
,其中,所述预测超宽带信号用于表征所述候选动作对应的回报;
[0011]根据ε

贪婪策略,基于更新后的价值函数J
n+1
,更新认知策略π
n
,获得时刻n+1对应的认知策略π
n+1

[0012]基于认知策略π
n+1
,确定目标节点在时刻n+1的预测动作a
n+1

[0013]其中,在n=1的情况下,目标节点在时刻1的预测位置和速度信息和预测超宽带信号是随机初始化确定的;在n>1的情况下,时刻n的预测超宽带信号是在时刻n

1执行的定位预测过程中获得的所有预测超宽带信号中与时刻n的实际超宽带信号最接近的一项,目标节点在时刻n的预测位置和速度信息是基于所述时刻n的预测超宽带信号确定的。
[0014]根据本专利技术提供的一种基于超宽带系统的定位方法,所述基于所述目标节点在时刻n的实际位置和速度信息x
n
、实际动作a
n
、目标节点在时刻n的实际环境信息、目标节点在
时刻n的预测位置和速度信息、以及时刻n的预测超宽带信号,对所述实际动作a
n
进行认知强化学习,更新价值函数,获得时刻n的动作a
n
对应熵的价值函数,包括:
[0015]基于所述目标节点在时刻n的实际位置和速度信息x
n
、实际动作a
n
、目标节点在时刻n的实际环境信息、目标节点在时刻n的预测位置和速度信息、以及时刻n的预测超宽带信号,计算获得时刻n对应的即时回报;
[0016]基于时刻n对应的即时回报,更新价值函数,获得时刻n的动作a
n
对应熵的价值函数。
[0017]根据本专利技术提供的一种基于超宽带系统的定位方法,所述基于所述目标节点在时刻n的实际位置和速度信息x
n
、实际动作a
n
、目标节点在时刻n的实际环境信息、目标节点在时刻n的预测位置和速度信息、以及时刻n的预测超宽带信号,计算获得时刻n对应的即时回报,包括:
[0018]基于r
n

g
n
(h(x
n
‑1,a
n
‑1)

h(x
n
,a
n
)),计算获得时刻n对应的即时回报;
[0019]所述基于时刻n对应的即时回报,更新价值函数,获得时刻n的动作a
n
对应熵的价值函数,包括:
[0020]基于J
n
(a
n
)

(1

α)J
n
‑1(a
n
‑1)+αr
n
,获得时刻n的动作a
n
对应熵的价值函数;
[0021]其中,α>0,α表示学习率,表示预期即时回报,J
n
(a
n
)为价值函数。
[0022]根据本专利技术提供的一种基于超宽带系统的定位方法,获得候选动作集合中的每一个候选动作分别对应的预测超宽带信号,更新所述候选动作集合中的每一个候选动作分别对应熵的价值函数J
n+1
,包括:
[0023]对于所述候选动作集合中的任一个候选动作a,基于候选动作a、以及时刻n的虚拟位置和速度信息x
n
,使用贝叶斯滤波计算预测协方差矩阵
[0024]基于计算获得候选动作a对应的熵h(x
n
,a);
[0025]基于h(x
n
,a),获得候选动作a对应的预测超宽带信号r
n+1
,其中,r
n+1

g
n
(h
planmem

h(x
n+1
,a));
[0026]基于r
n+1
,更新获得候选动作a对应熵的价值函数。
[0027]根据本专利技术提供的一种基于超宽带系统的定位方法,所述基于r
n+1
,更新获得候选动作a对应熵的价值函数,包括:
[0028]通过更新获得候选动作a对应熵的价值函数。
[0029]根据本专利技术提供的一种基于超宽带系统的定位方法,认知策略π
n
为:其中,为条件概率质量函数,条件概率质量函数用于描述所有动作随时间n的转移概率;
[0030]所述更新认知策略,获得时刻n+1对应的认知策略π
n+1
,包括:
[0031]基于获得时刻n+1对应的认知策略π
n+1

[0032]本专利技术还提供一种基于超宽带系统的定位装置,包括:
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于超宽带系统的定位方法,其特征在于,包括:接收目标节点在时刻n发送的实际超宽带信号;在所述时刻n基于接收到的实际超宽带信号,计算获得目标节点在时刻n的实际位置和速度信息x
n
、实际动作a
n
、和目标节点在时刻n的实际环境信息,a
n
与所述实际环境信息相关联;基于所述目标节点在时刻n的实际位置和速度信息x
n
、实际动作a
n
、目标节点在时刻n的实际环境信息、目标节点在时刻n的预测位置和速度信息、以及时刻n的预测超宽带信号,对所述实际动作a
n
进行认知强化学习,更新价值函数,获得时刻n的动作a
n
对应熵的价值函数;基于时刻n对应的认知策略π
n
或均匀分布,确定候选动作集合获得候选动作集合中的每一个候选动作分别对应的预测超宽带信号,更新所述候选动作集合中的每一个候选动作分别对应熵的价值函数J
n+1
,其中,所述预测超宽带信号用于表征所述候选动作对应的回报;根据ε

贪婪策略,基于更新后的价值函数J
n+1
,更新认知策略π
n
,获得时刻n+1对应的认知策略π
n+1
;基于认知策略π
n+1
,确定目标节点在时刻n+1的预测动作a
n+1
;其中,在n=1的情况下,目标节点在时刻1的预测位置和速度信息和预测超宽带信号是随机初始化确定的;在n>1的情况下,时刻n的预测超宽带信号是在时刻n

1执行的定位预测过程中获得的所有预测超宽带信号中与时刻n的实际超宽带信号最接近的一项,目标节点在时刻n的预测位置和速度信息是基于所述时刻n的预测超宽带信号确定的。2.根据权利要求1所述的基于超宽带系统的定位方法,其特征在于,所述基于所述目标节点在时刻n的实际位置和速度信息x
n
、实际动作a
n
、目标节点在时刻n的实际环境信息、目标节点在时刻n的预测位置和速度信息、以及时刻n的预测超宽带信号,对所述实际动作a
n
进行认知强化学习,更新价值函数,获得时刻n的动作a
n
对应熵的价值函数,包括:基于所述目标节点在时刻n的实际位置和速度信息x
n
、实际动作a
n
、目标节点在时刻n的实际环境信息、目标节点在时刻n的预测位置和速度信息、以及时刻n的预测超宽带信号,计算获得时刻n对应的即时回报;基于时刻n对应的即时回报,更新价值函数,获得时刻n的动作a
n
对应熵的价值函数。3.根据权利要求2所述的基于超宽带系统的定位方法,其特征在于,所述基于所述目标节点在时刻n的实际位置和速度信息x
n
、实际动作a
n
、目标节点在时刻n的实际环境信息、目标节点在时刻n的预测位置和速度信息、以及时刻n的预测超宽带信号,计算获得时刻n对应的即时回报,包括:基于r
n

g
n
(h(x
n
‑1,a
n
‑1)

h(x
n
,a
n
)),计算获得时刻n对应的即时回报;所述基于时刻n对应的即时回报,更新价值函数,获得时刻n的动作a
n
对应熵的价值函数,包括:基于J
n
(a
n
)

(1

α)J
n
‑1(a
n
‑1)+αr
n
,获得时刻n的动作a
n
对应熵的价值函数;其中,α>0,α表示学习率,表示预期即时回报,J
n
(a
n
)为价值函数。4.根据权利要求1所述的基...

【专利技术属性】
技术研发人员:远方赵曜冯肖刘咏李文萃贾静丽
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1