当前位置: 首页 > 专利查询>吉林大学专利>正文

基于深度强化学习的多信息众包轨迹融合方法技术

技术编号:37627403 阅读:17 留言:0更新日期:2023-05-18 12:18
基于深度强化学习的多信息众包轨迹融合方法,具体涉及一种适用于室内定位的基于深度强化学习的多信息众包轨迹融合方法,为解决传统轨迹融合方法使真实场景中的众包轨迹融合精度低,导致室内定位精度低的问题。它包括获取待测目标在室内的PDR轨迹;定义室内地标,室内地标包括WiFi指纹和地磁指纹,判断不同PDR轨迹间WiFi相似度及WiFi相似轨迹的地磁动态时间归整距离;建立室内地标对PDR轨迹的全局关联约束,将获取最小化全局关联约束的过程建模为马尔科夫决策过程;利用深度强化学习网络解决马尔科夫决策过程,深度强化学习网络的输入是PDR轨迹和全局关联约束,从而控制每段PDR轨迹进行旋转和平移,实现轨迹融合。属于室内定位领域。定位领域。定位领域。

【技术实现步骤摘要】
基于深度强化学习的多信息众包轨迹融合方法


[0001]本专利技术涉及一种众包轨迹融合方法,具体涉及一种适用于室内定位的基于深度强化学习的多信息众包轨迹融合方法,属于室内定位领域。

技术介绍

[0002]空间位置信息已经成为移动互联网和物联网的重要组成部分,是智慧城市、智能交通和空间大数据分析等新兴领域的核心组件,与国民经济、社会发展各方面紧密联系。以GPS为代表的卫星定位系统,为人们提供了全球性、全天候的室外定位服务,但是目前室内定位还没有统一稳定的普适性解决方案。作为目前最成熟的室内定位解决方案,传统的指纹定位(WiFi、地磁等)需要指派专人进行现场勘测,消耗极大的时间和精力,因此目前仍无法大范围普适性铺设。
[0003]群智感知定位技术通过众包采集的方式收集普通用户的传感器信息,利用用户的移动性,将不同空间位置上的指纹信息关联起来,由此实现零人工勘测的信号指纹库自动构建。群智感知定位成为解决大范围普适性室内定位快速铺设问题的关键技术,将大大推进智慧城市、智能交通和空间大数据分析等新兴领域位置服务的发展,但群智感知定位技术受众包轨迹数量大,长度短,航向误差大和绝对位置未知的特点,以及传统室内地标稀疏性的限制,导致真实场景中的群智感知定位仍面临众包轨迹融合精度低的问题,无法有效构建室内定位所需的指纹地图,从而导致室内定位精度低。

技术实现思路

[0004]本专利技术为了解决传统轨迹融合方法无法有效融合数量大,长度短,航向误差大和绝对位置未知的众包轨迹,使真实场景中的众包轨迹融合精度低,导致室内定位精度低的问题,提出了一种基于深度强化学习的多信息众包轨迹融合方法。
[0005]它包括以下步骤:
[0006]S1、获取待测目标在室内的PDR轨迹;
[0007]S2、定义室内地标,室内地标包括WiFi指纹和地磁指纹,判断不同PDR轨迹间WiFi相似度及WiFi相似轨迹的地磁动态时间归整距离;
[0008]S3、建立室内地标对PDR轨迹的全局关联约束,将获取最小化全局关联约束的过程建模为马尔科夫决策过程;
[0009]基于PDR轨迹和马尔科夫决策过程获得四元组,并计算当前室内地标对PDR轨迹的全局关联约束,将四元组和全局关联约束作为训练集对深度学习网络进行训练,输入PDR轨迹和全局关联约束,输出融合的PDR轨迹,直至全局关联约束最小化时,得到训练好的深度学习网络;
[0010]S4、获取某室内场景中待测目标的PDR轨迹及对应的室内地标信息后,计算室内地标对PDR轨迹的全局关联约束,将PDR轨迹和全局关联约束输入S3中的深度学习网络中,输出融合的PDR轨迹。
[0011]进一步地,S1具体过程为:
[0012]S11、定义待测目标手机的稳定放置姿态,获取待测目标手机的欧拉角,根据欧拉角、手机的光线传感器和距离传感器,利用随机森林分类器识别待测目标手机的稳定放置姿态;
[0013]S12、根据待测目标手机的稳定放置姿态估计待测目标手机的航向,根据航向、待测目标的计步和步长生成待测目标在室内的PDR轨迹。
[0014]进一步地,S11具体过程为:
[0015]S111、定义手机的稳定放置姿态包括裤子口袋放置姿态、上衣口袋放置姿态、背包放置姿态和手持平端放置姿态四种;
[0016]S112、定义每次数据的采集时间为30s

60s,获取单次采集时间内待测目标手机的加速度计数据、陀螺仪数据和磁力计数据,利用卡尔曼滤波融合加速度计数据、陀螺仪数据和磁力计数据,根据融合后的加速度计数据、陀螺仪数据和磁力计数据估算手机欧拉角;
[0017]S113、获取单次采集时间内手机的光线传感器和距离传感器,计算欧拉角、手机光线传感器和距离传感器对应的特征矢量,特征矢量包括最大值、最小值、中值、平均值、极差,将上述特征矢量输入随机森林分类器内,输出待测目标手机的稳定放置姿态。
[0018]进一步地,S112具体过程为:
[0019]①
计算待测目标手机的初始姿态四元数;
[0020]②
初始化四元数的协方差矩阵,过程噪声协方差矩阵,加速度计观测噪声协方差矩阵和磁力计观测噪声协方差矩阵;
[0021]③
计算四元数的状态转移方程;
[0022]④
分别计算加速度计和磁力计的测量方程;
[0023]⑤
计算当前状态的卡尔曼增益;
[0024]⑥
更新四元数和四元数的协方差矩阵;
[0025]⑦
将四元数转换为欧拉角。
[0026]进一步地,S12具体过程为:
[0027]S121、获取S113中待测目标手机的稳定放置姿态下的加速度计数据、陀螺仪数据和磁力计数据,将上述数据利用卡尔曼滤波进行融合,根据融合后的数据获得手机传感器坐标系下的航向角,根据航向角确定待测目标的航向;
[0028]S122、基于待测目标步行状态下的加速度计幅度值具有周期性变化的特点,通过峰值检测算法估计加速度计幅度值的每个周期的峰值时间,并作为完成待测目标步态估计的时间,获取所述时间内待测目标的计步及步频,步频为相邻峰值时间差的倒数;
[0029]S123、假设待测目标的步频和步长具有线性关系,则根据步频计算步长;
[0030]S124、根据待测目标的步长和航向进行位移计算,得到待测目标的PDR轨迹。
[0031]进一步地,S2具体过程为:
[0032]分别采集待测目标手机在稳定放置姿态下的WiFi信号强度值和地磁数据,将不同手机、不同时间、不同轨迹下的WiFi信号强度矢量之间的余弦距离作为WiFi指纹相似度,记录不同轨迹具有相似WiFi指纹地标的采样点时的相似度数值;
[0033]在WiFi指纹相似度超过预设门限值的PDR轨迹中,将每条PDR轨迹的三轴地磁数据取模值构建一维地磁数据,计算不同PDR轨迹之间一维地磁数据的动态时间归整距离,根据
动态时间归整距离判断不同PDR轨迹之间是否具有相似地磁指纹,如果动态时间归整距离小于预设门限,则判断为相似,若有相似地磁指纹,则记录相似PDR轨迹间的动态时间归整距离;否则,不进行任何操作。
[0034]进一步地,S3具体过程为:
[0035]S31、室内地标对PDR轨迹的全局关联约束:
[0036]F
sum
=w
W
·
F
W
+w
M
·
F
M
[0037]其中,w
W
、w
M
分别为WiFi指纹和地磁指纹的权重,F
W
、F
M
分别为WiFi指纹和地磁指纹的加权物理距离;
[0038]S32、将获取最小化全局关联约束的过程建模为马尔科夫决策过程,将PDR轨迹的位置和方位作为马尔科夫决策过程的状态,将PDR轨迹的移动与旋转作为马尔科夫决策过程的动作,则本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于深度强化学习的多信息众包轨迹融合方法,其特征在于:它包括以下步骤:S1、获取待测目标在室内的PDR轨迹;S2、定义室内地标,室内地标包括WiFi指纹和地磁指纹,判断不同PDR轨迹间WiFi相似度及WiFi相似轨迹的地磁动态时间归整距离;S3、建立室内地标对PDR轨迹的全局关联约束,将获取最小化全局关联约束的过程建模为马尔科夫决策过程;基于PDR轨迹和马尔科夫决策过程获得四元组,并计算当前室内地标对PDR轨迹的全局关联约束,将四元组和全局关联约束作为训练集对深度学习网络进行训练,输入PDR轨迹和全局关联约束,输出融合的PDR轨迹,直至全局关联约束最小化时,得到训练好的深度学习网络;S4、获取某室内场景中待测目标的PDR轨迹及对应的室内地标信息后,计算室内地标对PDR轨迹的全局关联约束,将PDR轨迹和全局关联约束输入S3中的深度学习网络中,输出融合的PDR轨迹。2.根据权利要求1中所述的基于深度强化学习的多信息众包轨迹融合方法,其特征在于:S1具体过程为:S11、定义待测目标手机的稳定放置姿态,获取待测目标手机的欧拉角,根据欧拉角、手机的光线传感器和距离传感器,利用随机森林分类器识别待测目标手机的稳定放置姿态;S12、根据待测目标手机的稳定放置姿态估计待测目标手机的航向,根据航向、待测目标的计步和步长生成待测目标在室内的PDR轨迹。3.根据权利要求2中所述的基于深度强化学习的多信息众包轨迹融合方法,其特征在于:S11具体过程为:S111、定义手机的稳定放置姿态包括裤子口袋放置姿态、上衣口袋放置姿态、背包放置姿态和手持平端放置姿态四种;S112、定义每次数据的采集时间为30s

60s,获取单次采集时间内待测目标手机的加速度计数据、陀螺仪数据和磁力计数据,利用卡尔曼滤波融合加速度计数据、陀螺仪数据和磁力计数据,根据融合后的加速度计数据、陀螺仪数据和磁力计数据估算手机欧拉角;S113、获取单次采集时间内手机的光线传感器和距离传感器,计算欧拉角、手机光线传感器和距离传感器对应的特征矢量,特征矢量包括最大值、最小值、中值、平均值、极差,将上述特征矢量输入随机森林分类器内,输出待测目标手机的稳定放置姿态。4.根据权利要求3中所述的基于深度强化学习的多信息众包轨迹融合方法,其特征在于:S112具体过程为:

计算待测目标手机的初始姿态四元数;

初始化四元数的协方差矩阵,过程噪声协方差矩阵,加速度计观测噪声协方差矩阵和磁力计观测噪声协方差矩阵;

计算四元数的状态转移方程;

分别计算加速度计和磁力计的测量方程;

计算当前状态的卡尔曼增益;

更新四元数和四元数的协方差矩阵;

将四元数转换为欧拉角。
5.根据权利要求4中所述的基于深度强化学习的多信息众包轨迹融合方法,其特征在于:S12具体过程为:S121、获取S113中待测目标手机的稳定放置姿态下的加速度计数据、陀螺仪数据和磁力计数据,将上述数据利用卡尔曼滤波进行融合,根据融合后的数据获得手机传感器坐标系下的航向角,根据航向角确定待测目标的航向;S122、基于待测目标步行状态下的加速度计幅度值具有周期性变化的特点,通过峰值检测算法估计加速度计幅度值的每个周期的峰值时间,并作为完成待测目标步态估计的时间,获取所述时间内待测目标的计步及步频,步频为相邻峰值时间差的倒数;S123、假设待测目标的步频和步长具有线性关系,则根据步频计算步长;S124、根据待测目标的步长和航向进行位移计...

【专利技术属性】
技术研发人员:李赞韩宇
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1