当前位置: 首页 > 专利查询>东南大学专利>正文

基于深度学习的稀疏轨迹数据恢复系统及方法技术方案

技术编号:34862919 阅读:67 留言:0更新日期:2022-09-08 08:06
本发明专利技术公开了一种基于深度学习的稀疏轨迹数据恢复系统及方法,包括:历史数据选择器模块用于接收用户的历史轨迹集合和当前稀疏轨迹,对历史轨迹数据进行周期性提取和特征归一化处理后,找到与当前稀疏轨迹最相似的历史轨迹;编码器模块通过轨迹数据的序列特征获得稀疏轨迹与历史轨迹的上下文向量,同时通过独热编码对环境上下文特征进行表示,用一个全连接网络学习特征的嵌入得到特征嵌入向量,将其与上下文向量融合作为解码器输入;解码器模块引入注意力机制建模稀疏轨迹与最相似历史轨迹的全局相关性,将稀疏轨迹恢复到目标采样率,与路网匹配任务共享参数,同步进行道路网络的地图匹配,实现稀疏轨迹的数据恢复,完善轨迹路径,提高工作效率。提高工作效率。提高工作效率。

【技术实现步骤摘要】
基于深度学习的稀疏轨迹数据恢复系统及方法


[0001]本专利技术属于计算机信息计算
,尤其涉及轨迹移动数据的获取与恢复,主要涉及了一种基于深度学习的稀疏轨迹数据恢复系统及方法。

技术介绍

[0002]快递物流是电子商务中的重要组成部分,“末端物流配送”是全链路物流运转流程中快递员将包裹送达消费者手中的阶段,是完成物流配送服务重要环节。随着移动计算技术的进步与发展,物流运输全流程中许多环节尤其是末端配送环节都部署了移动定位设备,用于时空轨迹数据的采集,这些时空轨迹数据包含的信息能够表示人类、车辆的移动性。在末端物流配送中,对于快递员轨迹数据的分析利用有着非常重要的作用,如交付时间预测、快递员配送调度等,可以提高快递配送的效率,优化快递配送服务。
[0003]由于全球定位系统(G l oba l Pos it ion i ng System,GPS)通信时的损耗丢失、能量限制等原因,获取到的轨迹数据往往不能直接满足下游应用的需求:采集到的GPS数据会存在缺失点、缺失段;同时,为了节约能量,采集设备选取的采样率一般较低,实际采集到的数据中,大部分GPS数据的采样间隔在2分钟以上,这种情况下采集的轨迹数据相对稀疏,并不能很好地支持基于轨迹数据的应用。同时,由于GPS漂移等问题,采集到的位置点定位并不完全准确,不能精确匹配在道路网络上。这种稀疏的、偏离道路网络的轨迹数据,在下游各类数据驱动的应用中,不能支持其达到满意的效果。尤其由于快递员的移动位置涉及城市主干道、社区道路、乡村小路等多种复杂的道路类型,其应用的有效性更加依赖于轨迹数据是否详细准确。因此,对于快递员配送的时空轨迹数据进行挖掘之前,大部分应用均需要对稀疏的轨迹数据做恢复,并将其匹配到道路网络上,才能准确、高效地完成相应的任务。

技术实现思路

[0004]本专利技术正是针对现有技术中的问题,提供一种基于深度学习的稀疏轨迹数据恢复系统及方法,包括历史数据选择器模块、编码器模块和解码器模块,历史数据选择器模块用于接收当前轨迹所属用户的历史轨迹集合和当前稀疏轨迹,对历史轨迹数据进行周期性提取和特征归一化处理后,找到与当前稀疏轨迹最相似的历史轨迹,作为编码器模块的输入;编码器模块通过轨迹数据的序列特征获得稀疏轨迹与历史轨迹的上下文向量,同时通过独热编码对环境上下文特征进行表示,用一个全连接网络学习所有特征的嵌入得到特征嵌入向量,将其与上下文向量融合作为解码器的输入;解码器模块引入了注意力机制建模稀疏轨迹与最相似历史轨迹的全局相关性,将稀疏轨迹恢复到目标采样率,并与路网匹配任务共享参数,同步进行道路网络的地图匹配。本系统可实现稀疏轨迹的数据恢复,完善轨迹路径,有利于各种基于轨迹数据挖掘工作的顺利开展,提升路径准确度,提高工作效率。
[0005]为了实现上述目的,本专利技术采取的技术方案是:基于深度学习的稀疏轨迹数据恢复系统,包括历史数据选择器模块、编码器模块和解码器模块,
[0006]所述历史数据选择器模块:接收当前轨迹所属用户的历史轨迹集合和当前稀疏轨迹,对历史轨迹数据进行周期性提取,对其特征进行归一化处理,并计算历史轨迹集合中与当前稀疏轨迹最相似的历史轨迹,将其作为编码器模块的输入;
[0007]所述编码器模块:基于轨迹数据的序列特征,利用编码器获得稀疏轨迹与最相似历史轨迹的上下文向量;
[0008]所述编码器模块中还包括可抽取环境上下文特征的属性模块,通过独热编码对环境上下文特征进行表示,将独热编码的结果串联后,通过一个全连接网络学习所有特征的嵌入,得到特征嵌入向量;
[0009]将上下文向量与特征嵌入向量融合,作为解码器的输入进行恢复和匹配任务;
[0010]所述解码器模块:引入了注意力机制建模稀疏轨迹与最相似历史轨迹的全局相关性,使用解码器中的当前隐藏状态与编码器输出的相似度来生成上下文向量,将稀疏轨迹恢复到目标采样率,并与路网匹配任务共享参数,同步进行道路网络的地图匹配。
[0011]为了实现上述目的,本专利技术还采取的技术方案是:基于深度学习的稀疏轨迹数据恢复方法,包括如下步骤:
[0012]S1,最相似的历史轨迹确定:收集当前轨迹所属用户的历史轨迹集合,对历史轨迹数据进行周期性提取,对其特征进行归一化处理,并计算历史轨迹集合中与当前稀疏轨迹最相似的历史轨迹,确定最相似的历史轨迹;
[0013]S2,上下文向量的获得:基于轨迹数据的序列特征,利用编码器获得稀疏轨迹与最相似历史轨迹的上下文向量;
[0014]S3,环境特征嵌入向量的获得:通过独热编码对环境上下文特征进行表示,将独热编码的结果串联后,通过一个全连接网络学习所有特征的嵌入,得到特征嵌入向量;
[0015]S4,向量融合:将步骤S2获得的上下文向量与步骤S3获得的特征嵌入向量融合,作为解码器的输入进行恢复和匹配任务;
[0016]S5,解码器执行:引入了注意力机制建模稀疏轨迹与最相似历史轨迹的全局相关性,使用解码器中的当前隐藏状态与编码器输出的相似度来生成上下文向量,将稀疏轨迹恢复到目标采样率,并与路网匹配任务共享参数,同步进行道路网络的地图匹配。
[0017]与现有技术相比,本专利技术在轨迹恢复的方法中,加入历史数据选择器,利用周期性特征进行针对轨迹的恢复与路网匹配任务;设计了一个周期性感知系统,通过挖掘历史轨迹数据的周期性模式来提升复杂路网中地图匹配的轨迹恢复任务的效果;本方法和系统可实现稀疏轨迹的数据恢复,完善轨迹路径,提升路径准确度,提高工作效率,尤其适用于快递行业,对稀疏的快递员轨迹数据进行高采样率的恢复,提高快递员轨迹的采样率和匹配精度,并将之根据快递员配送的特点匹配到地图的道路网络上,得到的恢复并匹配后的数据是各类基于轨迹的下游应用的有效数据支撑,有利于各种基于快递员配送轨迹数据挖掘工作的顺利开展,从而加强末端物流配送的效率,提高整个物流领域的服务质量。
附图说明
[0018]图1是本专利技术基于深度学习的稀疏轨迹数据恢复系统的结构示意图;
[0019]图2是本专利技术实施例2中实验采集的部分位置点数据图;
[0020]图3是本专利技术实施例2中地图匹配点表示方法的示意图;
[0021]图4是本专利技术实施例2中实验结果可视化图。
具体实施方式
[0022]下面结合附图和具体实施方式,进一步阐明本专利技术,应理解下述具体实施方式仅用于说明本专利技术而不用于限制本专利技术的范围。
[0023]实施例1
[0024]基于深度学习的稀疏轨迹数据恢复系统,如图1所示,包括历史数据选择器模块、编码器模块和解码器模块,采用序列到序列模型来解决地图约束的轨迹恢复问题,采用序列到序列模型的编码器

解码器结构作为本专利技术模型的主要结构。
[0025]所述历史数据选择器模块:接收当前轨迹所属用户的历史轨迹集合和当前稀疏轨迹,对历史轨迹数据进行周期性提取,对其特征进行归一化处理,并计算历史轨迹集合中与当前稀疏轨迹最相似的历史轨迹,将其作为编码器模块的输入;...

【技术保护点】

【技术特征摘要】
1.基于深度学习的稀疏轨迹数据恢复系统,其特征在于:包括历史数据选择器模块、编码器模块和解码器模块,所述历史数据选择器模块:接收当前轨迹所属用户的历史轨迹集合和当前稀疏轨迹,对历史轨迹数据进行周期性提取,对其特征进行归一化处理,并计算历史轨迹集合中与当前稀疏轨迹最相似的历史轨迹,将其作为编码器模块的输入;所述编码器模块:基于轨迹数据的序列特征,利用编码器获得稀疏轨迹与最相似历史轨迹的上下文向量;所述编码器模块中还包括可抽取环境上下文特征的属性模块,通过独热编码对环境上下文特征进行表示,将独热编码的结果串联后,通过一个全连接网络学习所有特征的嵌入,得到特征嵌入向量;将上下文向量与特征嵌入向量融合,作为解码器的输入进行恢复和匹配任务;所述解码器模块:引入了注意力机制建模稀疏轨迹与最相似历史轨迹的全局相关性,使用解码器中的当前隐藏状态与编码器输出的相似度来生成上下文向量,将稀疏轨迹恢复到目标采样率,并与路网匹配任务共享参数,同步进行道路网络的地图匹配。2.如权利要求1所述的基于深度学习的稀疏轨迹数据恢复系统,其特征在于:所述历史数据选择器模块中,通过计算欧几里得距离d来确定历史轨迹集合中与当前轨迹最相似的历史轨迹,所述欧几里得距离d的计算公式如下:其中,x
i
,y
i
表示向量x,y在第i维的值,S
i
是向量在第i维的标准差;欧几里得距离d最小的,即为历史轨迹集合中与当前轨迹最相似的历史轨迹。3.如权利要求2所述的基于深度学习的稀疏轨迹数据恢复系统,其特征在于:所述编码器模块中,使用门控递归单元GRU作为编码器来获得稀疏轨迹与最相似历史轨迹的上下文向量,所述门控递归单元GRU使用更新门z和复位门r来控制时间同步中的信息,在每个时间步i∈{1,2,

,n}中,隐藏状态向量s
i
如下:z
i
=σ(W
Z
*[s
i
‑1,u
i
]+b
z
)r
i
=σ(W
Z
*[s
i
‑1,u
i
]+b
r
))其中,W
x
是门(x)的权重,b
x
代表门(x)的偏置项,z
i
和r
i
代表更新门和复位门,u
i
表示转成离散单元后的坐标点,代表更新前的状态向量s
i
,σ代表激活函数sigmoid;最后一个隐藏状态向量s
n
为上下文向量,它将被作为解码器的输入,成为解码器的初始隐藏状态。4.如权利要求2所述的基于深度学习的稀疏轨迹数据恢复系统,其特征在于:所述属性模块中的环境上下文特征至少包...

【专利技术属性】
技术研发人员:王帅梅洛瑜张心睿刘尧畅
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1