基于深度神经网络图编码器的城市人类流动模式检测方法技术

技术编号:24171246 阅读:19 留言:0更新日期:2020-05-16 03:01
本发明专利技术公开了一种基于深度神经网络稀疏图编码器的人类流动模式检测方法,包括以下步骤:采集城市数据,包括人类活动数据、城市兴趣点数据及城市地理信息数据;结合改进的OPTICS算法和城市数据将城市划分为若干个区域;根据区域划分结果,构建多个时间段的人类活动流量矩阵,并基于人类活动流量矩阵构建人类活动张量矩阵;基于深度神经网络的稀疏图编码器求取人类活动张量矩阵的结构化数据;利用聚类算法处理结构化数据获得各场景下的人类流动模式。本发明专利技术能适用于更复杂的数据结构,实现更有效的城市区域选取,更好地反映网络的结构特征,推断出在不同的时空环境下用户对POI的偏好,实现城市人类流动模式的有效检测,进而为城市规划和POI建设提供建议。

Detection method of urban human flow pattern based on deep neural network graph encoder

【技术实现步骤摘要】
基于深度神经网络图编码器的城市人类流动模式检测方法
本专利技术涉及模式分析领域,特别涉及一种基于深度神经网络图编码器的城市人类流动模式检测方法。
技术介绍
随着城市的快速发展,引发了诸如交通拥堵、资源浪费、人口密集等问题。另一方面随着定位技术服务(LTS)的普及以及计算能力的迅速提高,人类现实社会中的行为被数字化,形成海量数据。这些数据集的规模以及多维性使研究者们有机会探索社会的行为规律,并可以基于规律进行有效的预测从而解决快速城市化所带来的问题。由于城市中的人群流动受时间、温度、环境等的影响,在不同的时间和天气情况会呈现着不同的人群流动模式,若是能够提前了解城市的流动模式,并对其进行相关的分析可以很好的解决由于人类流动所带来的交通拥堵问题,因此,探索城市人群的潜在流量模式对于城市建设、POI建议和需求分析具有重要意义。目前已经有很多关于探索人类流动模式的研究,大多学者是基于主题模型发现城市人类流动模式,例如B.Gao等人通过从数字足迹和社交链接创建主题模型来发现人类的流动模式,Ziyatdinov等人提出了一种利用谱聚类算法的多视图数据模式提取方法,但经研究证明发现主题模型对于发现潜在的运动模式更为有效,而应用于实际的人类流动模式检测还存在一定问题,主要是因为:首先,城市数据对时间非常敏感,人类流动模式跟时间相关度很高,因此很难被主题模型捕获。其次,人类流动模式分析的主题模型中没有相应的评估措施。最后,人类流量数据是图形结构,这增加了数据处理过程的难度。
技术实现思路
本专利技术的目的在于提供一种基于深度神经网络稀疏图编码器的人类流动模式检测方法,能够适用于更复杂的数据结构,实现更有效的城市区域选取,更好地反映网络的结构特征,推断出在不同的时空环境下用户对POI的偏好。实现本专利技术目的的技术解决方案为:一种基于深度神经网络稀疏图编码器的人类流动模式检测方法,包括以下步骤:步骤1,采集城市数据,包括人类活动数据、城市兴趣点数据以及城市地理信息数据;步骤2,结合改进的OPTICS算法和所述城市数据将整个城市划分为若干个区域;步骤3,根据步骤2区域划分结果,构建多个时间段的人类活动流量矩阵,并基于人类活动流量矩阵构建人类活动张量矩阵;步骤4,基于深度神经网络的稀疏图编码器求取人类活动张量矩阵的结构化数据;步骤5,利用聚类算法处理所述结构化数据获得各场景下的人类流动模式。进一步地,步骤1所述人类活动数据包括人类活动起始点经纬度(l1,w1)和人类活动终止点经纬度(l2,w2);所述城市兴趣点数据包括:兴趣点名称、兴趣点所在经纬度、兴趣点类型。进一步地,步骤2所述结合改进的OPTICS算法和所述城市数据将整个城市划分为若干个区域,具体包括:步骤2-1,根据城市地理信息数据将城市划分为规模大小相同的网格,建立网格坐标系;步骤2-2,将所述人类活动数据对应到网格坐标系中,形成网格坐标系下的人类活动数据集;步骤2-3,从所述人类活动数据集中随机选取某一数据p;步骤2-4,获取以所述数据p为圆心、以自定义设置的eps为半径的范围内人类活动数据的数目,根据该数目求取数据p的最大搜索半径MR,所用公式为:式中,表示参数,N表示网格坐标系的网格数,getNerghbors()表示获取以所述数据p为圆心、以eps为半径的范围内人类活动数据的数目;步骤2-5,获取以所述数据p为圆心、以MR为半径的范围内人类活动数据的数目,判断该数目是否大于预设阈值Pts,若是,则由以所述数据p为圆心、以MR为半径的范围内的人类活动数据形成新的集群;反之返回步骤2-4;步骤2-6,判断所述人类活动数据集中的每一个数据是否全部被访问,若是,则执行下一步,反之返回执行步骤2-3。步骤2-7,针对人类活动数据集中未归为任何一个集群的数据点,将其划分到距离该数据点最近的一个集群中,由此完成城市区域划分。进一步地,步骤3所述根据步骤2区域划分结果,构建多个时间段的人类活动流量矩阵,具体包括:假设步骤2区域划分后的区域个数即集群个数为M,并对M个区域进行顺序编号;步骤3-1,构建T个时间段的人类活动流量矩阵,T个时间段包括t1、t2、...、tT,且t1=t2=…=tT,其中某一时间段t1的人类活动流量矩阵为:矩阵的维度为M×M,矩阵中第i行第j列的元素fij表示从第i个区域流动到第j个区域人类活动数据点的数目;步骤3-2,基于T个时间段的人类活动流量矩阵构建人类活动张量矩阵F:式中,F为T×M×M维度的矩阵。进一步地,步骤4所述基于深度神经网络的稀疏图编码器求取人类活动张量矩阵的结构化数据,具体包括:步骤4-1,利用相似性度量RBF求取人类活动张量矩阵F的相似矩阵S,所用公式为:式中,Fi和Fj分别表示第i个时间段、第j个时间段的人类活动数据矩阵,σ表示惩罚因子;步骤4-2,构建基于深度神经网络的稀疏图编码器,该编码器包括encode结构decode结构,具体包括输入层、三层隐藏层和输出层,并在编码器中添加Dropout层;按输入层至输出层的顺序,令l表示深度神经网络的第l层,l=1....L,L表示深度神经网络的总层数;步骤4-3,对所述相似矩阵S进行拉普拉斯归一化计算,所用公式为:a0=D-1S式中,a0表示相似矩阵S的拉普拉斯矩阵,D表示在相应的对角元素中具有节点度的一个对角矩阵;步骤4-4,初始化l=0,并令yl等于a0;步骤4-5,将yl输入至步骤4-2构建的基于深度神经网络的稀疏图编码器中,并执行如下计算:r(l)~Bernoulli(p)Y(l)=r(l)*y(l)z(l+1)=w(l+1)Y(l)+b(l+1)y(l+1)=f(z(l+1))式中,yl表示深度神经网络第l层的输出值,Bernoulli(p)表示某一向量中0值的概率为p,wl和bl分别表示深度神经网络的权重矩阵、第l个隐藏层的偏差,f()表示隐藏层和输出层的非线性激活函数,其形式为:步骤4-6,令l递增1,并判断l是否等于L,若是,执行下一步,反之返回执行步骤4-5;步骤4-7,优化深度神经网络以实现最小化原始数据x即a0和重建误差数据y即yL,所用损失函数Loss(θ)为:式中,β表示控制稀疏性惩罚的权重,表示隐藏层激活的平均值,hj表示隐藏层中第j个节点的激活值,n表示该隐藏层所包含节点总数;优化后的深度神经网络中隐藏层的数据即为人类活动张量矩阵的结构化数据。本专利技术与现有技术相比,其显著优点为:1)改进OPTICS算法,降低了算法运行的时间,可以对城市进行更好的区域划分;2)针对复杂城市的区域特征,设计了不同区域可达距离的选择条件,实现了更有效的区域距离选择;3)设计了基于深度神经网络的自编码器结构,可以更好的提取人类活动数据的特本文档来自技高网...

【技术保护点】
1.一种基于深度神经网络稀疏图编码器的人类流动模式检测方法,其特征在于,包括以下步骤:/n步骤1,采集城市数据,包括人类活动数据、城市兴趣点数据以及城市地理信息数据;/n步骤2,结合改进的OPTICS算法和所述城市数据将整个城市划分为若干个区域;/n步骤3,根据步骤2区域划分结果,构建多个时间段的人类活动流量矩阵,并基于人类活动流量矩阵构建人类活动张量矩阵;/n步骤4,基于深度神经网络的稀疏图编码器求取人类活动张量矩阵的结构化数据;/n步骤5,利用聚类算法处理所述结构化数据获得各场景下的人类流动模式。/n

【技术特征摘要】
1.一种基于深度神经网络稀疏图编码器的人类流动模式检测方法,其特征在于,包括以下步骤:
步骤1,采集城市数据,包括人类活动数据、城市兴趣点数据以及城市地理信息数据;
步骤2,结合改进的OPTICS算法和所述城市数据将整个城市划分为若干个区域;
步骤3,根据步骤2区域划分结果,构建多个时间段的人类活动流量矩阵,并基于人类活动流量矩阵构建人类活动张量矩阵;
步骤4,基于深度神经网络的稀疏图编码器求取人类活动张量矩阵的结构化数据;
步骤5,利用聚类算法处理所述结构化数据获得各场景下的人类流动模式。


2.根据权利要求1所述的基于深度神经网络稀疏图编码器的人类流动模式检测方法,其特征在于,步骤1所述人类活动数据包括人类活动起始点经纬度(l1,w1)和人类活动终止点经纬度(l2,w2);
所述城市兴趣点数据包括:兴趣点名称、兴趣点所在经纬度、兴趣点类型。


3.根据权利要求1或2所述的基于深度神经网络图编码器的人类流动模式检测方法,其特征在于,步骤2所述结合改进的OPTICS算法和所述城市数据将整个城市划分为若干个区域,具体包括:
步骤2-1,根据城市地理信息数据将城市划分为规模大小相同的网格,建立网格坐标系;
步骤2-2,将所述人类活动数据对应到网格坐标系中,形成网格坐标系下的人类活动数据集;
步骤2-3,从所述人类活动数据集中随机选取某一数据p;
步骤2-4,获取以所述数据p为圆心、以自定义设置的eps为半径的范围内人类活动数据的数目,根据该数目求取数据p的最大搜索半径MR,所用公式为:



式中,表示参数,N表示网格坐标系的网格数,getNerghbors()表示获取以所述数据p为圆心、以eps为半径的范围内人类活动数据的数目;
步骤2-5,获取以所述数据p为圆心、以MR为半径的范围内人类活动数据的数目,判断该数目是否大于预设阈值Pts,若是,则由以所述数据p为圆心、以MR为半径的范围内的人类活动数据形成新的集群;反之返回步骤2-4;
步骤2-6,判断所述人类活动数据集中的每一个数据是否全部被访问,若是,则执行下一步,反之返回执行步骤2-3。
步骤2-7,针对人类活动数据集中未归为任何一个集群的数据点,将其划分到距离该数据点最近的一个集群中,由此完成城市区域划分。


4.根据权利要求3所述的基于深度神经网络图编码器的人类流动模式检测方法,其特征在于,步骤2-7所述针对人类活动数据集中未归为任何一个集群的数据点,将其划分到距离该数据点最近的一个集群中,具体包括:
针对人类活动数据集中未归为任何一个集群的数据点,求取该数据点到每一个集群中心的欧几里得距离d,所用公式为:



式中,(x1,y1)表示未归为任何一个集群的数据点在网格坐标系中的坐标,(x2,y2)表示某一个集群中心在网格坐标系中的坐标;
将未归为任何一个集群的数据点划分至最小的欧几里得距离d对应的集群中。


5.根据权利要求1所述的基于深度神经网络图编码器的人类流动...

【专利技术属性】
技术研发人员:顾晶晶凌超黄海涛
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1