【技术实现步骤摘要】
一种顾及拓扑数据分析的时序多层地理流聚类识别方法
[0001]本专利技术属于数据挖掘
,具体涉及一种顾及拓扑数据分析的时序多层地理流聚类识别方法。
技术介绍
[0002]目前大多数多层网络聚类方法都是基于通过图谱分解将图嵌入欧几里德空间,因此,没有明确考虑局部基础图几何和拓扑。
[0003]有鉴于此,本申请期望提出了一种顾及拓扑数据分析的时序多层地理流聚类识别方法,从一个全新的地理时空分析方法,可识别多层地理流聚类。
技术实现思路
[0004]本专利技术的目的在于克服传统技术中存在的上述问题,提供一种顾及拓扑数据分析的时序多层地理流聚类识别方法。
[0005]为实现上述技术目的,达到上述技术效果,本专利技术是通过以下技术方案实现:
[0006]一种顾及拓扑数据分析的时序多层地理流聚类识别方法,包括如下步骤:
[0007]S1、时序地理流构建
[0008]下载对象城市的轨迹数据,使用python中的TransBigData库将下载的轨迹数据转换为研究所需要的OD流数据,建立交通时序多层网,再使用ArcGIS创建格网对OD流进行分割,将OD点落在相同两个格网的流的数量作为格网之间的权重值,构建一个以格网为节点的地理流权重网络;
[0009]S2、地理流降维
[0010]使用网络嵌入中的deepwalk算法,将得到的地理流权重网络运用随机游走模型将不同时间段权重网络嵌入成点云数据,在此基础上,计算每一层网络节点的序列并从时间相关的多层网络中检测动 ...
【技术保护点】
【技术特征摘要】
1.一种顾及拓扑数据分析的时序多层地理流聚类识别方法,其特征在于,包括如下步骤:S1、时序地理流构建下载对象城市的轨迹数据,使用python中的TransBigData库将下载的轨迹数据转换为研究所需要的OD流数据,建立交通时序多层网,再使用ArcGIS创建格网对OD流进行分割,将OD点落在相同两个格网的流的数量作为格网之间的权重值,构建一个以格网为节点的地理流权重网络;S2、地理流降维使用网络嵌入中的deepwalk算法,将得到的地理流权重网络运用随机游走模型将不同时间段权重网络嵌入成点云数据,在此基础上,计算每一层网络节点的序列并从时间相关的多层网络中检测动态城市移动社区;S3、地理流聚类识别将得到的点云数据使用python中的gudhi包生成相应的持久性图,并计算每一层网络的Wasserstein距离,再使用此距离进行地理流聚类识别。2.根据权利要求1所述的顾及拓扑数据分析的时序多层地理流聚类识别方法,其特征在于,步骤S1中,所述交通时序多层网的时间尺度为2小时。3.根据权利要求1所述的顾及拓扑数据分析的时序多层地理流聚类识别方法,其特征在于,步骤S2中,deepwalk算法主要分为随机游走和生成表示向量两个部分;首先利用随机游走算法从图中提取一些顶点序列,然后借助自然语言处理的思路,将生成的定点序列看作由单词组成的句子,所有的序列可以看作一个大的语料库,最后利用自然语言处理工具word2vec将每一个顶点表示为一个维度为d的向量。4.根据权利要求3所述的顾及拓扑数据分析的时序多层地理流聚类识别方法,其特征在于,步骤S2中,deepwalk算法具体包括以下步骤:1)将ArcGIS创建的格网进行编号,把每一个格网看作是一个网络节点,生成随机游走序列的算法,其算法可以理解为输入起始点和路径长度,生成随机游走节点序列,再汇总邻接节点,从邻接节点中随机选择下一个节点;2)将每个节点作为起始点生成随机游走序列,训练deepwalk算法中的word2vec模型将每一层网络嵌入成点云数据,再使用主成分分析进行降维可视化并保存嵌入生成的点云数据。5.根据权利要求4所述的顾及拓扑数据分析的时序多层地理流聚类识别方法,其特征在于,步骤1)中随机游走具体算法如下:设f(x)是一个含有n个变量的多元函数,x=(x1,x2,...,xn)为n维向量;给定初始迭代点x,初次行走步长λ,控制精度∈;给定迭代控制次数N,k为当前迭代次数;当k<N时,随机生成一个(
‑
1,1)之间的n维向量u=(u1,u2,
…
,un),(
‑
1<ui<1,i=1,2,
…
,n),并将其标准化得到令x1=x+λu
′
,完成第一步游走;计...
【专利技术属性】
技术研发人员:权利要求书二页说明书七页附图四页,
申请(专利权)人:安徽农业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。