一种时空数据的索引建立方法、查询方法、装置及设备制造方法及图纸

技术编号:11854683 阅读:77 留言:0更新日期:2015-08-11 00:25
本发明专利技术实施例提供了一种时空数据的索引建立方法、查询方法、装置及设备,将预设时间范围作为根节点生成多级时间索引树;并将预设空间范围作为根节点生成多级空间索引树;分别将每个时间片叶子节点与每个子空间叶子节点映射一个时空文件,其中,时空文件用于存储与该时空文件具有映射关系的时间片叶子节点表征的时间片及子空间叶子节点表征的子空间对应的时空数据。基于本发明专利技术实施例提供的时空数据的索引建立方法,建立的时空数据索引,在查找时空数据时,提高了查询效率。本发明专利技术涉及计算机技术领域。

【技术实现步骤摘要】

本专利技术涉及计算机
,尤其涉及一种时空数据的索引建立方法、查询方法、装置及设备
技术介绍
随着移动网络的爆炸式增长和移动智能设备的广泛应用,移动用户的时空数据(又称为用户时空分布数据)成为一种重要的大数据来源。例如,用户的时空数据可以为由GPS服务记录的该用户在不同的时空移动时,产生的有关移动轨迹的时间和空间的数据,又例如,用户使用移动网络时,基站记录的移动宽带(MBB,Mobile Broadband)数据中也含有大量用户的时空数据。一个中等规模的城市中用户数量通常在200万以上,道路网络上的关键地点数量通常在10万以上,数据采样的时间间隔一般为数秒至数分钟,因此,产生的时空数据的数量级会达到PB甚至EB。那么,在对这些时空数据进行查找时,如何合理地建立索引,使得能够快速地查找到所需的时空数据成为亟待解决的问题。现有技术中,针对时空数据的索引建立,主要包括如下步骤:步骤1:将待划分空间范围划分成多个子空间。步骤2:将步骤I中二维的待划分空间范围转化成一维的编码数据。本步骤中,将步骤I中划分得到的多个子空间按某种顺序(例如durve)进行编码。编码策略为尽量使位置上相邻的子空间的编码相邻。但是,尽管按照这样的策略进行编码,仍不能保证相邻的子空间编码一定相邻。有些子空间编码虽然相邻,但是实际的位置却相差甚远。步骤3:将步骤2中得到的一维的编码数据按照传统的平衡树索引等方法建立空间平衡索引树,其中,每个叶子节点记录了该叶子节点编码对应的子空间相关的时空数据的存储位置。步骤4:将待划分时间范围按照传统的平衡树索引等方法建立时间平衡索引树,其中,每个叶子节点记录了该叶子节点对应的时间相关的时空数据的存储位置。进一步地,基于现有技术中的上述索引建立方法,建立的时空轨迹数据的索引,在查找时空数据时,主要的步骤包括如下步骤:步骤1:根据用户输入的空间查询条件,确定出满足空间查询条件的各子空间对应的所有编码。从空间平衡索引树中查找确定出的编码对应的节点,从而得到满足空间查询空间的时空数据的存储位置。本步骤中,由于对待划分空间范围划分的子空间进行编码时,无法保证相邻子空间的编码一定相邻,因此,本步骤中查找到的时空数据可能存在冗余数据。步骤2:根据用户输入的时间查询条件,从时间平衡索引树中查找对应的节点,从而得到满足时间查询空间的时空数据的存储位置。步骤3:从步骤I得到的时空数据和步骤2得到的时空数据中,确定具有交集的时空数据,并作为查询结果。可见现有技术中建立时空数据索引的方法,使得在查找时空数据时需要先计算空间编码,并根据时间和空间分别进行对应时空数据的查找,再将查找到的时空数据汇总,得到查找结果。这样经过二次索引,降低了查找效率。
技术实现思路
本专利技术实施例提供了一种时空数据的索引建立方法、查询方法、装置及设备,用以解决基于现有技术中建立的时空数据索引查找时空数据时效率低的问题。第一方面,提供一种时空数据的索引建立方法,包括:将预设时间范围作为根节点生成多级时间索引树;其中,所述多级时间索引树包含多个时间片节点,且越靠近根节点的时间片节点表征的时间片越长;并将预设空间范围作为根节点生成多级空间索引树;其中,所述多级空间索引树包含多个子空间节点,且越靠近根节点的子空间节点表征的子空间越大;分别将每个时间片叶子节点与每个子空间叶子节点映射一个时空文件;其中,所述时空文件用于存储与该时空文件具有映射关系的时间片叶子节点表征的时间片及子空间叶子节点表征的子空间对应的时空数据。结合第一方面,在第一种可能的实现方式中,分别将每个时间片叶子节点与每个子空间叶子节点映射一个时空文件,具体包括:分别确定每个时间片叶子节点的标识,以及每个子空间叶子节点的标识;采用预设散列算法,使每个时间片叶子节点的标识与每个子空间叶子节点的标识生成一个散列结果;并将得到的散列结果确定为时空文件的标识,其中,所述时空文件为该散列结果对应的时间片叶子节点所表征的时间片,以及子空间叶子节点所表征的子空间映射的时空文件。结合第一方面,或者结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,还包括:向所述时空文件中存储待存储的时空数据。结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,向所述时空文件中存储待存储的时空数据,具体包括:基于预设类目的预设排序方式,确定所述待存储的时空数据的存储顺序;按照确定的存储顺序,将该时空文件中属于同一类目且具有相同数据格式的待存储的时空数据,采用第一算法进行编码压缩存储;并将该时空文件中属于同一类目且具有相同数值的待存储的时空数据,采用第二算法进行编码压缩存储,并使存储后的待存储的时空数据符合预设分布式查询运算结构。结合第一方面,或者结合第一方面的第一种可能的实现方式,在第四种可能的实现方式中,将预设时间范围作为根节点,采用如下方法生成多级时间索引树:将所述预设时间范围划分为长度相同的预设数量个子时间片,并循环执行如下步骤,直到当前得到的子时间片长度等于所述时间片叶子节点表征的时间片长度为止:将当前得到的子时间片作为该子时间片的父时间片对应的时间片节点的子节点;并将所述当前得到的子时间片进一步划分为长度相同的预设数量个子时间片;或者根据所述预设时间范围内,产生的时空数据在所述预设时间范围内的分布,将所述预设时间范围划分为长短不同的子时间片,并循环执行如下步骤,直到当前得到的子时间片长度符合所述时间片叶子节点表征的时间片长度为止:将当前得到的子时间片作为该子时间片的父时间片对应的时间片节点的子节点;并根据所述当前得到的子时间片内,产生的时空数据在所述当前得到的子时间片内的分布,将所述当前得到的子时间片进一步划分为长短不同的子时间片,其中,在所述当前得到的子时间片内,时空数据分布越密集的时间段划分成的子时间片越多。结合第一方面,或者结合第一方面的第一种可能的实现方式,在第五种可能的实现方式中,将预设空间范围作为根节点,采用如下方法生成多级空间索引树:将所述预设空间范围划分为长度相同的预设数量个子空间,并循环执行如下步骤,直到当前得到的子空间大小等于所述子空间叶子节点表征的子空间大小为止:将当前得到的子空间作为该子空间的父空间对应的子空间节点的子节点;并将所述当前得到的子空间进一步划分为长度相同的预设数量个子空间;或者根据所述预设空间范围内,产生的时空数据在所述预设空间范围内的分布,将所述预设空间范围划分为大小不同的子空间,并循环执行如下步骤,直到当前得到的子空间大小符合所述子空间叶子节点表征的子空间大小为止:将当前得到的子空间作为该子空间的父空间对应的子空间节点的子节点;并根据所述当前得到的子空间内,产生的时空数据在所述当前得到的子空间内的分布,将所述当前得到的子空间进一步划分为大小不同的子空间,其中,在所述当前得到的子空间内,时空数据分布越密集的空间划分成的子空间越多。第二方面,提供一种时空数据查询方法,包括:确定时间查询条件在多级时间索引树中对应的时间片节点,以及空间查询条件在多级空间索引树中对应的子空间节点;分别确定以确定的时间片节点为根节点的时间索引子树的所有时间片叶子节点,以及以确定的子空间节点为根节点的空间索引子树的所有子空间叶子节点;在确定的每个时间片叶子节点与每本文档来自技高网
...

【技术保护点】
一种时空数据的索引建立方法,其特征在于,包括:将预设时间范围作为根节点生成多级时间索引树;其中,所述多级时间索引树包含多个时间片节点,且越靠近根节点的时间片节点表征的时间片越长;并将预设空间范围作为根节点生成多级空间索引树;其中,所述多级空间索引树包含多个子空间节点,且越靠近根节点的子空间节点表征的子空间越大;分别将每个时间片叶子节点与每个子空间叶子节点映射一个时空文件;其中,所述时空文件用于存储与该时空文件具有映射关系的时间片叶子节点表征的时间片及子空间叶子节点表征的子空间对应的时空数据。

【技术特征摘要】

【专利技术属性】
技术研发人员:袁明轩张世明谭浩宇
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1