一种面向大规模路网数据的近似关键字存储和查询方法技术

技术编号:26031157 阅读:31 留言:0更新日期:2020-10-23 21:08
本发明专利技术公开了一种面向大规模路网数据的近似关键字存储和查询方法,属于及路网数据处理技术领域。本发明专利技术的存储方法为:对原始路网数据进行预处理得到预处理结果;根据预处理结果构建R‑Tree索引、点索引、邻接点B*‑Tree索引以及兴趣点B*‑Tree索引,且索引之间通过指针相互关联;将构建的索引存入外存存储空间。本发明专利技术的查询方法为:根据存储方法存储的索引进行查询。本发明专利技术的目的在于克服现有技术中,路网数据存储空间的利用率较低,且路网数据的查询效率较低的不足,提供了一种面向大规模路网数据的近似关键字存储和查询方法,可以提高路网数据存储空间的利用率,并且可以大大提高路网数据的查询效率。

【技术实现步骤摘要】
一种面向大规模路网数据的近似关键字存储和查询方法
本专利技术涉及路网数据处理
,更具体地说,涉及一种面向大规模路网数据的近似关键字存储和查询方法。
技术介绍
近年来,随着科学技术的高速发展,及社会信息化的普及,传统通过人为采集信息的方式逐渐被电子设备所替代。同时,随着数据采集设备的多样化、5G网络的迅速发展及人们对空间地理信息领域越来越深入的研究,产生了规模庞大的地理空间数据,且数据量呈指数级增长,同时空间数据的高计算复杂性,都给数据的存储和查询等一系列处理过程带来了巨大的挑战。在传统数据库中,数据以二维表的形式组织存放,其存储和表示的方式单一,而空间数据是多维的,且信息量大,信息复杂度高,传统数据库无法有效地存储、处理、展现空间数据信息。为了弥补传统数据库在处理空间数据上的不足,空间数据库应运而生。数据查询功能是传统数据库和空间数据库操作中的基本功能。从数据库系统中保存的大规模数据集中查询所需信息时,往往采用索引结合算法的方式提高查询效率。就索引结构而言,在传统数据库中,通常使用B-Tree、B+-Tree等索引结构,空间数据库通常使用R-Tree以及R-Tree的变种形式即R*-Tree的空间索引结构,而索引的结构、性能直接影响数据库的性能。空间数据库中数据的查询比较复杂,需要考虑对象的很多属性,如对象的功能描述信息、地理位置信息等,这些属性都是以文本的形式进行描述,因此在查询中还需要考虑缺词、错词、歧义等特殊情况,这就涉及到空间近似关键字查询的问题,目前已有空间近似关键字查询的概念,并有了深入研究。面对空间数据库中的大规模数据,传统的索引结构和查询方法在效率上已经难以满足用户日益增长的需求,且面对不断增长的空间数据,整体速率依然呈下降的态势。针对以上问题,研究者提出了许多解决方案,在众多解决方案中,减少数据源是其中最基础也是最简单的的方法。但数据库中数据量的增长不可避免,直接减少总体数据量的方法不可行,只能通过划分查询区域,间接减少待查询数据的规模。随着并行技术的高速发展,通过并行空间索引机制来提高效率也是较好的方法。此外,通过在原始索引基础上使用改进的索引结构如MHRtree且配合新的查询算法如平衡分区的自适应算法,亦可以有效的提高查询效率。路网数据作为空间数据中的一种特殊情况,逐渐引起关注。同空间数据查询问题一样,路网数据查询同样存在着效率逐渐降低的问题。综上所述,如何提高存储路网数据空间的利用效率以及路网数据的查询效率,是现有技术亟需解决的问题。
技术实现思路
1.要解决的问题本专利技术的目的在于克服现有技术中,路网数据存储空间的利用率较低,且路网数据的查询效率较低的不足,提供了一种面向大规模路网数据的近似关键字存储和查询方法,可以提高路网数据存储空间的利用率,并且可以大大提高路网数据的查询效率。2.技术方案为了解决上述问题,本专利技术所采用的技术方案如下:本专利技术的一种面向大规模路网数据的近似关键字存储方法,包括:对原始路网数据进行预处理得到预处理结果;再根据预处理结果构建R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引,且R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引之间通过指针相互关联;之后将构建的R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引存入外存存储空间。更进一步地,对原始路网数据进行预处理的具体过程为:根据原始路网数据得到叉路口点,再对具有密度特征代表的叉路口点进行聚类得到聚类结果,而后通过路网扩张将非特征叉路口点填入聚类结果中,再利用一趟聚类算法对聚类结果进行合并得到矩形全覆盖图,并根据兴趣点映射算法将兴趣点映射至路网中得到兴趣点集合。更进一步地,根据原始路网数据得到叉路口点的具体过程为:提取原始路网数据中的基本组成元素,根据基本组成元素构建node.txt文件和way.txt文件,其中,node.txt文件存储节点信息,way.txt文件存储路信息;之后通过node.txt文件定义得到叉路口点。更进一步地,根据预处理结果构建R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引的具体过程为:预处理结果包括node.txt文件和way.txt文件,根据矩形全覆盖图和node.txt构建R-Tree索引;依据node.txt文件遍历R-Tree的叶子节点构建点索引;根据node.txt文件和way.txt文件构建邻接点B*-Tree索引;根据兴趣点集合和way.txt文件构建兴趣点B*-Tree索引。更进一步地,通过路网扩张将非特征叉路口点填入聚类结果中的具体过程为:先使用最小外包多边形对聚类结果进行包裹;再对最小外包多边形进行扩张,扩张按照从高叉路口往低叉路口的方向进行,对扩张后的最小外包多边形中取最小外包矩形进行包裹。更进一步地,利用一趟聚类算法对聚类结果进行合并得到矩形全覆盖图的具体过程为:对若干最小外包矩形的面积使用盒图找出面积异常值点,再利用一趟聚类算法对小于异常值点的面积进行合并得到矩形全覆盖图。更进一步地,根据node.txt文件和way.txt文件构建邻接点B*-Tree索引的具体过程为:在node.txt文件和way.txt文件中选取基本组成元素组成路段标识作为节点中的关键字,根据关键字从底层构建至第一层得到邻接点B*-Tree索引,其中,上层节点通过抽取下层节点第一个关键字进行构建。更进一步地,根据兴趣点集合和way.txt文件构建兴趣点B*-Tree索引的具体过程为:对兴趣点关键字构建倒排列表,根据兴趣点关键字从底层构建至第一层得到兴趣点B*-Tree索引,其中,上层节点通过抽取下层节点第一个兴趣点关键字进行构建。本专利技术的一种面向大规模路网数据的近似关键字查询方法,采用上述的一种面向大规模路网数据的近似关键字存储方法存储的索引进行查询。更进一步地,包括;先获取查询请求;再根据查询请求查找对应的索引,并根据索引得到近似关键字集合路径列表;之后根据路径列表读取与查询请求对应的数据文件;其中,索引包括R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引。3.有益效果相比于现有技术,本专利技术的有益效果为:(1)本专利技术的一种面向大规模路网数据的近似关键字存储方法,通过构建R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引,并且索引之间通过指针相互关联,从而增强了路网数据在逻辑中的紧密性,以此提高了数据的关联性,进一步可以提高存储空间的利用效率。(2)本专利技术的一种面向大规模路网数据的近似关键字查询方法,在利用所构建的外存索引文件进行近似关键字查询步骤中,提出空间和近似关键字并行的KNN查询方法,代替传统的两种查询方式串行的查询方法,提高了查询效率;可以实现秒级的多近邻查询任务,达到近实时查询,进一步可以实现对大数据的处理。附图说明图1为本专利技术的一种面向大本文档来自技高网
...

【技术保护点】
1.一种面向大规模路网数据的近似关键字存储方法,其特征在于,包括:/n对原始路网数据进行预处理得到预处理结果;/n根据预处理结果构建R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引,且R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引之间通过指针相互关联;/n将构建的R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引存入外存存储空间。/n

【技术特征摘要】
1.一种面向大规模路网数据的近似关键字存储方法,其特征在于,包括:
对原始路网数据进行预处理得到预处理结果;
根据预处理结果构建R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引,且R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引之间通过指针相互关联;
将构建的R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引存入外存存储空间。


2.根据权利要求1所述的一种面向大规模路网数据的近似关键字存储方法,其特征在于,对原始路网数据进行预处理的具体过程为:
根据原始路网数据得到叉路口点,再对具有密度特征代表的叉路口点进行聚类得到聚类结果,而后通过路网扩张将非特征叉路口点填入聚类结果中,再利用一趟聚类算法对聚类结果进行合并得到矩形全覆盖图,并根据兴趣点映射算法将兴趣点映射至路网中得到兴趣点集合。


3.根据权利要求2所述的一种面向大规模路网数据的近似关键字存储方法,其特征在于,根据原始路网数据得到叉路口点的具体过程为:
提取原始路网数据中的基本组成元素,根据基本组成元素构建node.txt文件和way.txt文件,其中,node.txt文件存储节点信息,way.txt文件存储路信息;之后通过node.txt文件定义得到叉路口点。


4.根据权利要求2所述的一种面向大规模路网数据的近似关键字存储方法,其特征在于,根据预处理结果构建R-Tree索引、点索引、邻接点B*-Tree索引以及兴趣点B*-Tree索引的具体过程为:
预处理结果包括node.txt文件和way.txt文件,根据矩形全覆盖图和node.txt构建R-Tree索引;依据node.txt文件遍历R-Tree的叶子节点构建点索引;根据node.txt文件和way.txt文件构建邻接点B*-Tree索引;根据兴趣点集合和way.txt文件构建兴趣点B*-Tree索引。


...

【专利技术属性】
技术研发人员:邰伟鹏陶荣荣付山赵佳俊胡涛王小林
申请(专利权)人:安徽工业大学安徽工大信息技术有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1