出租车交通数据同构网络可视化方法、系统及其存储介质技术方案

技术编号:28295589 阅读:17 留言:0更新日期:2021-04-30 16:19
本发明专利技术公开了一种出租车交通数据同构网络可视化方法、系统及其存储介质。系统包括数据处理模块、数据存储模块、交互查询模块以及可视化展示模块,出租车的订单记录数据上传至服务器,数据经处理后通过Geohash算法经纬度数据进行编码,把一定范围内的经纬度进行合并作为一个地点,并把结果以不同形式存入MySQL数据库以及Neo4j数据库,通过交互设置查询筛选节点的条件,可以对数据进行可视化。本发明专利技术结合了知识图谱技术可以把一定范围内的所有的交通数据展示为图结构,借助图形化的手段使得可视化更加清晰明了,可以更容易的发掘城市地点之间关系。

【技术实现步骤摘要】
出租车交通数据同构网络可视化方法、系统及其存储介质
本专利技术涉及知识图谱和数据可视化领域,尤其涉及一种基于知识图谱的出租车交通数据的同构网络可视化方法、系统及其存储介质,该方法结合知识图谱,把出租车的交通数据化为同质网络结构进行存储,并通过用户交互可以对同质网络进行可视化。
技术介绍
随着互联网智慧城市的不断推进,越来越多的城市数据可以被使用,我们可以通过使用分析这些数据,来作出更好的决策从而可以改变人们的生活。但于此同时数据的异构性多态性使得储存数据、处理数据、探索数据时会有巨大挑战,这类复杂数据以以往的关系数据库存储就很麻烦。即使存储好了,往后想要探索这类数据往往会出现关系缺失,查询时间长等问题困扰。也正是因为日益增多的数据呈现出的多态性和异构性使得知识图谱技术的出现和发展。知识图谱旨在通过图的结构描述出真实的实体和实体之间的的关系,在一张图中,图的顶点表示的是实体,可以是一个具体的人也可以是一个地点,图的边就代表了他们之间的关系。这样的图结构存储与以往的关系数据库存储相比多出了很多信息,能发掘出更深层的信息。数据可视化主要是通过图形的方式让用户更加直观的看到数据了解数据的技术,图结构天然的与数据可视化的目的相符合。目前在交通数据的数据可视化中,大多都是选择使用关系型数据库作为可视化的数据存储,这样的存储方法往往造成数据冗余,通常需要多个数据表,并且没有办法体现每条行程之间的关系。
技术实现思路
本专利技术针对现有技术的不足提供一种基于知识图谱的出租车交通数据的同构网络可视化方法、系统及其存储介质,通过数据处理把交通数据清理合并,并转换成图结构进行储存,解决了以往关系库数据存储无法很好表达行程之间的关系以及数据表冗余的缺点。本专利技术采用的技术方案如下:基于知识图谱的出租车交通数据的同构网络可视化方法,包括如下:将每个出租车在完成乘客接送后的订单记录数据上传至服务器,包括:上下车时间、上下车经纬度、旅行距离、旅行时长;对服务器中的数据进行整理:删除无效数据,并对数据格式进行统一;通过Geohash算法对整理后数据中的上下车经纬度信息进行编码,对编码后的上下车位置经过去重合并后,将数据对应原有形式存储在MySQL数据库,并把经上述处理的数据以图结构存储进入Neo4j图数据库;用户通过交互界面设置筛选条件对MySQL或者Neo4j数据库进行查询,将查询返回的数据进行可视化展示。上述技术方案中,进一步的,所述的删除无效数据,并对数据格式进行统一,具体为:删除无效的脏数据,包括订单记录数据中的旅行时间、旅行距离、上下车时间中的异常值,以及去除经度超出[-180,180]或纬度超出[-90,90]的上下车经纬度数据;并将上下车时间数据按日期格式进行统一。进一步的,采用geohash算法对整理后数据中的上下车经纬度信息进行编码,获得上车位置编码和下车位置编码,去除上车位置编码与下车位置编码相同的数据,得到编码清理后数据;将编码清理后数据以原有的形式存入MySQL数据库作为行程的详细数据存储,对MySQL数据库设置索引以方面快速查询。更进一步的,将编码清理后数据以图结构存储进入Neo4j图数据库,图结构包括节点集合和边集合,若在Neo4j图数据库中已经存在节点集合中的节点就不添加,如果不存在节点集合中的节点就添加新节点,再将边集合存入Neo4j图数据库,对Neo4j图数据库的节点设置索引,以方便快速查询。进一步的,用户通过交互界面设置筛选条件对MySQL或者Neo4j数据库进行查询,将查询返回的数据进行可视化展示,具体如下:用户通过设置筛选条件进行查询地理节点,从Neo4j图数据库查询出特定图结构返回,并从MySQL数据库中查询特定的行程详细数据返回,通过Echarts关系图依据返回的数据设置其中的nodes选项和edges选项完成关系图可视化。一种基于知识图谱的出租车交通数据的同构网络可视化系统,基于上述方法实现,包括数据处理模块、数据存储模块、交互查询模块、可视化展示模块;数据处理模块用于实现对数据的整理、以及Geohash算法对整理后数据去重合并;数据存储模块,包括MySQL数据库和Neo4j图数据库;交互查询模块用于供用户设置筛选条件以对MySQL数据库和Neo4j图数据库进行查询,并将结果返回给可视化展示模块进行展示。进一步的,所述的可视化展示模块中,在图结构展示时,若点击图中的节点,可以完成图的扩展生长,若点击图中的边,可以查询两地点之间的详细行程记录,此外可视化展示模块中还设置有布局按钮,以改变全局状态和重新设置Echarts图结构的状态,包括力学布局,圆形布局,树形布局,方形布局。本专利技术还提供一种存储介质,存储有上述的系统或者包括能够被处理器加载执行实现上述方法的程序。本专利技术的有益效果是:本专利技术基于知识图谱技术可以把一定范围内的所有的出租车交通数据展示为图结构,借助图形化的手段使得可视化更加清晰明了,可以更容易的发掘城市地点之间关系。附图说明图1是本专利技术系统的工作流程示意图。图2是本专利技术的步骤2)的具体流程示意图。图3是本专利技术的交互查询模块和可视化模块工作流程示意图。图4是本专利技术一种具体系统的主界面示意图。图5是本专利技术一种具体系统中通过界面交互设置筛选条件示意图。图6是本专利技术的图结构展示示意图。图7是本专利技术的图中节点信息显示示意图。图8是本专利技术的图中边的行程详细信息展示示意图。图9是本专利技术的图扩展功能示意图。图10是本专利技术的图结构圆形布局示意图。图11是本专利技术的图结构树布局示意图。图12是本专利技术的图结构方形布局示意图。图13是本专利技术的图结构中所有行程的地图展示示意图。图14是本专利技术所有行程的地图3D展示示意图。具体实施方式下面结合附图和具体实例对本专利技术进行进一步说明。参照图1、2、3,本专利技术的基于知识图谱的出租车交通数据的同构网络可视化系统,包括数据处理模块、数据存储模块、交互查询模块、可视化展示模块;数据处理模块用于实现对数据的整理、以及Geohash算法对整理后数据去重合并;数据存储模块,包括MySQL数据库和Neo4j图数据库;交互查询模块用于供用户设置筛选条件以对MySQL数据库和Neo4j图数据库进行查询,并将结果返回给可视化展示模块进行展示。相应方法包括以下步骤:1)每个出租车在完成乘客接送后的订单记录都会进行打包上传至大数据服务器,从服务器中获取这部分数据对数据进行整理删除无效的脏数据以及异常值,并对数据格式进行统一;2)经过步骤1)处理后的数据通过Geohash算法对数据中的经纬度信息进行编码,得到的数据经过合并处理后,输入进数据存储模块,可以在MySQL关系型数据库存储的基础上,再把对应行程数据化为图结构存储进入图数据库Neo4j中。3)通过用户的交互可以设置筛选条件,可以通过这些条件对Neo4j或者本文档来自技高网...

【技术保护点】
1.基于知识图谱的出租车交通数据的同构网络可视化方法,其特征在于,包括如下:/n将每个出租车在完成乘客接送后的订单记录数据上传至服务器,包括:上下车时间、上下车经纬度、旅行距离、旅行时长;对服务器中的数据进行整理:删除无效数据,并对数据格式进行统一;通过Geohash算法对整理后数据中的上下车经纬度信息进行编码,对编码后的上下车位置经过去重合并后,将数据对应原有形式存储在MySQL数据库,并把经上述处理的数据以图结构存储进入Neo4j图数据库;用户通过交互界面设置筛选条件对MySQL或者Neo4j数据库进行查询,将查询返回的数据进行可视化展示。/n

【技术特征摘要】
1.基于知识图谱的出租车交通数据的同构网络可视化方法,其特征在于,包括如下:
将每个出租车在完成乘客接送后的订单记录数据上传至服务器,包括:上下车时间、上下车经纬度、旅行距离、旅行时长;对服务器中的数据进行整理:删除无效数据,并对数据格式进行统一;通过Geohash算法对整理后数据中的上下车经纬度信息进行编码,对编码后的上下车位置经过去重合并后,将数据对应原有形式存储在MySQL数据库,并把经上述处理的数据以图结构存储进入Neo4j图数据库;用户通过交互界面设置筛选条件对MySQL或者Neo4j数据库进行查询,将查询返回的数据进行可视化展示。


2.根据权利要求1所述的基于知识图谱的出租车交通数据的同构网络可视化方法,其特征在于,所述的删除无效数据,并对数据格式进行统一,具体为:
删除无效的脏数据,包括订单记录数据中的旅行时间、旅行距离、上下车时间中的异常值,以及去除经度超出[-180,180]或纬度超出[-90,90]的上下车经纬度数据;并将上下车时间数据按日期格式进行统一。


3.根据权利要求1所述的基于知识图谱的出租车交通数据的同构网络可视化方法,其特征在于,采用geohash算法对整理后数据中的上下车经纬度信息进行编码,获得上车位置编码和下车位置编码,去除上车位置编码与下车位置编码相同的数据,得到编码清理后数据;将编码清理后数据以原有的形式存入MySQL数据库作为行程的详细数据存储,对MySQL数据库设置索引以方面快速查询。


4.根据权利要求3所述的基于知识图谱的出租车交通数据的同构网络可视化方法,其特征在于,将编码清理后数据以图结构存储进入Neo4j图数据库,图结构包括节点集合和边集合,若在Neo4j图数据库中已经存在节点集合中的节点就...

【专利技术属性】
技术研发人员:张繁张煜辉
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1