The invention belongs to the technical field of large data processing, and discloses an automatic thematic knowledge mining system and method. The system comprises an Internet of Things interface module, a semantic query module, a data mining module, a map aggregation and visualization module. The method comprises: first, data collection and database building, and then data acquisition based on Web ubiquitous network. The data of monitoring sensors and all kinds of thematic data are collected and stored in thematic database. Then thematic knowledge mining is carried out. Thematic knowledge is formed through ontology construction, semantic query and depth information mining, and the files are transferred to FTP file server. The thematic knowledge acquired from FTP file server and the geographic map are carried out. Geographical correlation, forming mapping data; layout design, thematic chart design, surface finishing; finally output thematic map. With the aid of machine learning algorithm under large data, the invention will process and analyze huge land and resources information through efficient and accurate methods.
【技术实现步骤摘要】
一种专题知识自动挖掘系统及方法
本专利技术属于大数据处理
,尤其涉及一种专题知识自动挖掘系统及方法。
技术介绍
近年来,大数据技术在全球发展迅猛,掀起了巨大的研究热潮,引起全球业界、学术界和各国政府的高度关注。随着计算机和信息技术的迅猛发展和普及应用,行业应用数据呈爆炸性增长。动辄达到数百TB甚至数PB规模的行业大数据已经远远超出了传统计算技术和信息系统的处理能力。与此同时,大数据往往隐含着很多在小数据量时不具备的深度知识和价值,大数据智能化分析挖掘将为行业带来巨大的商业价值,实现多种高附加值的增值服务,从而提升行业生产管理决策水平和经济效益。空间分析是地理学研究中研究的比较早的一个部分,经过了时代与历史的演变,换句话说地理学来源于空间分析。在早些年代,受到生存以及发展需要的驱使,人们必须要学会对周围地理事物之间的空间关系进行了解分析,所以各种各样的空间分析在使用着。地图渐渐的成为了地理学中的第二语言,从此,人们就开始有意无意的用到着很多种类的空间分析,包括在地图当中去测量各种地理物体之间的距离、方位以及面积,甚至会利用地图来做各种各样的战术研究以及战略策略等。在最近几年的发展当中,空间分析的涉及到的主要技术得到了很大的变化,地理信息系统技术和遥感技术营造了强大的空间数据分析环境,很多新的用来解决空间问题的分析模型以及处理方法都陆续的被挖掘出来了。一直在增加的海量的空间数据驱使着空间分析过程的改变,因此,基于数据层面的探索性的空间分析技术、空间可视化技术、空间数据挖掘技术以及基于人工智能的空间分析技术等面对大量的数据的空间数据分析方法非常受到关注,而 ...
【技术保护点】
1.一种专题知识自动挖掘系统,其特征在于,所述专题知识自动挖掘系统包括:物联网接口模块,用于数据的获取于存储、检索、导出、展示;语义查询模块,与物联网接口模块连接,用于通过本体文件构建本体模型并按类进行语义检索查询;数据挖掘模块,与物联网接口模块连接,用于对专题数据库中的数据进行分析挖掘,得到专题知识;将数据分析结果导入到Excel表格中;地图聚合及可视化模块,与数据挖掘模块连接,用于利用得到的专题知识进行专题地图制作和展示。
【技术特征摘要】
1.一种专题知识自动挖掘系统,其特征在于,所述专题知识自动挖掘系统包括:物联网接口模块,用于数据的获取于存储、检索、导出、展示;语义查询模块,与物联网接口模块连接,用于通过本体文件构建本体模型并按类进行语义检索查询;数据挖掘模块,与物联网接口模块连接,用于对专题数据库中的数据进行分析挖掘,得到专题知识;将数据分析结果导入到Excel表格中;地图聚合及可视化模块,与数据挖掘模块连接,用于利用得到的专题知识进行专题地图制作和展示。2.如权利要求1所述的专题知识自动挖掘系统,其特征在于,所述物联网接口模块包括:数据获取与存储模块,用于获取与存储数据;通过向数据提供网站发送请求以获得互联网数据并进行解析存储;还通过GPRS无线传输接收监测设备发送的实时数据;数据的检索模块,与数据获取与存储模块连接,用于对数据获取时间检索或对各项指标的数值范围进行查找;数据的导出模块,与数据获取与存储模块连接,用于将数据导出为Excel表格,并输送到到本地中;数据展示模块,与数据获取与存储模块连接,用于通过在输入框或者列表中选择指标种类和数值范围,使数据库中的数据按顺序显示在界面中。3.如权利要求1所述的专题知识自动挖掘系统,其特征在于,所述语义查询模块首先要从本地文件中选择本体文件,然后生成本体模型,生成本体模型后,选择检索词类别和检索词,显示语义查询结果;所述语义查询模块包括:本体构建模块和本体查询模块;所述本体构建模块根据需求确定的本体构建对象构建本体模型;本体查询模块对构建好的本体模型进行语义查询。4.如权利要求1所述的专题知识自动挖掘系统,其特征在于,数据挖掘模块,包括:FP-tree关联分析模块和随机森林分类模块;所述FP-tree关联分析模块用于反向挖掘出与专题知识关联度较高的指标;在频繁项集挖掘中存储关于频繁模式的压缩信息,所述FP-tree关联分析模块由一个根节点和作为其孩子的项前缀子树集合而成;项前缀子树的每个节点由三个域组成:节点名称、节点计数、节点链;其中节点计数表示到达该节点的路径上的事务个数,节点链指向树中具有同一名称的下一个节点;随机森林分类模块用于选取这些指标的数据采用随机森林方法训练模型以完成随机森林分类;所述随机森林分类模块为一个包含多个无剪枝分类回归树的组合分类器;所述组合分类器通过引入独立同分布的随机变量,利用训练集数据和随机变量生成决策树,最后利用集成学习的思想将所有决策树组合而成。5.如权利要求1所述的专题知识自动挖掘系统,其特征在于,所述地图聚合及可视化模块通过利用颜色渲染、图案填充、直方或饼状图形式将某种主题内容属性数据在地图上表现出来;利用专题地图的可视化效果,直观向用户展现相应的成果;所述地图聚合及可视化模块通过引入最新的地图制图及GIS技术,建立专题地图制作的新型地图制图;首先获取地理底图和专题知识数据,然后设计图面版式,详细设计专题图表,进行图面冲突处理,最后输出地图。6.如权利要求2所述的专题知识自动挖掘系统,其特征在于,所述数据获取与存储模块,包括网络API模块和GPRS无线传输模块;所述网络API模块负责通过向数据提供网站发送请求以获得互联网数据并进行解析存储;通过网络API获取气象监测数据;客户端发送请求到服务端,服务端调用API获取数据,然后发送JSON数据到客户端,客户端解析接收到的JSON数据然后存储到本地的MySQL数据库中;所述GPRS无线传输模块则负责通过GPRS无线传输...
【专利技术属性】
技术研发人员:刘强,刘沛文,黄耀森,陈晨,
申请(专利权)人:电子科技大学成都研究院,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。