一种基于Hadoop+Hbase的农业时序数据组织方法技术

技术编号：7759272 阅读：482 留言：0更新日期：2012-09-14 01:25

一种基于Hadoop+Hbase的农业时序数据组织方法，属于农业经济技术信息的分析领域。主要解决了具有时间属性的农业经济技术海量数据在Hadoop+Hbase云计算基础平台上的科学组织问题，用于海量数据的存储。技术方案的要点是在数据组织存储阶段，利用多数农业经济技术数据具有时间属性、较晚的数据被查询的概率较高的的实际情况下，在原始数据中增加与实际时间数据辅助的反向时序数据，反向时序值与实际时间值在数值上是负相关的，因此实际时间越晚反向时序值越小，升序排列越靠前，在顺序查找时越能较快查到。在数据查询阶段，将用户在查询条件中提供的实际时间值转换为反向时序值，组成主键键值，实现快速查询。

全部详细技术资料下载

【技术实现步骤摘要】

农业经济技术信息的分析领域。ニ
技术介绍
目前农业信息化发展迅速，农业网站建设、农业电子商务、农业市场信息、农业经济信息通过国际互联网迅速富集，在移动互联网迅速发展的未来，农业经济技术信息还有爆发式增长的趋势。这ー方面是农业信息化发展、农业产业化、农业现代化发展的必然结果，另一方面也为我们采集、存储、利用这些海量信息为农业生产服务提出了新的需求。当今，以Hadoop为代表的Key-Value NoSQL云计算技术，以其廉价、稳定、通用，已经逐渐成为各个行业进行海量数据采集、存储和分析的主要平台。其技术在应用中不断得到改进和发展。但是，在农业海量信息处理领域，还是刚刚起歩。结合农业生产和经营的特点形成的海量数据，以及围绕这些数据形成的数据处理利用的需求，都还缺乏很多公知的技术手段进行高效的处理。本专利技术解决的问题是在云计算基础平台Hadoop之上部署的大型数据库Hbase,然后存储。在利用中发现查询结果发挥很慢，用户体验很差。经过研究发现与数据的组织方式有很大关系，因为Hadoop是基于主键顺序查找数据的，主键顺序设计不合理，就会直接影响查询结果返回的速度。很多数据都是具有时间顺序属性的，例如农产品的农贸市场价格信息是按照年月日的顺序采集、存储的，再如农产品期货市场价格信息是按照年月日和时分秒的顺序采集、存储的，还有农业气象的数据也是按照年月日和时分秒的时间顺序采集、存储的。越早的数据时间值越小，主键的字母序越是排在前面，查询就快，越新的数据时间值越大，主键的字母序越是排在后面，查询就慢。因为多数情况下，用户是使用最新的数据，所以就会频繁出现查询速度慢的...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：崔文顺，郭作玉，崔硕，王昕，曹亚男，
申请(专利权)人：农业部信息中心，北京华夏神农信息技术有限公司，廊坊市大华夏神农信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人