一种基于内存数据库和Hbase存取大数据的方法及系统技术方案

技术编号：13739896 阅读：208 留言：0更新日期：2016-09-22 16:22

本发明专利技术公开了一种基于内存数据库和Hbase存取大数据的方法及系统，其中，所述的方法包括：S1、读取多个待处理的源文件，分别对每一个所述源文件进行任务处理，其中，一个任务处理包括多个处理步骤；S2、每一个源文件进行了每一个处理步骤后，以第一预设方式将每一个源文件的文件处理状态存储于内存数据库中；S3、将每一个源文件的每一个处理步骤后的文件数据以第二预设方式存储于Hbase中。本发明专利技术将任务处理过程中的中间数据文件存放于Hbase中，而将每一个文件经过每一个处理步骤后的文件处理状态存放于内存数据库中，利用了Hbase可存放大数据以及内存数据库访问速度快的优势，能够实现数据的快速存取和快速访问。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据存取
，具体涉及一种基于内存数据库和Hbase存取大数据的方法及系统。
技术介绍
分布式内存数据库是个内存数据库，所有数据都存储在内存中，可以发挥出内存访问的超强速度优势。通过全量数据文件(checkpoint)和redo日志保证数据可靠性。支持sql灵活访问数据。同时，分布式内存数据库是分布式的，部署在网络的多个节点上，对外提供统一的访问接口。Hbase是一种NOSQL数据库；Hbase中的数据，可以很方便按照rowkey或者rowkey的范围检索出来，但是无法满足不以rowkey为关键字的灵活查询的需要。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于内存数据库和Hbase存取大数据的方法及系统，能够提高数据的存取速度。本专利技术解决上述技术问题的技术方案如下：一方面，本专利技术提供了一种基于内存数据库和Hbase存取大数据的方法，包括：S1、读取多个待处理的源文件，分别对每一个所述源文件进行任务处理，其中，一个任务处理包括多个处理步骤；S2、每一个源文件进行了每一个处理步骤后，以第一预设方式将每一个
源文件的文件处理状态存储于内存数据库中；S3、将每一个源文件的每一个处理步骤后的文件数据以第二预设方式存储于Hbase中。另一方面，本专利技术提供了一种基于内存数据库和Hbase存取大数据的系统，包括：文件读取模块，用于读取多个待处理的源文件；任务处理模块，用于对每一个所述源文件进行任务处理，其中，一个任务处理包括多个处理步骤；第一存储模块，用于当每一个源文件进行了每一个处理步骤后，以第一预设方式将每一个源...

【技术保护点】
一种基于内存数据库和Hbase存取大数据的方法，其特征在于，包括：S1、读取多个待处理的源文件，分别对每一个所述源文件进行任务处理，其中，一个任务处理包括多个处理步骤；S2、每一个源文件进行了每一个处理步骤后，以第一预设方式将每一个源文件的文件处理状态存储于内存数据库中；S3、将每一个源文件的每一个处理步骤后的文件数据以第二预设方式存储于Hbase中。

【技术特征摘要】
1.一种基于内存数据库和Hbase存取大数据的方法，其特征在于，包括：S1、读取多个待处理的源文件，分别对每一个所述源文件进行任务处理，其中，一个任务处理包括多个处理步骤；S2、每一个源文件进行了每一个处理步骤后，以第一预设方式将每一个源文件的文件处理状态存储于内存数据库中；S3、将每一个源文件的每一个处理步骤后的文件数据以第二预设方式存储于Hbase中。2.如权利要求1所述的基于内存数据库和Hbase存取大数据的方法，其特征在于，为每一个任务处理配置一个进程序号，所述步骤S2具体包括：对每一个源文件进行了每一个处理步骤之后，以进程序号加文件标识为索引将每一个源文件的文件处理状态以及该源文件的处理时间以数据表格的形式存储于内存数据库中。3.如权利要求2所述的基于内存数据库和Hbase大数据存取的方法，其特征在于，所述步骤S3具体包括：为每一个源文件的每一个处理步骤后的文件设计合理的Rowkey，以Rowkey为索引将文件数据以数据表格的形式存储于Hbase中，其中，以进程序号加文件标识作为Rowkey。4.如权利要求3所述的基于内存数据库和Hbase大数据存取的方法，其特征在于，根据每一个源文件中的数据量按照第一预定时间间隔建立对应的数据表格，并存储于相应的内存数据库或Hbase中。5.如权利要求4所述的基于内存数据库和Hbase大数据存取的方法，其特征在于，按照第二预定时间间隔定期清理相应的数据表格。6.如权利要求1-5任一项所述的基于内存数据库和Hbase大数据存取的方法，其特征在于，当出现异常宕机或者磁盘故障重启时，从内存数据库中读取...

【专利技术属性】
技术研发人员：李晓静，
申请(专利权)人：北京思特奇信息技术股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人