海量数据库记录的归档和查询方法技术

技术编号：4184661 阅读：389 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种海量数据库记录的归档和查询方法，归档记录包括对海量数据库记录进行分组，利用倒排索引技术建立索引文件，对需要模糊查询的字段进行分词；采用压缩算法对记录分组压缩并写入数据文件；将索引文件和数据文件保存到文件系统中。查询归档记录的时候先对查询条件做预处理和分词，根据查询条件在索引中找到匹配的记录在数据文件中的文件指针信息；解压对应的记录并将记录的详细信息返回给用户或其他系统。本发明专利技术能够高效的对数据库海量记录的归档和查询，克服归档记录有限，查询复杂和性能低下，用户掌握困难等缺点；独立于数据库系统，对原有系统不造成任何影响；同时能够和第三方系统良好的集成和整合。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种数据库记录的归档和查询方法，具体涉及一种海量数据库记录的归档和查询方法。
技术介绍
在数据库系统中，对于数据量会不断增长的数据库表，当数据量积累到一定规模以后，往往使得系统的性能下降非常明显，不管是査询、新增、修改还是删除，数据量增大以后，对数据库系统的日常维护，如备份等会造成很多麻烦。对于这种数据会不停增长的表，如操作日志，超过一定时间以后其中的记录会被修改的几率就会很小，形成历史记录，对这些记录的处理一个比较好的方式就是执行归档。目前对大量历史记录的归档的处理虽然有多种方式，但是均不是很理想；要么实现效果不好，要么太复杂成本太高。本专利技术的目的就是为了提供一种对海量数据的归档方式，能够简单、高效的存储和访问这些数据。其基本思路是在归档的时候，对不同的数据进行分别处理，建立索引和压縮的数据文件，将归档文件(索引文件和数据文件)存储在文件系统中，并对归档以后的记录提供独立高效的查询支持。现有解决数据库表中历史数据的问题，通常有以下几种方案，将逐一分析其应用的局限和不足(1)在原有表的基础上，增加归档表这种方案将超过一定时间的历史记录转移到归档表中进行保存。查询的时候，如果在当前的数据表中没有查到，就转到归档表中进行査询。这种方案能够在比较短的时间或者数据量增长不是很迅速的时候，基本能够满足需求。但是如果数据量增长很快，那么归档表中的记录也会增加很庞大，严重影响性能；同时这种方案也不能无限制的保留归档记录。(2) 多个归档表加删除记录在单个归档表的基础上，再增加一定数量的归档表，归档表进行循环使用，当归档表使用...

【技术保护点】
一种海量数据库记录的归档方法；其特征在于，包括如下步骤：　　　　（１）在数据库中获取一个需要归档的表中的记录；　　　　（２）将步骤（１）获取的记录进行分组；　　　　（３）对分组后的各组记录建立索引文件；　　　　（４）对建立好索引文件的组进行数据压缩后归档；　　　　（５）重复步骤（３）和步骤（４）直至步骤（１）获取的记录全部归档；　　　　（６）若所述数据库中还有未归档的表，则返回步骤（１）。

【技术特征摘要】

【专利技术属性】
技术研发人员：王新春，代真虎，徐培杰，
申请(专利权)人：上海宝信软件股份有限公司，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人