面向列存储数据仓库的多维OLAP查询处理方法技术

技术编号：7759291 阅读：404 留言：0更新日期：2012-09-14 01:26

本发明专利技术公开了一种面向列存储数据仓库的多维OLAP查询处理方法。它将OLAP查询分解为位图过滤操作、分组操作和聚集操作。在位图过滤操作中，首先将谓词在维表上执行并生成谓词向量位图，通过代理键地址映射将连接操作转换为直接维表记录访问操作，实现按位置进行访问；在分组操作中，将满足过滤条件的事实表记录按SQL命令中的分组属性预生成分组单元并分配递增的ID；在聚集操作中，通过对事实表度量属性的一趟列扫描实现按事实表分组过滤向量的分组项进行分组聚集计算。本发明专利技术只需要对事实表进行一趟列扫描即可完成全部的OLAP处理任务，避免了多次扫描的代价。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种0LAP(联机分析处理)查询处理方法，尤其涉及一种面向列存储数据仓库，基于星型连接模型的多维OLAP查询处理方法，属于数据库管理

技术介绍
联机分析处理(On-Line Analytical Processing,简写为0LAP)的设计目标是满足决策支持或者多维环境下特定的查询和报表需求。数据仓库和OLAP是企业级决策处理的重要支撑技术。但是，海量数据上的OLAP性能难以满足日益增长的实时高性能分析处理的需求。其性能的瓶颈主要体现在两个方面一是较低的硬盘I/o性能，二是查询处理技术不够优化。提高硬盘I/o性能的主流技术是列存储。列存储可以实现对数据按列存储和访问。目前，列存储数据库采用的查询处理技术主要有两类，一类是列数据查询处理技术，另一类是通过数据在内存的缓存将列存储数据动态转换为行存储数据，然后使用传统的行存储查询处理技术。列数据查询处理技术将关系代数细化为列代数，将关系操作分解为若干有序的列操作。列数据查询处理技术需要产生大量的物化连接索引和额外的列间连接操作代价，在OLAP查询中需要对事实表外键列进行两次扫描以完成过滤和分组操作，增加了额外的I/O访问开销。当前广泛采用的动态列/行转换查询处理技术，通过将数据按列访问提高投影操作的I/o效率，但在查询处理层次上仍然采用行存储的流水线(pipeline)查询处理技术。该流水线查询处理技术要对查询处理所需的连接数据进行先物化，当选择率较低时，大量物化数据最终被抛弃，消耗了额外的内存带宽资源，降低了内存处理性能。并行OLAP的主要应用场景是内存数据库。在行存储数据库中，具...

【技术保护点】

【技术特征摘要】
...

【专利技术属性】
技术研发人员：张延松，王珊，
申请(专利权)人：中国人民大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人