The invention discloses a security OLAP large data preprocessing method and online analysis query method, which comprises the following steps: extracting data from the original construction of the data warehouse database; extracting single dimensional data from the data warehouse; for the combination between single dimensional data and single dimensional data constructed from reverse mapping data attributes to ID, and the construction of key using the database reverse mapping; combinatorial screening data attributes appropriate, to ensure the combination of multi attributes can be multi-dimensional data aggregation results; get different segmentation by combination of attribute data, through the different combination of segmentation to remove redundant segmentation, so as to guarantee with the least segmentation to achieve all segmentation combination then the structure of one-dimensional CUBE, complete the pretreatment process. The invention can effectively represent the result of the data model of the multidimensional query and reduce the storage space occupied by the data model.
【技术实现步骤摘要】
一种社保大数据OLAP预处理方法及在线分析查询方法
本专利技术涉及大数据处理
,特别涉及一种社保大数据OLAP预处理方法及在线分析查询方法。
技术介绍
随着信息数据时代的来临,政府、企业等机构累积产生了大量社保数据,这些数据蕴含着大量的信息,但是需要合理的挖掘才能形成有用的可供处理的信息,以便于对未来进行预测和适时地做出决策。许多企业级别的系统能够达到TB、PB的数据量,而对于分析决策者而言,需要从中提取出可供参考的信息。目前通用的做法是,使用OLAP(OnlineAnalyticalProcessing,在线分析处理)数据仓库,将历史数据经过一系列的提取、清理、装载等步骤存放到数据变动相对较小的数据仓库中,再进行在线分析处理OLAP,就能得到相关的信息以供决策。我国的社保信息化管理已经经过多年的发展完善,但当下对五种社保信息系统的管理,仍然很难独立的进行有效的处理,更不用说直接进行操作。在线分析处理(OLAP)可以将原始数据转化为贴近用户所理解的业务维度,提供从各种角度(切片、聚集等)观察信息的技术,便于分析管理人员快速、一致、交互地访问数据。OLAP的功能特点是提供动态多维的查询、分析、整合数据,支持多用户的分析活动,包括各个维度的计算和查询应用,通过多层次结构进行趋势分析,进行子集切片细致查看,钻取到更深的层次,旋转到新的维度进行可见的区域比较等。数据分析应用程序经常对聚集在不同的层面上的数据挖掘一些非常理的模式。对于这种问题,传统方法是使用GROUPBY操作,但它已被证明不适合大量的数据分析应用。所以在1997年提出了一个新的替代它的方法,它 ...
【技术保护点】
一种社保大数据OLAP预处理方法,其特征在于,包括以下步骤:S1、从原始数据库提取数据构建数据仓库;S2、从数据仓库提取单维数据;S3、针对单维数据以及单维数据之间的组合构建从数据属性到ID的反向映射,并利用反向映射构建键值对数据库;S4、筛选合适的数据属性的组合,保证对多维属性的组合可以得到多维数据聚合的结果;S5、由数据属性的组合得到不同的分割,通过各种不同的分割组合来去除重复冗余的分割,从而保证用最少的分割达到所有的分割组合,然后构造一维的CUBE,完成预处理过程。
【技术特征摘要】
1.一种社保大数据OLAP预处理方法,其特征在于,包括以下步骤:S1、从原始数据库提取数据构建数据仓库;S2、从数据仓库提取单维数据;S3、针对单维数据以及单维数据之间的组合构建从数据属性到ID的反向映射,并利用反向映射构建键值对数据库;S4、筛选合适的数据属性的组合,保证对多维属性的组合可以得到多维数据聚合的结果;S5、由数据属性的组合得到不同的分割,通过各种不同的分割组合来去除重复冗余的分割,从而保证用最少的分割达到所有的分割组合,然后构造一维的CUBE,完成预处理过程。2.根据权利要求1所述的社保大数据OLAP预处理方法,其特征在于,数据属性到ID的反向映射通过键值对数据库程序接口LMDB来进行存储。3.根据权利要求1所述的社保大数据OLAP预处理方法,其特征在于,根据需求建立一种新的表示分割的数据结构,分为两部分,第一部分表示它的ID,即它所在原始数据库中的ID值;第二部分表示它所属于的类的ID,即把ID分割成许多子集,每个子集的ID。4.根据权利要求3所述的社保大数据OLAP...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。