一种大数据存储优化方法和装置制造方法及图纸

技术编号：11680325 阅读：170 留言：0更新日期：2015-07-06 12:59

本发明专利技术提出了一种大数据存储优化的方法和装置，所述方法包括：步骤S100，对待存储数据进行预处理；将所述待存储数据封装成对象数据，所述对象数据中添加有对象数据的属性信息，所述属性信息包括对象数据的数据类型；步骤S200，接收对象数据，根据对象数据的属性信息确定对象数据的数据类型；步骤S300，根据对象数据的数据类型将对象数据存储到不同的存储单元中。本发明专利技术通过利用不同的存储单元分别存储不同数据类型的数据，从而可以发挥不同存储单元的存储优势。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据存储领域，具体涉及一种大数据存储优化方法和装置。
技术介绍
随着移动互联网、物联网等应用的飞速发展，全球数据量出现了爆炸式增长。数据量的飞速增长预示着现在已经进入了大数据时代。数据按类型分为结构化数据、半结构化数据和非结构化数据，其中结构化数据是指能够以二维结构表示的一种数据类型，能通过关系型数据库存储；半结构化数据是指具有一定结构，但语义不够明确的一种数据类型，如邮件、HTML网页等，它们有些字段是确定的，也有些字段是不确定的；非结构化数据是指无法用二维结构表示的一种数据类型，主要包括办公文档、文本、图片、音视频文件等，无法采用关系型数据库进行处理。伴随社交网络的兴起和发展，产生了大量的UGC(User Generated Content，用户生成内容)，包括音频、视频、文本和图片等非结构化数据。在所有数据中，结构化数据占数据总量的20%，半结构化数据和非结构化数据占数据总量的80 %，如何科学管理和合理应用这些数据显得日益重要。传统的关系型数据库具有非常优异的性能，但由于强一致性与强事务性等规则约束，关系型数据不适宜于大规模的横向扩展，从而使得关系型数据库应用在半结构化或非结构化的数据存储时存在诸多问题。大数据给传统的数据分析处理技术(例如并行数据库、数据仓库)带来的技术挑战。传统数据分析处理技术无法处理大数据的高扩展性和海量需求。针对亿万的用户，数据呈现出多源化、异构化的趋势，不同的应用对数据的一致性、数据交互、传输延时等均有不同的需求。现有技术中对大数据的处理采用基于Hadoop的平台。Hadoop是一个开源分布式计算平...
一种大数据存储优化方法和装置

【技术保护点】
一种大数据存储优化的方法，包括：步骤S100，对待存储数据进行预处理；将所述待存储数据封装成对象数据，所述对象数据中添加有对象数据的属性信息，所述属性信息包括对象数据的数据类型；步骤S200，接收对象数据，根据对象数据的属性信息确定对象数据的数据类型；步骤S300，根据对象数据的数据类型将对象数据存储到不同的存储单元中。其中，步骤S100中被封装的对象数据具有统一的数据操作接口，所述数据操作接口接收对对象数据的操作；不同的存储单元分别具有各自的数据操作解析单元，用于接收对象数据的数据操作接口发送的数据操作，并对所述数据操作进行解析，将数据操作接口发送的数据操作转换为本存储单元可以执行的操作。

【技术特征摘要】

【专利技术属性】
技术研发人员：马泳宇，
申请(专利权)人：成都睿峰科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人