一种在REDIS上实现的存储大量时序数据的方法技术

技术编号：18007072 阅读：740 留言：0更新日期：2018-05-21 07:42

本发明专利技术公开了一种在REDIS上实现的存储大量时序数据的方法，该方法包括：基于Redis的SDS数据结构实现Gorilla压缩算法；基于Redis对象“redisObject”实现时间序列存储对象“TimeSeries”用来管理一个时间序列相关数据的存储；将时序数据的键值经过压缩后存储到Redis字典中；在Reids中实现基于时序数据对象的CRUD操作。本发明专利技术的有益效果：首先Redis时序数据存储方法可实现快速写入，单点插入可实现每秒20,000条；其次，借鉴Gorilla压缩算法的基础上将时序数据压缩存储到Redis中，节省了存储空间，从而节省成本；最后，Redis时序数据存储方法每秒能存储千万级的数据，并能毫秒级返回基于这些数据的查询，减少网络卡顿、网络延迟情况。

全部详细技术资料下载

【技术实现步骤摘要】
一种在REDIS上实现的存储大量时序数据的方法
本专利技术涉及工业物联网领域，具体来说，涉及一种在REDIS上实现的存储大量时序数据的方法。
技术介绍
时序数据库用于存放时间序列（按时间顺序变化）的海量数据，并且需要支持时序数据的快速写入、持久化、多维度的聚合查询等基本功能。在工业物联网领域，随着智能化改造进程的推进，大量设备的工况数据需要存储起来，数据量极大。这些数据不但要实时生成，写入存储；还要支持快速查询，做可视化的展示，帮助管理者分析决策；并且也能够用来做大数据分析，发现深层次的问题，帮助企业节能减排，增加效益。对此，面对海量数据，传统关系型数据库在存储时间序列数据时无法满足这些需求。目前常用的时序数据库OpenTsdb底层使用Hbase作为其分布式存储引擎，采用的是LSMtree；Kairosdb底层使用Cassandra作为分布式存储引擎；在单机上InfluxDB采取类似于LSMtree的存储结构TSM。LSMtree核心思想就是通过内存写和后续磁盘的顺序写入获得更高的写入性能，避免了随机写入，但同时也牺牲了读取性能，因为同一个key的值可能存在于多个HFile中。时序数据库面向的是海量数据的写入存储读取，单机是无法解决问题的，所以需要采用多机存储，即分布式存储。Redis是一个开源的使用ANSIC语言编写、支持网络、可基于内存亦可持久化的日志型的高性能Key-Value数据库，并提供多种语言的API。redis是Nosql数据库中使用较为广泛的非关系型内存数据库，它支持复杂数据的存储，并显示出基于内存操作基础的高性能。Gorilla是Face...
一种在REDIS上实现的存储大量时序数据的方法

【技术保护点】
一种在REDIS上实现的存储大量时序数据的方法，其特征在于，包括以下步骤：S1 基于Redis的SDS数据结构实现Gorilla压缩算法：首先实现基础的数据流对象“timeSeriesStream”，然后基于Gorilla算法先对插入数据进行压缩运算，将结果以二进制的形式插入的SDS数据结构中，创建iterator数据结构；S2基于Redis对象“redisObject”实现时间序列存储对象“TimeSeries”，“TimeSeries”用来管理一个时间序列相关数据的存储，通过Redis字典结构以Key Value的形式记录所有时序数据内容，其中，Key 为时序数据的唯一标识符，Value为“timeSeriesStream”数据结构；S3 将时序数据的键值经过压缩后存储到Redis字典中，启用二进制压缩算法，将整个字典进行压缩存储；S4 在Reids的命令解析层面中实现基于时序数据对象的CRUD操作；S5 基于Redis的RDB协议实现时序数据的持久化存储，将整个“timeSeriesStream”数据结构中的SDS结构以二进制的形式存储到RDB数据库中，并记录插入的中间状态；S...

【技术特征摘要】
1.一种在REDIS上实现的存储大量时序数据的方法，其特征在于，包括以下步骤：S1基于Redis的SDS数据结构实现Gorilla压缩算法：首先实现基础的数据流对象“timeSeriesStream”，然后基于Gorilla算法先对插入数据进行压缩运算，将结果以二进制的形式插入的SDS数据结构中，创建iterator数据结构；S2基于Redis对象“redisObject”实现时间序列存储对象“TimeSeries”，“TimeSeries”用来管理一个时间序列相关数据的存储，通过Redis字典结构以KeyValue的形式记录所有时序数据内容，其中，Key为时序数据的唯一标识符，Value为“timeSeriesStream”数据结构；S3将时序数据的键值经过压缩后存储到Redis字典中，启用二进制压缩算法，将整个字典进行压缩存储；S4在Reids的命令解析层面中实现基于时序数据对象的CRUD操作；S5基于Redis的RDB协议实现时序数据的持久化存储，将整个“timeSeriesStream”数据结构中的SDS结构以二进制的形式存储到RDB数据库中，并记录插入的中间状态；S6基于Redis的AOF持久化协议实现持久化存储，包括解析对应的相关命令，并以AOF文件格式存储；S7结合RedisCluster实现分布式高并发：实现时序数据标识的一致性Hash算法，根据计算得到的Hash值与群集节点id将不同时序标识和对应数据分配存储到不同节点，并通过Redis主备技术实现数据冗余。2.根据权利要求1所述的在REDIS上实现的存储大量时序数据的方法，其特征在于，S1具体包括：S11实现基础的数据流对象“timeSeriesStream”，包括时序数据起始时间、最近一次插入数据的时间戳、两次时间戳间隔“prev_timestamp_delta”、上一次时间点对应的时序数据以及基于二进制OR运...

【专利技术属性】
技术研发人员：徐汕，刘强，单酉，刘明，童奥，黄文峰，姜桥，
申请(专利权)人：北京航天云路有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人