The present invention provides a method and device for supporting time series data storage of feature queries, including: dividing the time series data to be stored into a set of data points including multiple continuous data points, calculating the eigenvalues of each data point set by the preset feature function, and the time of the data points in each data point set. As the original data of the set of corresponding data points, the stamp and data values are used as the characteristic data information of the corresponding data points set by the information of the feature functions, each data point set and the eigenvalues, and the storage space of the original data as a set of data points is taken as a set of data points, and the set of each data point is set. The storage space of a characteristic data block as the characteristic data information of a set of data points, storing the characteristic data information of each data point set; the time series data stored by the above storage method not only supports the query of the original time sequence, but also supports the investigation of the eigenvalues. Inquire.
【技术实现步骤摘要】
一种支持特征查询的时序数据存储的方法和装置
本专利技术涉及数据处理
,更具体地,涉及一种支持特征查询的时序数据存储的方法和装置。
技术介绍
随着互联网和物联网的快速发展,时间序列数据(简称为时序数据)的采集与使用变得越来越广泛,如:在风力发电行业中,风机上的传感器会不断地产生大量的时序数据,通过对这些数据的实时分析可以对风机状态进行调整,提高风力发电效率;在复杂装备企业中,通过对采集的历史时序数据的统计,可以得到的各个设备的运行状态。时序数据具有以下的特点:(1)数据量大:一个设备企业往往会有数千甚至上万台设备,每一个台设备上的传感器按照使用的需求以一定时间间隔采集并回传数据,因此,时序数据会不断的快速增加。(2)具有独特的特征:在不同的应用领域,可以针对时序数据采用不同的特征描述,用于强调时序数据的不同特征。例如:可以采用傅里叶变换得到时序数据的频域特征,进而用频域信息作为特征来表征时序数据;采用分段线性近似(PLA)将时序数据分割成多个连续的数据点集合,进而使用多条直线作为特征来表征对应的数据点集合;基本的统计特征(均值,方差,极值等)也可以被视为简单的特征,用于表征时序数据。对于时序数据,使用者可能需要通过原始的时序数据进行查询与分析,也可能只需要某段时间内的数据的一些特征。如:在异常监控中更加关注一段时间内的最大值与最小值。现有的存储系统在存储时序数据时,一般只对原始的时序数据进行存储,因此目前缺少一种既可以支持对原始的时序数据进行查询,又可以支持对原始的时序数据的特征进行查询的时序数据的存储方法。
技术实现思路
为了克服上述问题或者至少部分地解 ...
【技术保护点】
一种支持特征查询的时序数据存储的方法,其特征在于,包括:将待存储的时序数据划分成若干数据点集合,每一数据点集合包括多个连续的数据点,每一数据点包括一个时间戳和一个数据值,对于任一数据点集合,将所述任一数据点集合中数据点的时间戳和数据值作为所述任一数据点集合的原始数据;将所述任一数据点集合中数据点的最早时间戳和最晚时间戳作为所述任一数据点集合的时段信息,根据预设的特征函数获取所述任一数据点集合的特征值,将所述任一数据点集合的时段信息、所述特征函数的信息和所述任一数据点集合的特征值作为所述任一数据点集合的特征数据信息;创建原始数据块和特征数据块,将一个原始数据块作为一个数据点集合的原始数据的存储空间,对每一数据点集合的原始数据进行存储,将一个特征数据块作为一个数据点集合的特征数据信息的存储空间,对每一数据点集合的特征数据信息进行存储。
【技术特征摘要】
1.一种支持特征查询的时序数据存储的方法,其特征在于,包括:将待存储的时序数据划分成若干数据点集合,每一数据点集合包括多个连续的数据点,每一数据点包括一个时间戳和一个数据值,对于任一数据点集合,将所述任一数据点集合中数据点的时间戳和数据值作为所述任一数据点集合的原始数据;将所述任一数据点集合中数据点的最早时间戳和最晚时间戳作为所述任一数据点集合的时段信息,根据预设的特征函数获取所述任一数据点集合的特征值,将所述任一数据点集合的时段信息、所述特征函数的信息和所述任一数据点集合的特征值作为所述任一数据点集合的特征数据信息;创建原始数据块和特征数据块,将一个原始数据块作为一个数据点集合的原始数据的存储空间,对每一数据点集合的原始数据进行存储,将一个特征数据块作为一个数据点集合的特征数据信息的存储空间,对每一数据点集合的特征数据信息进行存储。2.根据权利要求1所述的方法,其特征在于,所述将待存储的时序数据划分成若干数据点集合,包括:按数据点的时间戳的先后顺序,将每预设数量的连续的数据点划分为一个数据点集合。3.根据权利要求1所述的方法,其特征在于,所述根据预设的特征函数获取所述任一数据点集合的特征值,包括:调用所述特征函数,对所述任一数据点集合的原始数据进行处理,获取所述任一数据点集合的特征值。4.根据权利要求1所述的方法,其特征在于,所述对每一数据点集合的原始数据进行存储,包括:对于所述任一数据点集合,将所述任一数据点集合中每一数据点的时间戳和数据值依次存储在一个原始数据块中,且对于所述任一数据点集合中任一数据点,使所述任一数据点的时间戳关联至所述任一数据点的数据值,以存...
【专利技术属性】
技术研发人员:王建民,黄向东,刘昆,张金瑞,龙明盛,王晨,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。