【技术实现步骤摘要】
本专利技术的各实施方式涉及时间序列(TimeSeries),更具体地,涉及用于处理时间序列的方法和装置。
技术介绍
随着计算机、数据通信以及实时监控等技术的发展,时间序列数据库(TimeSeriesDatabase)已经被广泛应用于例如设备监控、生产线管理、金融分析等诸多方面。时间序列是指按照时间顺序排列的测量值的集合,在此可以将存储测量值的节点称为数据点(DataPoint)或者数据事件(DataEvent)。时间序列数据库是指用于存储这些测量值的数据库。测量值可以包括各种数据,例如在监控桥梁安全性的应用环境中,被采集数据可以包括由特定传感器采集的压力数据和/或压强数据;在天气预报应用环境中,被采集数据可以包括温度、湿度、压力、风力(例如,包括大小和方向),等等。相似性搜索(SimilaritySearch)是指在时间序列中搜索相类似的子序列。时间序列通常包括海量数据,并且该时间序列可能会不断地由新近的测量值来实时地更新。例如,在监控桥梁安全性的应用环境中,在桥梁上可能部署有分别用于实时地测量各处的压力的数万个传感器。例如,当以1秒甚至更高的频率来更新数据库时,将产生巨大的数据量。应当注意,在相似性搜索中并不要求各个子序列之间的完全匹配,而是在各个子序列之间可以具有一定的差异,例如,差异边界可以是e。相似性搜索中的一个重要方面是在时间序列中搜索motif。简言之,motif是指时
【技术保护点】
一种用于处理时间序列的方法,包括:按照时间将所述时间序列划分为多个窗口,针对所述多个窗口中的当前窗口执行如下处理:从所述当前窗口中提取相似子序列的至少一个分组;以及基于所述至少一个分组中的每个分组中的相似子序列与候选列表中的k个特征子序列的比较,更新所述候选列表,其中所述k个特征子序列是在所述时间序列的至少已处理部分中出现次数最多的k个特征子序列。
【技术特征摘要】
1.一种用于处理时间序列的方法,包括:
按照时间将所述时间序列划分为多个窗口,针对所述多个窗口中
的当前窗口执行如下处理:
从所述当前窗口中提取相似子序列的至少一个分组;以及
基于所述至少一个分组中的每个分组中的相似子序列与候
选列表中的k个特征子序列的比较,更新所述候选列表,
其中所述k个特征子序列是在所述时间序列的至少已处理部分
中出现次数最多的k个特征子序列。
2.根据权利要求1所述的方法,其中从所述当前窗口中提取相
似子序列的至少一个分组包括:
响应于两个相似子序列之间的距离不大于阈值距离,将所述两个
相似子序列加入相同的分组。
3.根据权利要求2所述的方法,其中所述距离是基于所述两个
相似子序列的相应时间点处的数据之间的差异计算的。
4.根据权利要求1-3中的任一项所述的方法,其中所述候选列
表进一步包括所述k个特征子序列的相应出现次数,以及基于所述
至少一个分组中的每个分组中的相似子序列与候选列表中的k个特
征子序列的比较,更新所述候选列表进一步包括:基于所述比较以
及所述相应出现次数,更新所述候选列表。
5.根据权利要求4所述的方法,其中基于所述比较以及所述相
应出现次数,更新所述候选列表包括:针对所述至少一个分组中的
当前分组,
从所述当前分组中的相似子序列提取所述当前分组的特征子序
列;以及
基于所述候选列表中是否包括与所述当前分组的所述特征子序
列相匹配的特征子序列以及所述相应出现次数,更新所述候选列表。
6.根据权利要求5所述的方法,其中基于所述候选列表中是否
包括与所述当前分组的所述特征子序列相匹配的特征子序列以及所
\t述相应出现次数,更新所述候选列表包括:
响应于所述候选列表中包括与所述当前分组的所述特征子序列
相匹配的特征子序列,基于所述当前分组的所述特征子序列更新所
述相匹配的特征子序列,以及更新所述相匹配的特征子序列的出现
次数;否则
基于所述时间序列的相似度索引以及所述相应出现次数,更新所
述候选列表。
7.根据权利要求6所述的方法,其中基于所述时间序列的相似
度索引以及所述相应出现次数,更新所述候选列表包括:
响应于基于所述相似度索引确定所述当前分组的所述特征子序
列在所述时间序列中的支持度上限不低于所述候选列表中的特征子
序列的出现次数的最小值,计算所述当前分组中的所述相似子序列
在所述时间序列中的出现次数;以及
响应于计算的出现次数不低于所述最小值,更新所述候选列表。
8.根据权利要求7所述的方法,其中响应于计算的出现次数不
低于所述最小值,更新所述候选列表包括:
利用所述当前分组的所述特征子序列以及计算的出现次数,更新
所述候选列表。
9.根据权利要求1-3中的任一项所述的方法,其中所述多个窗
口中的两个相邻窗口包括在时间上重叠的部分。
10.根据权利要求1-3中的任一项所述的方法,其中所述方法随
着所述时间序列的更新而周期性地被执行。
11.一种用于处理时间序列的装置,包括:
划分模块,配置用于按照时间将所述时间序列划分为多个窗口;
提取模块,配置用于针对所述多个窗口中的当前窗口执行如下处
理:从所述当前窗口中提取相似子序列的...
【专利技术属性】
技术研发人员:陈垚亮,黄胜,陈晓艳,刘凯,徐林昊,陆薇,徐晓旻,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。