用于检测和表征季节的系统技术方案

技术编号:17785726 阅读:39 留言:0更新日期:2018-04-22 18:19
描述了用于表征和总结在时间序列内检测到的季节模式的技术。根据实施例,时间序列数据的集合被分析,以识别季节的多个实例,其中每个实例与季节内的相应子时段对应。来自多个实例的第一实例集合与特定的季节模式类相关联。在对第一实例集合进行分类之后,第二实例集合可以保持未分类,或者以其它方式不能与该特定的季节模式类相关联。基于第一实例集合和第二实例集合,可以生成识别与该特定的季节模式类相关联的一个或多个时间区段的总结。这一个或多个时间区段可以跨越与第二实例集合中的至少一个实例对应的至少一个子时段。

【技术实现步骤摘要】
【国外来华专利技术】用于检测和表征季节的系统
本公开涉及检测和表征时间序列数据内的季节(season)。本公开更具体地涉及用于识别季节的实例、将实例与不同的季节类相关联并且生成季节类的总结(summary)的计算机实现的技术。
技术介绍
本节中描述的方法是可以追求的方法,但不一定是先前已经构想或追求的方法。因此,除非另有说明,否则不应当假定本节中描述的任何方法仅仅因为它们被纳入本节中就被当作现有技术。时间序列是通常通过在一段时间内捕获来自一个或多个源的测量而获得的一系列数据点。作为示例,企业可以连续地或者在预定的时间间隔内收集用于在数据中心环境内部署的软件和硬件资源的各种性能度量。分析师经常将预测模型应用于时间序列数据,以试图基于观测到的测量结果来预测未来的事件。一个这种模型是Holt-Winters预测算法,也被称为三重指数平滑。Holt-Winters预测算法考虑到了时间序列数据中的趋势和季节性二者,以便制定关于未来值的预测。此上下文中的趋势是指时间序列数据随时间而增加或减少的趋势,而季节性是指时间序列数据表现出周期性自我重复的行为的趋势。季节一般是指表现出的行为开始自我重复之前的时间段。加性季节模型由以下公式给出:Lt=α(Xt-St-p)+(1-α)(Lt-1+Tt-1)(1)Tt=γ(Lt-Lt-1)+(1-γ)Tt-1(2)St=δ(Xt-Lt)+(1-δ)St-p(3)其中Xt、Lt、Tt和St分别表示在时间t处的观测到的水平、局部平均水平、趋势和季节指标。参数α、γ、δ分别表示用于更新平均水平、趋势和季节指标的平滑参数,并且p表示季节模式的持续时间。预测如下给出:Ft+k=Lt+kTt+St+k-p(4)其中Ft+k表示在未来时间t+k处的预测。当季节性波动与时间序列数据的整体水平无关时,通常应用加性季节模型。如果季节性波动的大小基于时间序列数据的整体水平而变化,那么常常应用被称为乘性模型的替代方案。乘性模型由以下公式给出:Lt=α(Xt/St-p)+(1-α)(Lt-1+Tt-1)(5)Tt=γ(Lt-Lt-1)+(1-γ)Tt-1(6)St=δ(Xt/Lt)+(1-δ)St-p(7)与前面一样,其中Xt、Lt、Tt和St分别表示在时间t处的观测到的水平、局部平均水平、趋势和季节指标。于是预测由以下公式给出:Ft+k=(Lt+kTt)St+k-p(8)预测模型(诸如三重指数平滑)主要集中在生成关于未来事件的预测。虽然Holt-Winter加性模型和乘性模型考虑了季节指标来生成预测,但是这些模型仅提供关于时间序列数据中可能存在的任何季节模式的有限信息。具体而言,由等式(3)和(7)表示的季节指标通常被实现为在它们绑定到的预测模型的界限内操作的内部结构。因此,由这些公式输出的季节数据无助于在(针对其而生成了该季节数据的)具体预测模型之外的上下文中的有意义解释。另外,最终用户对于在生成预测中所使用的任何季节数据可能只有很少或没有基本概念。附图说明在附图的图示中通过示例而非限制示出了各种实施例,并且其中相同的标号指代相似的元件,并且其中:图1示出了用于检测和总结从时间序列数据推断的季节模式的特点的示例处理;图2示出了用于检测和表征时间序列数据内的季节模式的示例系统;图3示出了用于确定在时间序列数据的集合内是否存在季节模式的示例处理;图4示出了用于对在时间序列数据的集合内识别出的季节模式进行分类的示例处理;图5示出了对季节的实例进行分类的示例分类结果集合;图6示出了用于基于季节内的分类实例的集合生成和均匀化(homogenize)分段的集合并且使用经均匀化的分段来生成用于一个或多个季节模式类的总结数据的示例处理;图7示出了通过基于分类实例的集合生成并均匀化分段的集合而获得的示例总结;图8示出了用于已经被分类为复发性每周高点和复发性每周低点的季节模式的示例总结;图9示出了用于选择时间序列中的复发性高值和低值的示例监督处理;图10示出了用于选择时间序列中的复发性高值和低值的示例无监督处理;图11示出了稀疏模式与密集模式被分开提取和注释的示例总结;图12是示出可以在其上实现一些实施例的计算机系统的框图。具体实施方式在下面的描述中,出于解释的目的,阐述了许多具体细节以提供对本公开的透彻理解。然而,将认识到的是,本专利技术可以在没有这些具体细节的情况下实践。在其它情况下,结构和设备以框图形式示出,以避免不必要地模糊本专利技术。一般概述在各种实施例中,描述了用于检测和表征时间序列内的季节模式的计算机系统、存储的指令和技术步骤。可以通过分析跨时间序列内的不同季节时段收集的数据点(在本文中也被称为“样本”)来检测季节模式。如果分析检测到时间序列内按季节重现的值,那么检测到了季节模式。如果检测到季节模式,那么进一步分析数据点,以对季节模式进行分类。例如,数据点可以被分类为时间序列内的复发性高点或复发性低点。一旦被分类,就可以生成总结,其中该总结识别在时间序列内检测到的一个或多个季节模式类。总结可以被显示、存储或以其它方式输出,以向最终用户或应用暴露时间序列的分类季节模式。在一些实施例中,用于对季节模式进行分类的技术包括通过将时间序列数据分割成实例的集合来预处理时间序列数据,其中该实例的集合中的每个实例与季节内的不同相应子时段对应。在预处理期间,分析该实例集合,以确定哪些实例应当与特定的季节类相关联。季节内的不同实例可以与不同的相应类相关联或者可以保持未分类。例如,来自实例集合的第一组实例可以与第一类相关联,并且来自实例集合的第二组实例可以与第二类相关联,而来自实例集合的第三组实例可以保持未分类。基于哪一组实例与特定的类相关联,可以生成总结以表征时间序列内的季节模式。为了表征可以存在于时间序列中的季节模式的类,总结可以识别与该类相关联的一个或多个时间区段。作为示例,“每周高点”季节类可以指定在其中检测到了复发性每周高点模式的天和/或小时。作为另一个示例,“每月低点”季节类可以识别在其中检测到了复发性每月低点的周、天和/或小时。其它季节类也可以被包括在总结中,以识别和表征时间序列中的季节模式。总结可以通过程序集成到各种复杂的分析方案中。例如,在信息技术(IT)的上下文中,总结数据可以被处理以执行季节感知(seasonal-aware)的异常检测、维护计划、硬件和软件整合以及容量计划。通过合并季节中的共享相同类的相邻实例,可以识别用于特定季节类的时间区段。该时间区段也可以被扩展成包括未分类的相邻实例。通过填充相邻的未分类的值,可以减少不同季节时段上模式的随机变化,由此在底层模式基本没有改变时在延长的时间帧内提供一致的结果。图1示出了用于检测和总结从时间序列数据推断的季节模式的特点的示例处理。在框102处,在一个或多个计算设备上执行的应用检索或以其它方式接收时间序列数据的集合。在框104处,该应用识别该时间序列数据的集合内的季节的多个实例。如前面所提到的,季节的不同实例可以与该季节内不同的相应子时段对应。在框106处,应用将来自季节的该多个实例的第一实例集合与用于表征季节模式的特定类相关联。在将第一实例集合与季节类相关联之后,来自该多个实例的第二实例集合保持未分类或以其它方式不与该特定类相关联。在框108处,应用生成总结,该总结本文档来自技高网...
用于检测和表征季节的系统

【技术保护点】
一种方法,包括:使用一个或多个计算设备来识别时间序列数据集合内的季节的多个实例;其中所述多个实例中的每个实例与所述季节内的不同的相应子时段对应;使用一个或多个计算设备将来自所述季节的所述多个实例的第一实例集合与特定的季节模式类相关联;其中在将来自所述季节的所述多个实例的第一实例集合与所述特定的季节模式类相关联之后,来自所述多个实例的第二实例集合不与该特定的季节模式类相关联;使用一个或多个计算设备基于所述多个实例中的第一实例集合和第二实例集合来生成总结,所述总结识别与所述特定的季节模式类相关联的一个或多个时间区段;其中所述一个或多个时间区段跨越与第二实例集合中的至少一个实例对应的至少一个子时段。

【技术特征摘要】
【国外来华专利技术】2016.02.29 US 15/057,0651.一种方法,包括:使用一个或多个计算设备来识别时间序列数据集合内的季节的多个实例;其中所述多个实例中的每个实例与所述季节内的不同的相应子时段对应;使用一个或多个计算设备将来自所述季节的所述多个实例的第一实例集合与特定的季节模式类相关联;其中在将来自所述季节的所述多个实例的第一实例集合与所述特定的季节模式类相关联之后,来自所述多个实例的第二实例集合不与该特定的季节模式类相关联;使用一个或多个计算设备基于所述多个实例中的第一实例集合和第二实例集合来生成总结,所述总结识别与所述特定的季节模式类相关联的一个或多个时间区段;其中所述一个或多个时间区段跨越与第二实例集合中的至少一个实例对应的至少一个子时段。2.如权利要求1所述的方法,其中所述特定的季节模式类是用于季节性高点的第一类、用于稀疏季节性高点的第二类、用于季节性低点的第三类或用于稀疏季节性低点的第四类中的一个。3.如权利要求1所述的方法,其中来自所述季节的所述多个实例的第一实例集合与第一季节模式类相关联;所述方法还包括:使用一个或多个计算设备将来自所述季节的所述多个实例的第三实例集合与第二季节模式类相关联;其中第一类不同于第二类。4.如权利要求1所述的方法,其中由一个或多个计算设备基于所述多个实例中的第一实例集合和第二实例集合生成识别与所述特定的季节模式类相关联的一个或多个时间区段的总结包括:识别跨越与第一实例集合中的相应实例对应的一个或多个子时段的一个或多个时间分段的第一集合;其中,在识别跨越与第一实例集合中的相应实例对应的一个或多个子时段的一个或多个时间分段的第一集合之后,所述一个或多个时间分段的第一集合不跨越所述至少一个子时段;其中与所述至少一个子时段对应的所述至少一个实例是未分类的;将所述一个或多个分段的第一集...

【专利技术属性】
技术研发人员:D·加尔威U·沙福特L·王A·加内什
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1