使用搜索技术的计算机性能预测制造技术

技术编号:13825350 阅读:54 留言:0更新日期:2016-10-12 21:46
计算机监控系统可通过比较当前时间序列数据的片段与之前观测到的时间序列片段来寻找匹配片段来预测短期和长期的性能。根据匹配的片段,可以通过检查时间序列中的稍后的观测来作出性能预测。每个时间序列元素可包括大量参数,并且一种用于比较片段的机制可将这些元素作为多维向量来处理并使用余弦相似性来找出显著匹配。部署机制可将时间序列片段存储在一个可搜索的数据库中,并用新观测到的时间序列片段来搜索数据库以找出匹配。

【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求题为“Computer Performance Prediction Using Search Technologies”(使用搜索技术的计算机性能预测)的美国专利申请序列号61/930,923、题为“Event Prediction Using Historical Time Series Observations of a Computer Application”(使用计算机应用的历史时间系列观测的事件预测)的美国专利申请序列号61/930,926、题为“Visualization of Behavior Clustering of Computer Applications”(计算机应用的表现聚合的可视化)的美国专利申请序列号61/930,928、以及题为“Behavior Clustering Analysis and Alerting System for Computer Applications”(计算机应用的行为聚合分析和提醒系统)的美国专利申请序列号61/930,929的优先权和权益,所有这些申请被通过引用所有它们公开和教示的内容而明确合并与此。背景计算机监控是一个宽泛的领域,其可包括任何类型的状态报告、提醒、或可帮助维护生产计算机系统的其它管理工具。计算机监控可包括硬件状态和性能、网络监控、软件性能分析、和许多其它组件。传统的监控系统可实时或近实时地评估数据并将那些数据与阈值、限值、或其它度量作比较以确定是否可能存在错误或提醒条件。当警报被触发时,可向管理人员发出一些讯息,该管理人员可采取纠正动作。这样的系统往往是反应性的,并且能够检测到何时已发生问题。概述计算机监控系统可通过比较当前时间序列数据的片段与之前观测到的时间序列片段来寻找匹配片段来预测短期和长期的性能。根据匹配的片段,可以通过检查时间序列中的稍后的观测来作出性能预测。每个时间序列元素可包括大量参数,并且一种用于比较片段的机制可将这些元素作为多维向量来处理并
使用余弦相似性来找出显著匹配。部署机制可将时间序列片段存储在一个可搜索的数据库中,并用新观测到的时间序列片段来搜索数据库以找出匹配。监控系统可以将当前观测到的时间序列片段与可能是事件的前兆的之前标识的时间序列片段作比较。当观测到时间序列片段之间的相关性时,事件可被预测。事件可由观测人员来标识,该观测人员可标识事件或对事件进行分类。在一些情况下,可通过观测异常表现并自动标识该表现来标识事件。监控系统可以从相同或不同的执行平台上的相同的应用程序的多次运行、相同或不同的执行平台上的类似应用、类似或不同用户、或相同或不同的执行平台上的任何其它应用中聚合观测到的时间序列。被标识的事件可被组织为一组可被应用于新的应用来基于对其它应用的观测来预测事件的事件。可以针对计算机应用的性能观测的时间序列来执行降维(诸如主要成分分析)。结果的可视化表示可以一维、二维、或三维来显示,并且常常示出操作表现的聚类。表示可能被动画化以示出观测的序列以及应用的表现可如何从一个操作聚类改变为另一个。表示可被进一步应用以同时示出观测的历史视图以及新的观测。时间序列可包含性能和操作数据,以及从计算机应用中观测到的元数据。降维(诸如主要成分分析)可被用于至少部分地生成计算机应用的时间序列观测的模型。该模型可被应用于当前和预测的观测。可以通过针对该模型分析那些观测来从当前或预测的观测中标识反常值,并且统计上相关的反常值可生成警报或要采取的纠正或其它动作。可通过搜索可能之前观测到过的类似的反常值、并且基于过去的类似观测来预测任何将来的事件来分析反常值。提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的一些概念。本
技术实现思路
并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。附图简述在附图中,图1是示出用于通过对历史时间序列的分析来预测事件的方法的实施例的图示。图2是示出具有可在被跟踪应用中预测性能和事件的设备的网络环境的实
施例的图示。图3是示出具有多个跟踪点的散布式应用的实施例的图示。图4是示出用于收集跟踪器数据的方法的实施例的时间线图。图5是示出用于预测时间序列和事件的方法的实施例的时间线图。图6是示出用于预测时间序列的方法的实施例的流程图示。图7是示出用于生成给定事件的前兆时间序列片段的方法的实施例的图示。图8是示出用于标识事件的前兆的方法的实施例的流程图示。图9是示出用于使用前兆来预测事件的方法的实施例的流程图示。图10是示出用于对跟踪器数据进行主要成分分析的方法的实施例的图示。图11是示出用于对跟踪器数据应用主要成分分析的方法的实施例的流程图示。图12是示出用于使用主要成分分析来检测异常和反常值的方法的实施例的流程图示。详细描述使用对历史观察的搜索的预测监控系统。计算机监控系统可以根据可搜索的之前观测的数据库来作出对于应用的表现的统计上有效的预测。观测可包含的性能和操作观测,其可以是时间序列的形式。可通过选择当前观测,随后在观测的数据库中搜索匹配的观测,找到匹配,以及寻找该匹配的历史观测下游的事件或其它异常来作出预测。预测可仅仅是性能或操作估计,或者可能标识可能是有趣的事件或异常。性能或操作估计可预测将来可能被观测到的观测。这样的预测可以各种可视化来显示,用于负载管理或其它用途。预测的事件或异常可被用来导致在事件之前采取的纠正动作。观测的数据库可包括时间序列数据,其中每个观测可以是一系列观测的一部分。观测可包括应用的操作和性能数据。操作数据可包括如函数可能已被调用的次数或者操作可能已被执行的次数之类的项。性能数据可包括诸如存储器或其它资源消耗的量或对于输入的响应时间之类的项。观测可作为一个整体反映应用或设备的操作,其中到应用或设备的输入及其对那些输入的响应可被观测和存储。在一些情况下,观测可包括应用或设备的更细粒度的视图,其中应用或设备内的各个单个功能或操作可被观测。在又一些情况下,单一的观测可反映一组设备的操作和性能,这组设备可以是多个同构或异构的设备。存储在数据库中的观测可以是各个观测的聚合。例如,数据库可包含针对一个特定的时间间隔的聚合的观测,诸如在一段时间内的采取的观测的数量、平均值、中位数、或其它概要。时间段可以是任意间隔,从纳秒、毫秒、微秒、秒、分钟、小时、到天或更长。观测可被视为参数的向量。该向量可具有许多参数,并且一些情况下每个测量可具有三个、五个、十个、甚至数百个受观测的参数。参数集可能在一组观测与另一组观测之间不同,并且在一个观测到另一个观测之间不同。在这种情况下,数据库可以是稀疏填充的数据库,其对于时间序列上的每个观测具有许多参数。可使用余弦相似性或其它数学比较来作出观测到的时间序列和历史观测之间的比较。时间序列数据库可包括来自一个或多个设备的观测。该数据库可包括来自相同的执行平台上的相同应用、以及在不同执行平台上的相同应用和相同或不同执行平台上的类似或不同应用的历史观测。这样的观测可以被搜索以标识一组类似的观测,这些观测可能有一定的预测价值。预测可以根据其它应用或设备的观察来作出。在许多情况下,两个不同的执行平台或应用之间的类似表现可能仍然会给出有意义的预测,即使系本文档来自技高网
...

【技术保护点】
一种在至少一个计算机处理器上执行的方法,所述方法包括:接收第一时间序列片段,所述第一时间序列片段包括在执行第一计算机应用时观测到的性能数据;从历史数据库中标识第二时间序列片段,所述历史数据库包括执行所述第一计算机应用时观测到的时间序列,所述第二时间序列片段类似于所述第一时间序列片段;从所述历史数据库中标识第三时间序列片段,所述第三时间序列在顺序上在所述第二时间序列片段之后;以及基于所述第三时间序列片段来创建预测。

【技术特征摘要】
【国外来华专利技术】2014.01.23 US 61/930,923;2014.01.23 US 61/930,926;1.一种在至少一个计算机处理器上执行的方法,所述方法包括:接收第一时间序列片段,所述第一时间序列片段包括在执行第一计算机应用时观测到的性能数据;从历史数据库中标识第二时间序列片段,所述历史数据库包括执行所述第一计算机应用时观测到的时间序列,所述第二时间序列片段类似于所述第一时间序列片段;从所述历史数据库中标识第三时间序列片段,所述第三时间序列在顺序上在所述第二时间序列片段之后;以及基于所述第三时间序列片段来创建预测。2.如权利要求1所述的方法,其特征在于,进一步包括:从所述历史数据库中标识第四时间序列片段,所述第四时间序列片段类似于所述第一时间序列片段;从所述历史数据库中标识第五时间序列片段,所述第五时间序列在顺序上在所述第四时间序列片段之后;以及基于所述第三时间序列片段和所述第五时间片段来创建所述预测。3.如权利要求2所述的方法,其特征在于,所述预测至少通过用第一权重来加权所述第三时间序列并且用第二权重来加权所述第五时间序列来创建。4.如权利要求2的方法,其特征在于,所述历史数据库包括多个时间序列,所述时间序列中的至少一个时间序列是在第一执行平台上执行所述第一计算机应用时的观测,并且所述时间序列中的至少第二个时间序列是在第二执行平台上执行所述第一计算机应用时的观测。5.如权利要求4的方法,其特征在于,所述第三时间序片段是来自所述第一执行平台的观测,并且所述第五时间序片段是来自所述第二执行平台的观测。6.如权利要求4的方法,其特征在于,所述历史数据库进一步包括作为执行第二计算机应用时的观测的至少一个时间序列。7.如权利要求6的方法,其特征在于,所述第三时间序片段是来自所述第一计算机应用的观测,并且所述第五时间序片段是来自所述第二计算机应用的观测。8.如权利要求7的方法,其特征在于,所述第一计算机应用是所述第二计算机应用的一个版本。9.如权利要求1所述的方法,其特征在于,所述性能数据包括所述第一应用内的第一函数和第二函数的性能数据。10.如权利要求9所述的方法,其特征在于,所述性能数据包括针对所述时间序列中的一个时间间隔的聚合的性能数据。11.一种系统,包括:处理器;数据库,所述数据库包括表示通过跟踪第一应用而得到的性能观测的多个时间序列;搜索引擎,所述搜索引擎:接收第一时间序列片段,所述第一时间序列片段包括在执行所述第一计算机应用时观测到的性能数据;从所述历史数据库中标识第二时间序列片段,所述第二时间序列片段类似于所述第一时间序列片段;并且返回所述第二时间序列片段,分析引擎,所述分析引擎:从所述历史数据库中标识第三时间序列片段,所述第三时间序列在顺序上在所述第二时间序列片段之后;以及基于所述第三时间序列片段来创建预测。12.如权利要求11所述的系统,其特征在于,所述搜索引擎还:从所述历史数据库中标识第四时间序列片段,所述第四时间序列片段类似于所述第一时间序列片段;所述分析引擎还:从所述历史数据库中标识第五时间序列片段,所述第五时间序列在顺序上在所述第四时间序列片段之后;并且基于所述第三时间序列片段和所述第五时间片段来创建所述预测。13.如权利要求12所述的系统,其特征在于,所述预测至少通过用第一权重来加权所述第三时间序列并且用第二权重来加权所述第五时间序列来创建。14.如权利要求12的系统,其特征在于,所述历史数据库包括多个时间序列,所述时间序列中的至少一个时间序列是在第一执行平台上执行所述第一计算机应用时的观测,并且所述时间序列中的至少第二个时间序列是在第二执行平台上执行所述第一计算机应用时的观测。15.如权利要求14的系统,其特征在于,所述第三时间序片段是来自所述第一执行平台的观测,并且所述第五时间序片段是来自所述第二执行平台的观测。16.如权利要求14所述的系统,其特征在于,所述历史数据库进一步包括作为执行第二计算机应用时的观测的至少一个时间序列。17.如权利要求16所述的系统,其特征在于,所述第三时间序片段是来自所述第一计算机应用的观测,并且所述第五时间序片段是来自所述第二计算机应用的观测。18.如权利要求17所述的系统,其特征在于,所述第一计算机应用是所述第二计算机应用的一个版本。19.如权利要求11所述的系统,其特征在于,所述性能数据包括所述第一应用内的第一函数和第二函数的性能数据。20.如权利要求19所述的系统,其特征在于,所述性能数据包括针对所述时间序列中的一个时间间隔的聚合的性能数据。计算机应用的表现聚类的可视化21.一种在至少一个计算机处理器上执行的方法,所述方法包括:生成表示通过跟踪计算机应用而收集到的第一时间序列的降维转换,所述第一时间序列包括在所述第一时间序列的每一观测处的多个函数的性能数据,所述多个函数中的每一个函数是所述计算机应用的一部分;接收通过跟踪计算机应用而收集到的第二时间序列并且应用所述降维转换以生成经转换的数据集;以及使所述经转换的数据集被显示。22.如权利要求21所述的方法,其特征在于,所述性能观测包括所述多个函数中的每一个函数的资源利用率。23.如权利要求22所述的方法,其特征在于,所述资源利用率是下列各项组成的组中的至少一个:存储器利用率;处理器利用率;以及网络利用率。24.如权利要求21所述的方法,其特征在于,所述经转换的数据集以二维显示。25.如权利要求21所述的方法,其特征在于,所述经转换的数据集以三维显示。26.如权利要求21所述的方法,其特征在于,所述经转换的数据集使用示出所述经转换的数据集中的所述观测的顺序的动画来显示。27.如权利要求26所述的方法,其特征在于,所述经转换的数据集被至少近实时地显示。28.如权利要求21所述的方法,其特征在于,所述函数中的至少一些函数是函数库的一部分。29.如权利要求21所述的方法,其特征在于,进一步包括:接收预测观测,所述预测观测是基于所述第二时间序列来预测的;应用所述降维转换来生产经转换的预测观测;以及使所述经转换的预测观测被显示。30.一种系统,包括:至少一个计算机处理器;在所述至少一个计算机处理器上执行的降维分析器,所述降维分析器:生成表示通过跟踪计算机应用而收集到的第一时间序列的降维转换,所述第一时间序列包括在所述第一时间序列的每一观测处的多个函数的性能数据,所述多个函数中的每一个函数是所述计算机应用的一部分;显示引擎,所述显示引擎:接收通过跟踪所述计算机应用而收集到的第二时间序列并且应用所述降维转换以生成经转换的数据集;以及使所述经转换的数据集被显示。31.如权利要求30所述的系统,其特征在于,所述性能观测包括所述多个函数中的每一个函数的资源利用率。32.如权利要求31所述的系统,其特征在于,所述资源利用率是下列各项组成的组中的至少一个:存储器利用率;处理器利用率;以及网络利用率。33.如权利要求30所述的系统,其特征在于,所述经转换的数据集以二维显示。34.如权利要求30所述的系统,其特征在于,所述经转换的数据集以三维显示。35.如权利要求30所述的系统,其特征在于,所述经转换的数据集使用示出所述经转换的数据集中的所述观测的顺序的动画来显示。36.如权利要求35所述的系统,其特征在于,所述经转换的数据集被至少近实时地显示。37.如权利要求30所述的系统,其特征在于,所述函数中的至少一些函数是函数库的一部分。用于计算机应用的表现聚类分析和警报系统38.一种在至少一个计算机处理器上执行的方法,所述方法包括:生成表示通过跟踪计算机应用而收集到的第一时间序列的降维转换,所述第一时间序列包括在所述第一时间序列的每一观测处的多个函数的性能数据,所述多个函数中的每一个函数是所述计算机应用的一部分;将所述降维转换应用于之前观测到的时间序列以生成经转换的历史数据;接收当前时间序列数据集并应用所述降维转换以生成经转换的当前时间序列数据集;将所述经转换的时间序列数据集与所述经转换的历史数据作比较以从所述经转换的当前时间序列数据集中标识异常观测。39.如权利要求38所述的方法,其特征在于,进一步包括:对所述经转换的历史数据执行聚类分析以在所述经转换的历史数据内生成聚类定义。40.如权利要求39所述的方法,其特征在于,所述比较所述经转换的当前时间序列数据集包括相对于所述聚类定义确定所述经转换的当前时间序列数据集中的第一观测是是反常值。41.如权利要求38所述的方法,其特征在于,还包括基于所述异常观测来生成警报。42.如权利要求38所述的方法,其特征在于,进一步包括:确定预测时间序列观测;通过将所述降维转换应用于所述预测时间序列观测来生成预测的经转换...

【专利技术属性】
技术研发人员:T·瑟托
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1