所公开的技术用于计算与数据流相关联的性能度量。配置用于处理流经基于流的计算系统的数据元组的处理元件经由数据流接收数据元组。在该处理元件处,处理一个或多个元组的每一个元组,以及将该一个或多个元组的每一个元组与包括与该处理元件对该元组的处理有关的信息的元数据相关联。继而,基于与该一个或多个元组相关联的元数据、针对该数据流计算性能度量。
【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】所公开的技术用于计算与数据流相关联的性能度量。配置用于处理流经基于流的计算系统的数据元组的处理元件经由数据流接收数据元组。在该处理元件处,处理一个或多个元组的每一个元组,以及将该一个或多个元组的每一个元组与包括与该处理元件对该元组的处理有关的信息的元数据相关联。继而,基于与该一个或多个元组相关联的元数据、针对该数据流计算性能度量。【专利说明】流应用性能监测度量
技术介绍
计算机数据库已经变得非常成熟,例如,对于数据库系统的计算需求已经快速增长。数据库系统典型地配置用于将存储数据的过程与访问、操纵或使用存储于数据库中的数据相分离。更具体地,数据库使用这样的模型,其中,数据首先被存储、而后进行索引,以及随后进行查询。然而,此模型不能满足某些实时应用的性能需求。例如,数据库系统可以接收并存储传入数据的速率会限制可以处理或者以其他方式评估的数据量,而这继而限制了配置用于实时处理大量数据的数据库应用的效用。为了解决此问题,基于流的计算和基于流的数据库计算作为针对数据库系统的发展技术应运而生,其中,产品可用并且允许用户创建这样的应用,在流数据到达数据库文件之前、对其进行处理和查询。利用此新生技术,用户可以指定处理逻辑在入站数据记录处于“飞行状态(in flight)”时应用于入站数据记录,而结果则在毫秒级可用。使用这种类型的处理来构建应用开启了新的编程典范,其将允许开发出各种创新的应用、系统和过程,而同时又给应用程序员和数据库开发者呈现了新的挑战。对基于流的应用性能进行测量使得可以确定该基于流的应用是否以最佳方式操作。在基于流的应用中,经由数据流接收数据的“元组(tuple)”,并且将这些“元组”跨处理元件(PE)进行路由,其中这些处理元件对元组执行操作,并继而将这些元组转发至不同的处理元件以进行进一步处理。测量基于流的应用性能的一种技术涉及确定经由数据流接收的元组的吞吐量,例如,当每分钟一百个元组完全由一个或多个PE处理时,可以认为特定的基于流的应用是高效的。然而,此度量单独不能用来指示基于流的应用是否运行在最优方式下,因为各种条件会影响元组在数据流中到达的速率。例如,经由真正简单聚合(RSS)订阅(即,数据流)接收的元组数量会因一天中的时间而变化,因为例如在早晨和晚上这样的一天中的特定时间,通常会更频繁地产生新的文章。结果,用户可能错误地被通知基于流的应用正经历性能问题,即便基于流的应用正以最佳方式操作时也是如此。
技术实现思路
本专利技术的一个实施方式提供了一种用于计算与数据流相关联的性能度量的技术。该技术涉及步骤:在配置用于处理流经基于流的计算系统的数据元组的第一处理元件处,接收与第一数据流相关联的一个或多个元组;在第一处理元件处,处理该一个或多个元组的每一个元组;将该一个或多个元组的每一个元组与包括与第一处理元件对元组的处理有关的信息的元数据相关联;基于与该一个或多个元组相关联的元数据来计算性能度量;以及经由显示设备上的用户接口来显示计算的性能度量。本专利技术的另一实施方式提供了一种系统,包括多个计算节点,每个计算节点包括处理器和存储器,其中存储器存储流性能管理器,当在计算节点上执行时、其配置用于执行用于计算与数据流相关联的性能度量的操作。该操作包括步骤:在配置用于处理流经基于流的计算系统的数据元组的第一处理元件处,接收与第一数据流相关联的一个或多个元组;在第一处理元件处,处理该一个或多个元组的每一个元组;将该一个或多个元组的每一个元组与包括与第一处理元件对元组的处理有关的信息的元数据相关联;基于与该一个或多个元组相关联的元数据来计算性能度量;以及经由显示设备上的用户接口来显示计算的性能度量。本专利技术的其他实施方式提供了非瞬态计算机可读存储介质,其包括用于使得计算机系统执行上文给出的一个或多个方法的指令。【专利附图】【附图说明】为了获得并且可以详细理解上文记载的诸方面的方式,通过参考附图、可以提供在上文简述的本专利技术实施方式的更详细描述。然而,应当注意,附图仅示出了本专利技术的典型实施方式,并且因此不认为是限制本专利技术的范围,本专利技术可以允许其他等效实施方式。图1A-图1B示出了根据本专利技术一个实施方式、配置用于执行流数据库应用的计算基础架构。图2示出了根据本专利技术一个实施方式的计算节点。图3示出了根据本专利技术一个实施方式的管理系统。图4示出了根据本专利技术一个实施方式、在其中计算与一个或多个数据流相关联的性能度量的操作器图。图5是根据本专利技术一个实施方式、用于计算与数据流相关联的一个或多个性能度量的方法流程图。【具体实施方式】本专利技术的实施方式提供了用于确定与基于流的应用相关联的各种性能度量的技术。在本公开的上下文中,基于流的应用包括接收数据流的一个或多个处理元件,其中数据流向该一个或多个处理元件递送元组。每个处理元件通常可以接收元组(或多个元组)以及向其他处理元件发送元组(或多个元组)。所发送的元组可以不由处理元件改变,但是也可以生成新的或修改的元组。包括在数据流中的元组在由一个或多个处理元件处理时、利用元数据加标签,这使得流性能管理器能够识别与数据流相关联的各种性能度量。结果,这些各种性能度量可以用来确定基于流的应用的性能,并且识别出基于流的应用中的潜在处理瓶颈。而且,对基于流的应用的调整可以自动地基于各种性能度量来进行,从而减轻处理瓶颈。在下文中,参考本专利技术的实施方式。然而,应当理解,本专利技术不限于特定描述的实施方式。替代地,下述特征和元素(无论是否涉及不同实施方式)的组合都可以实现和实践本专利技术。此外,尽管本专利技术的实施方式较之于其他可能解决方案和/或现有技术可以实现优势,但是给定实施方式能否实现特定优势并不限制本专利技术。由此,下述方面、特征、实施方式和优势仅是示意的,并且不被认为是所附权利要求的元素或限制,除非在权利要求中明确提到。同样地,对“本专利技术”的参考不应当理解为此处公开的任何专利技术主题的综述,并且不应当认为是所附权利要求的元素或限制,除非权利要求明确记载。所属
的技术人员知道,本专利技术的各个方面可以实现为系统、方法或计算机程序产品。因此,本专利技术的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本专利技术的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPR0M或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用本文档来自技高网...
【技术保护点】
一种实现在基于流的计算系统中的方法,所述方法包括:在配置用于处理流经所述基于流的计算系统的数据元组的第一处理元件处,接收与第一数据流相关联的一个或多个元组;在所述第一处理元件处,处理所述一个或多个元组的每一个元组;将所述一个或多个元组的每一个元组与包括与由所述第一处理元件对所述元组的处理有关的信息的元数据相关联;基于与所述一个或多个元组相关联的所述元数据计算性能度量;以及经由显示设备上的用户接口显示计算的所述性能度量。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:R·K·克拉迪克,J·桑托索索,M·D·普费弗,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。