使用业务数据的聚类过程制造技术

技术编号:33198508 阅读:14 留言:0更新日期:2022-04-24 00:29
公开了用于对由云平台使用的过程进行聚类的方法、装置和系统。处理聚类可以包括接收在过程集合中的每对过程之间传送和接收的业务数据。可以基于业务数据生成矩阵,矩阵包括针对过程集合中的每个过程的行和列。可以基于业务数据对矩阵进行分层聚类,所述分层聚类输出多个集群,每个集群包括所述过程集合中的一个或多个过程。然后可以将所述多个集群合并成合并的过程集群的集合。合并的过程集群的集合。合并的过程集群的集合。

【技术实现步骤摘要】
【国外来华专利技术】使用业务数据的聚类过程
[0001]相关申请的交叉引用
[0002]本申请是于2020年8月14日提交的标题为“使用业务数据的聚类过程”的美国申请No.16/994,085的继续,其公开内容在此通过引入方式并入本文。

技术介绍

[0003]云计算涉及通过网络递送按需计算服务,所述网络例如广域网(WAN),诸如例如因特网和/或一个或多个局域网(LAN)。它提供信息技术基础设施作为一组或多组联网元件。这样的网络元件通常经由网络向位于远程的用户提供计算能力和数据存储,并且通常被容纳在数据中心中。机器虚拟化通常用在云计算中。典型的虚拟化计算系统包括通过高速网络互连的多个计算节点。计算节点运行消耗诸如中央处理单元(CPU)、存储器、持久存储和联网资源等物理资源的虚拟机(VM)。物理资源可以驻留在一个或多个网络元件(也称为主机)上。
[0004]云平台向诸如网站和web应用之类的基于云的服务的发布者提供计算资源以递送基于云的服务。在这点上,云平台维护递送基于云的服务所需的信息技术基础设施,这样的计算节点运行虚拟机或其他过程。云平台向发布者租借或出售对其相应信息技术基础设施的访问,从而允许发布者使用云平台信息技术基础设施(包括运行VM或其他过程的计算节点)来提供其基于云的服务。可以动态地调整发布者租用或购买的资源量。例如,在发布者的基于云的服务的高使用时段期间,可以从云平台的信息技术基础设施租用附加虚拟机或其他过程。类似地,在发布者的应用的较低使用时段期间,可以购买或租赁来自云平台的信息技术基础设施的较少资源。通过云平台,发布者访问他们需要的任何计算资源,而不必维护和投资他们自己的信息技术基础设施。

技术实现思路

[0005]本公开的各方面提供了涉及聚类过程的技术、装置和系统。作为示例,该技术包括基于VM和其他这样的过程的业务模式来对VM和其他这样的过程进行聚类。
[0006]本公开的一个方面涉及一种用于对过程进行聚类的方法,包括:由一个或多个处理器接收在过程集合中的每对过程之间传送和接收的业务数据;由所述一个或多个处理器基于所述业务数据生成矩阵,所述矩阵包括针对所述过程集合中的每个过程的行和列;由所述一个或多个处理器基于所述业务数据对所述矩阵进行分层聚类,所述分层聚类输出多个集群,每个集群包括所述过程集合中的一个或多个过程;以及由所述一个或多个处理器将所述多个集群合并成合并的过程集群的集合。
[0007]本公开的另一方面涉及一种系统,包括一个或多个计算设备;一个或多个计算机可读存储介质;以及存储在一个或多个计算机可读存储介质上的程序指令,用于由一个或多个计算设备中的至少一个计算设备执行。程序指令可以使得一个或多个计算设备:接收在过程集合中的每对过程之间传送和接收的业务数据;基于所述业务数据生成矩阵,所述矩阵包括针对所述过程集合中的每个过程的行和列;基于所述业务数据对所述矩阵进行分
层聚类,所述分层聚类输出多个集群,每个集群包括所述过程集合中的一个或多个过程;以及将所述多个集群合并成合并的过程集群的集合。
[0008]本公开的另一方面涉及包含程序指令的非暂时性计算机可读介质。当由一个或多个计算设备执行时,所述指令使得所述一个或多个计算设备执行以下步骤:接收在过程集合中的每对过程之间传送和接收的业务数据;基于所述业务数据生成矩阵,所述矩阵包括针对所述过程集合中的每个过程的行和列;基于所述业务数据对所述矩阵进行分层聚类,所述分层聚类输出多个集群,每个集群包括所述过程集合中的一个或多个过程;以及将所述多个集群合并成合并的过程集群的集合。
[0009]在一些示例中,所述合并的过程集群的集合可以在云平台上实现。
[0010]在一些示例中,所述矩阵中的每个条目包括由与该条目的行相对应的过程传送并且由与该条目的列相对应的过程接收的业务数据。
[0011]在一些示例中,所述矩阵是多维矩阵,所述多维矩阵包括级联在一起的用于每个业务数据类型的矩阵,所述多维矩阵具有维度N
×
(XN),其中,N是所述过程集合中的过程的数量,并且X是级联在一起的矩阵的数量。
[0012]在一些实例中,对所述矩阵进行分层聚类包括将每个过程或所述过程集群分层链接在一起。所述分层链接可以包括Ward链接,所述Ward链接输出树状图,所述树状图将所述过程集合中的每个过程表示为叶节点并且将所述过程集群中的每个过程集群表示为非叶节点。在一些情况下,合并所述多个集群包括在合并点处切割所述树状图。
[0013]在一些示例中,可以对所述合并的过程集群的集合进行聚类。
附图说明
[0014]图1是根据本公开的各方面的示例系统的功能图。
[0015]图2示出根据本公开的各方面的示例系统。
[0016]图3是示出根据本公开的各方面的对虚拟机进行聚类的流程图。
[0017]图4示出根据本公开的各方面的示例矩阵。
[0018]图5示出根据本公开的各方面的示例树状图。
具体实施方式
[0019]概述
[0020]本技术涉及基于各个过程的业务模式来对诸如VM的过程进行聚类,以优化集群中的过程的性能和可用性。例如,针对诸如在线应用的云服务实现的VM通常由网络架构师或云服务的发布者的其他这样的管理者来配置。在许多情况下,发布者将VM进行聚类在一起以便为云服务的一个或多个特定特征提供足够的计算功率和/或冗余。然而,集群和集群中的VM的性能不容易预测,并且集群和集群中的VM常常不以高效方式操作。例如,一个集群中的VM所经历的工作负载可能大于另一集群中的为云服务提供类似功能的VM。工作负载在集群与集群中的VM之间的这种不均匀散布可能降低云服务的性能和可用性。对于其它过程,例如容器化环境中的容器和/或作业,也会出现类似的问题。
[0021]为了解决这些问题,可以基于过程的操作数据来优化将过程分组为功能集群,其中集群中的过程执行类似功能。在这一方面,每个过程之间的业务可以被输入到矩阵中。矩
阵中的每个条目可以被缩放以归一化每个过程之间的业务量。可以对矩阵进行截断以减少其维数,从而简化并减少对本文所述的进一步计算的处理要求。无监督机器学习可以用于在截断矩阵上进行分层聚类,使得具有相似条目的过程被聚类在一起。分层聚类可以包括分层链接以将相似集群组合在一起以创建树状图。树状图可以将每个过程表示为叶,并且合并的过程集群可以由合并点表示,合并点也被称为非叶节点。可以在合并点处切割树状图以形成平坦集群。在一些情况下,可以执行附加聚类以进一步将相似集群合并在一起。所得到的过程集群可以在云平台的信息技术基础设施中实现以供云服务使用。
[0022]示例系统
[0023]图1示出包括多个计算设备的示例系统100,多个计算设备包括服务器计算设备110、110a、110b和客户端计算设备120、130和140,以及存储系统150。计算设备和存储系统150经由网络160连接。
[0024]如图1所示,计算设备110和140中的每一个可以包括一个或多个处理器、存储本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于对过程进行聚类的方法,包括:由一个或多个处理器接收在过程集合中的每对过程之间传送和接收的业务数据;由所述一个或多个处理器基于所述业务数据生成矩阵,所述矩阵包括针对所述过程集合中的每个过程的行和列;由所述一个或多个处理器基于所述业务数据对所述矩阵进行分层聚类,所述分层聚类输出多个集群,每个集群包括所述过程集合中的一个或多个过程;以及由所述一个或多个处理器将所述多个集群合并成合并的过程集群的集合。2.根据权利要求1所述的方法,还包括在云平台上实现所述合并的过程集群的集合。3.根据权利要求1所述的方法,其中,所述矩阵中的每个条目包括由与所述条目的行相对应的过程传送并且由与所述条目的列相对应的过程接收的业务数据。4.根据权利要求3所述的方法,其中,所述业务数据包括以下中的一个或多个:在所述过程集合中的每对过程之间传送的多个分组、比特或字节,并且其中,所述业务数据不包括个人可识别信息。5.根据权利要求1所述的方法,其中,所述矩阵是多维矩阵,所述多维矩阵包括级联在一起的用于每个业务数据类型的矩阵,所述多维矩阵具有维度N
×
(XN),其中,N是所述过程集合中的过程的数量,并且X是级联在一起的矩阵的数量。6.根据权利要求1所述的方法,其中,对所述矩阵进行分层聚类包括将每个过程或所述过程集群分层链接在一起。7.根据权利要求6所述的方法,其中,所述分层链接包括Ward链接,所述Ward链接输出树状图,所述树状图将所述过程集合中的每个过程表示为叶节点,并且将所述过程集群中的每个过程集群表示为非叶节点。8.根据权利要求7所述的方法,其中,合并所述多个集群包括在合并点处切割所述树状图。9.根据权利要求1所述的方法,还包括对所述合并的过程集群的集合进行聚类。10.一种用于对过程进行聚类的计算系统,包括:一个或多个计算设备;一个或多个计算机可读存储介质;以及存储在所述一个或多个计算机可读存储介质上的程序指令,用于由所述一个或多个计算设备中的至少一个计算设备执行,所述程序指令使得所述一个或多个计算设备:接收在过程集合中的每对过程之间传送和接收的业务数据;基于所述业务数据生成矩阵,所述矩阵包括针对所述过程集合中的每个过程的行和列;基于所述业务数据对所述矩阵进行...

【专利技术属性】
技术研发人员:克里斯托弗
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1