一种计算任务的执行方法和相关设备技术

技术编号:38159065 阅读:10 留言:0更新日期:2023-07-13 09:29
本申请实施例提供了一种计算任务的执行方法和相关设备。该方法包括:第一计算设备确定第一数据存储在第一存储空间中,第一数据为第一计算实例执行第一计算任务所需的数据,第一计算实例当前运行在第一计算设备或第二非统一内存访问NUMA节点中,第一存储空间包括第一NUMA节点或第二计算设备的存储空间;第一计算设备将第一计算实例的寄存器信息传输至第一存储空间。该方法可以在第一计算实例执行第一计算任务时,将第一计算实例迁移至执行第一计算任务所需的数据所在的NUMA节点或计算设备中,从而节省第一计算实例远程迁移或读取数据的时间,提高第一计算实例或第一计算设备的计算性能,进而提高执行计算任务的效率。进而提高执行计算任务的效率。进而提高执行计算任务的效率。

【技术实现步骤摘要】
一种计算任务的执行方法和相关设备


[0001]本申请实施例涉及计算机领域,并且更具体地,涉及一种计算任务的执行方法、计算装置、计算设备、芯片系统和计算机可读介质。

技术介绍

[0002]传统的数据中心架构一直以单片服务器作为部署和操作单元,即一个计算实例仅可以部署于一台物理计算设备上,从而导致数据中心中存在部分物理计算设备剩余有部分存储资源和/或计算资源,且该部分存储资源和/或计算资源无法被有效利用。计算实例可以包括虚拟机或容器等。目前的内存池化技术可以提供远程存储空间供物理计算设备访问,使得物理计算设备可以优先分配计算资源,并在物理计算设备的存储资源不足时利用该远程存储空间,以满足用户的存储需求。具体地,在物理计算设备上的计算实例执行计算任务时,物理计算设备可以根据计算任务的执行需求或通过预测的方式,将执行该计算任务所需的数据提前从远程存储空间迁移至物理计算设备中,从而可以节省由于远程迁移或读取数据所花费的时间,进而避免降低物理计算设备或计算实例的运行性能。但由于物理计算设备难以精确地预测当前计算实例所需的数据,并且同一物理计算设备上的多个计算实例在数据迁移时存在额外的资源竞争,因此在执行计算任务时,数据迁移的方式容易导致物理计算设备或计算实例的计算性能较低,从而导致执行计算任务所需的时间较长。
[0003]因此,如何提高物理计算设备或计算实例的计算性能,从而提高计算任务的执行效率成为亟待解决的问题。

技术实现思路

[0004]本申请实施例提供一种计算任务的执行方法、计算装置、计算设备、芯片系统和计算机可读介质,可以在执行计算任务时,将计算实例迁移至数据所在的非统一内存访问(non uniform memory access,NUMA)节点或计算设备,从而提高计算实例或计算设备的计算性能,进而提高计算任务的执行效率。
[0005]第一方面,提供了一种计算任务执行方法,该方法包括:第一计算设备确定第一数据存储在第一存储空间中;第一计算设备将第一计算实例的寄存器信息传输至第一存储空间。
[0006]其中,第一数据为第一计算实例执行第一计算任务所需的数据,该第一计算实例当前运行在第一计算设备中。第一存储空间包括第一NUMA节点或第二计算设备的存储空间。第一NUMA节点为第一计算设备中除第二NUMA节点外的NUMA节点,第二NUMA节点为第一计算实例当前所在的NUMA节点。第二计算设备与第一计算设备连接。第一计算实例的寄存器信息用于执行第一计算任务。
[0007]本申请实施例中,第一计算设备可以在第一计算实例执行第一计算任务时,将第一计算实例的寄存器信息传输给第一数据所在的NUMA节点或第二计算设备,从而使得第一计算实例可以运行于第一NUMA节点或第二计算设备中。也即,第一计算设备可以将第一计
算实例迁移至执行第一计算任务所需的数据所在的NUMA节点或计算设备,从而节省第一计算实例远程读取数据的时间,提高第一计算实例或第一计算设备的计算性能,进而提高执行第一计算任务的效率。
[0008]结合第一方面,在第一方面的某些实现方式中,在第一存储空间为第一NUMA节点的存储空间时,第一计算实例确定第一数据未存储在第二NUMA节点中;第一计算设备或第一计算实例根据第一映射关系和第一数据的存储地址,确定第一NUMA节点,该第一映射关系用于指示数据的存储地址与NUMA节点的标识信息之间的对应关系。
[0009]本申请实施例中,第一计算设备或第一计算实例可以通过第一映射关系,确定第一数据当前所在的NUMA节点,从而便于将第一计算实例的寄存器信息迁移至对应的NUMA节点中。
[0010]结合第一方面,在第一方面的某些实现方式中,在第一存储空间为第一NUMA节点的存储空间时,第一计算设备将第一计算实例的寄存器信息存储至第一缓存中,该第一缓存为第二NUMA节点的缓存;第一计算设备将第一缓存中的数据同步至第二缓存中,第二缓存为第一NUMA节点的缓存。
[0011]本申请实施例中,第一计算设备可以通过同步不同NUMA节点中的缓存,将第一计算实例的寄存器信息存储至第一NUMA节点中,从而便于第一计算实例在第一NUMA节点中运行。
[0012]结合第一方面,在第一方面的某些实现方式中,在第一存储空间为第一NUMA节点的存储空间时,第一NUMA节点根据第一计算实例的寄存器信息和第一数据,执行第一计算任务。
[0013]本申请实施例中,第一NUMA节点可以根据第一计算实例的寄存器信息,运行第一计算实例。由于第一计算实例的寄存器信息的数据量小于第一数据的数据量,因此迁移第一计算实例的寄存器信息的时间小于迁移第一数据的时间。并且,由于第一数据存储在第一NUMA节点中,因此可以节省第一计算实例跨NUMA节点访问第一数据的时间,从而可以提高执行第一计算任务的效率。
[0014]结合第一方面,在第一方面的某些实现方式中,在第一存储空间为第二计算设备的存储空间时,第一计算实例确定第一数据未存储在第一计算设备中;第一计算设备或第一计算实例根据第二映射关系和第一数据的存储地址,确定第二计算设备,第二映射关系用于指示数据的存储地址与计算设备的标识信息之间的对应关系。
[0015]本申请实施例中,第一计算设备或第一计算实例可以通过第二映射关系,确定第一数据当前所在的计算设备,从而便于将第一计算实例的寄存器信息迁移至对应的计算设备中。
[0016]结合第一方面,在第一方面的某些实现方式中,在第一存储空间为第二计算设备的存储空间时,第一计算设备将第一计算实例的寄存器信息发送给第二计算设备;或者,第一计算设备向第二计算设备发送第一指示信息,第一指示信息用于指示第二计算设备获取第一计算实例的寄存器信息。
[0017]本申请实施例中,第一计算设备可以将第一计算实例的寄存器信息传输给第二计算设备,从而使得第二计算设备可以运行第一计算实例,并执行第一计算任务。由于第一计算实例的寄存器信息的数据量小于第一数据的数据量,因此迁移第一计算实例的寄存器信
息的时间小于迁移第一数据的时间。并且,由于第一数据存储在第二计算设备中,因此可以节省第一计算实例跨计算设备访问第一数据的时间,从而可以提高执行第一计算任务的效率。
[0018]结合第一方面,在第一方面的某些实现方式中,在满足第一预设条件时,第一计算设备根据第一资源请求,为第一计算实例分配第一资源。该第一资源请求用于指示第一计算实例的预设资源总量。第一预设条件包括至少一个计算设备的可用资源之和大于或等于预设资源总量。第一资源包括至少一个计算设备中一个或多个计算设备的资源,该至少一个计算设备包括第一计算设备,或者该至少一个计算设备与第一计算设备连接。
[0019]本申请实施例中,第一计算设备可以根据第一资源请求,为第一计算实例分配至少一个NUMA节点或至少一个计算设备的资源,从而可以充分利用每个NUMA节点或每个计算设备中的可用资源,避免造成资源浪费。第一计算设备为第一计算实例分配第一资源后,第一计算实例可以运行在该至少一个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算任务执行方法,其特征在于,包括:第一计算设备确定第一数据存储在第一存储空间中,所述第一数据为第一计算实例执行第一计算任务所需的数据,所述第一计算实例当前运行在所述第一计算设备中,所述第一存储空间包括第一非统一内存访问NUMA节点或第二计算设备的存储空间,所述第一NUMA节点为所述第一计算设备中除第二NUMA节点外的NUMA节点,所述第二NUMA节点为所述第一计算实例当前所在的NUMA节点,所述第二计算设备与所述第一计算设备连接;所述第一计算设备将所述第一计算实例的寄存器信息传输至所述第一存储空间,所述第一计算实例的寄存器信息用于执行所述第一计算任务。2.根据权利要求1所述的方法,其特征在于,在所述第一存储空间为所述第一NUMA节点的存储空间时,所述第一计算设备确定第一数据存储在第一存储空间中,包括:所述第一计算实例确定所述第一数据未存储在所述第二NUMA节点中;所述第一计算设备或所述第一计算实例根据第一映射关系和所述第一数据的存储地址,确定所述第一NUMA节点,所述第一映射关系用于指示数据的存储地址与NUMA节点的标识信息之间的对应关系。3.根据权利要求1或2所述的方法,其特征在于,在所述第一存储空间为所述第一NUMA节点的存储空间时,所述第一计算设备将所述第一计算实例的寄存器信息传输至所述第一存储空间,包括:所述第一计算设备将所述第一计算实例的寄存器信息存储至第一缓存中,所述第一缓存为所述第二NUMA节点的缓存;所述第一计算设备将所述第一缓存中的数据同步至第二缓存中,所述第二缓存为所述第一NUMA节点的缓存。4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述第一存储空间为所述第一NUMA节点的存储空间时,所述方法还包括:所述第一NUMA节点根据所述第一计算实例的寄存器信息和所述第一数据,执行所述第一计算任务。5.根据权利要求1至4中任一项所述的方法,其特征在于,在所述第一存储空间为所述第二计算设备的存储空间时,所述第一计算设备确定第一数据存储在第一存储空间中,包括:所述第一计算实例确定所述第一数据未存储在所述第一计算设备中;所述第一计算设备或所述第一计算实例根据第二映射关系和所述第一数据的存储地址,确定所述第二计算设备,所述第二映射关系用于指示数据的存储地址与计算设备的标识信息之间的对应关系。6.根据权利要求1至5中任一项所述的方法,其特征在于,在所述第一存储空间为所述第二计算设备的存储空间时,所述第一计算设备将所述第一计算实例的寄存器信息传输至所述第一存储空间,包括:所述第一计算设备将所述第一计算实例的寄存器信息发送给所述第二计算设备;或者,所述第一计算设备向所述第二计算设备发送第一指示信息,所述第一指示信息用于指示所述第二计算设备获取所述第一计算实例的寄存器信息。
7.一种计算任务执行方法,其特征在于,包括:第二计算设备获得第一计算实例的寄存器信息,所述第一计算实例的寄存器信息用于执行第一计算任务,在所述第二计算设备获得所述第一计算实例的寄存器信息前,所述第一计算实例运行于第一计算设备中,所述第一计算设备与所述第二计算设备连接;所述第二计算设备根据第一数据和所述第一计算实例的寄存器信息,执行第一计算任务,所述第一数据为执行第一计算任务所需的数据,所述第一数据存储于所述第二计算设备中。8.根据权利要求7所述的方法,其特征在于,所述第二计算设备获得第一计算实例的寄存器信息,包括:所述第二计算设备接收来自于所述第一计算设备的所述第一计算实例的寄存器信息;或者,所述第二计算设备接收来自于所述第一计算设备的第一指示信息,根据所述第一指示信息,从所述第一计算设备中获取所述第一计算实例的寄存器信息。9.根据权利要求7或8所述的方法,其特征在于,在所述第二计算设备中包括多个非统一内存访问NUMA节点时,所述方法还包括:所述第二计算设备确定第三NUMA节点,所述第三NUMA节点为所述多个NUMA节点中的任一个NUMA节点,所述第一数据存储在所述第三NUMA节点中;所述第二计算设备将所述第一计算实例的寄存器信息存储至所述第三NUMA节点。10.根据权利要求9所述的方法,其特征在于,所述第二计算设备确定第三NUMA节点,包括:所述第二计算设备根据第三映射关系和所述第一数据的存储地址,确定所述第三NUMA节点,所述第三映射关系用于指示数据的存储地址与NUMA节点的标识信息之间的对应关系。11.根据权利要求1至10中任一项所述的方法,其特征在于,所述方法还包括:在满足第一预设条件时,第三计算设备根据第一资源请求,为所述第一计算实例分配第一资源,所述第三计算设备包括第一计算设备或第二计算设备,所述第一资源请求用于指示第一计算实例的预设资源总量,所述第一预设条件包括至少一个计算设备的可用资源之和大于或等于所述预设资源总量,所述第一资源包括所述至少一个计算...

【专利技术属性】
技术研发人员:汤闻达付森波
申请(专利权)人:深圳华为云计算技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1