节点间通信方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38130177 阅读:6 留言:0更新日期:2023-07-08 09:37
本申请提供节点间通信方法、装置、电子设备及存储介质。包括:获取现场可编程门阵列的列表;根据列表将现场可编程门阵列虚拟化得到第一源节点和第一目标节点;获取第一源节点和第一目标节点之间的申请描述符,其中,申请描述符包括第一源节点和第一目标节点的内存地址;根据第一源节点的内存地址获取第一源节点的身份信息,根据第一目标节点的内存地址获取第一目标节点的身份信息;根据第一源节点的身份信息和第一目标节点的身份信息,通过远程直接存储器访问模块对第一源节点和第一目标节点执行通信动作。由于本申请提供的节点间通信方法依赖RDMA模块执行第一源节点和第一目标节点间的通信动作,不需要CPU参与,提高了节点间通信效率。间通信效率。间通信效率。

【技术实现步骤摘要】
节点间通信方法、装置、电子设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种节点间通信方法、装置、电子设备及非易失性可读存储介质。

技术介绍

[0002]集群管理难度随着大规模集群和超大规模集群的出现呈指数级增长,越来越多的用户选择集群管理工具对集群进行管理。现有的集群管理工具往往采用容器技术进行部署。但是这种部署方式中单一图形处理单元(Graphics Processing Unit,GPU)只能被一个容器占用,GPU的芯片算力存在浪费。
[0003]针对上述问题,现有技术往往采用虚拟化技术实现多个不同容器间的GPU资源共享,但是,多个虚拟图像处理单元(Vitual Graphics Processing Unit,VGPU)容器间同样需要多条网络进行通信,而这些网络通信需要中央处理单元(Central Processing Unit ,CPU)参与。当处理任务复杂时,CPU长时间被不同容器间的通信严重占用,通信处理能力差。

技术实现思路

[0004]本申请提供了一种节点间通信方法、装置、电子设备及非易失性可读存储介质。本申请提供的节点间通信方法中,节点间通信方法通过携带第一源节点的内存信息和第一目标节点的内存信息确定第一源节点的身份信息和第一目标节点的身份信息,根据第一源节点的身份信息和第一目标节点的身份信息,通过远程直接存储器访问(Remote Direct Memory Access,RDMA)模块对第一源节点和第一目标节点执行通信动作。由于本申请提供的节点间通信方法依赖RDMA模块执行第一源节点和第一目标节点间的通信动作,不需要CPU参与,避免了CPU被节点间通信长期占用的问题,提高了节点间通信效率。
[0005]第一方面,本申请提供了一种节点间通信方法,该方法包括:获取现场可编程门阵列的列表;根据现场可编程门阵列的列表将现场可编程门阵列虚拟化得到第一源节点和第一目标节点,其中,第一源节点和第一目标节点为通用计算图形处理单元节点;获取第一源节点和第一目标节点之间的申请描述符,其中,申请描述符包括第一源节点的内存地址和第一目标节点的内存地址;根据第一源节点的内存地址获取第一源节点的身份信息,根据第一目标节点的内存地址获取第一目标节点的身份信息;根据第一源节点的身份信息和第一目标节点的身份信息,通过远程直接存储器访问模块对第一源节点和第一目标节点执行通信动作。
[0006]可选的,本申请提供的方法还包括:对多个节点进行身份信息分配,其中,多个节点包括第一源节点和第一目标节点;根据多个节点的身份信息分配顺序对多个节点进行统一内存地址编辑。
[0007]可选的,本申请提供的方法还包括:
对多个节点执行集群动态分配动作,获取对应的身份信息。
[0008]可选的,本申请提供的方法还包括:构建多个节点的申请描述表,其中,申请描述表中携带多个节点之间的申请描述符;根据先入先出原则从申请描述表中获取第一源节点和第一目标节点之间的申请描述符。
[0009]可选的,本申请提供的方法还包括:对第一源节点的内存地址进行地址解析,获取第一源节点的本地地址和第一源节点的身份信息;对第一目标节点的内存地址进行地址解析,获取第一目标节点的本地地址和第一目标节点的身份信息。
[0010]可选的,本申请提供的方法还包括:生成多个节点的内存地址与对应本地地址的映射和反映射。
[0011]可选的,本申请提供的方法还包括:根据第一源节点的身份信息获取第一源节点的互联网协议地址信息;根据第一目标节点的身份信息获取第一目标节点的互联网协议地址信息;根据第一源节点的互联网协议地址信息和第一目标节点的互联网协议地址信息,通过远程直接存储器访问模块中预先设置的协议对第一源节点和第一目标节点执行通信动作。
[0012]可选的,本申请提供的方法还包括:生成多个节点身份信息和对应互联网协议地址信息的映射。
[0013]可选的,本申请提供的方法还包括:根据第一源节点的互联网协议地址信息和第一目标节点的互联网协议地址信息,通过远程直接存储器访问模块中预先设置的协议对第一源节点和第一目标节点执行零拷贝动作。
[0014]可选的,本申请提供的方法还包括:根据第一源节点的互联网协议地址信息和第一目标节点的互联网协议地址信息,通过远程直接存储器访问模块中预先设置的传输控制协议对第一源节点和第一目标节点执行内存读写动作。
[0015]可选的,本申请提供的方法还包括:根据第一源节点的互联网协议地址信息和第一目标节点的互联网协议地址信息,通过远程直接存储器访问模块中预先设置的用户数据报协议对第一源节点和第一目标节点执行内存读写动作。
[0016]可选的,本申请提供的方法还包括:根据拷贝类型调用预先设置在远程直接存储器访问模块中的通信模式;根据第一源节点的互联网协议地址信息和第一目标节点的互联网协议地址信息,通过通信模式对第一源节点和第一目标节点执行通信动作。
[0017]可选的,本申请提供的方法还包括:根据第一源节点的互联网协议地址信息和第一目标节点的互联网协议地址信息,
通过远程通信模式对第一源节点和第一目标节点执行通信动作。
[0018]可选的,本申请提供的方法还包括:根据第一源节点的互联网协议地址信息和第一目标节点的互联网协议地址信息,通过本地通信模式对第一源节点和第一目标节点执行通信动作。
[0019]可选的,本申请提供的方法还包括:对第一源节点和第一目标节点执行读取同步处理。
[0020]可选的,本申请提供的方法还包括:对第一源节点和第一目标节点执行写入同步处理。
[0021]可选的,本申请提供的方法还包括:根据读取同步处理的结果和写入同步处理的结果生成通信完成信号;当获取通信完成信号后,获取第二源节点和第二目标节点之间的申请描述符。
[0022]第二方面,本申请还提供一种装置,应用于一种Kubernetes集群管理系统中,包括:现场可编程门阵列列表获取模块,用于获取现场可编程门阵列的列表;节点虚拟化模块,用于根据现场可编程门阵列的列表将现场可编程门阵列虚拟化得到第一源节点和第一目标节点;第一申请描述获取模块,用于获取第一源节点和第一目标节点之间的申请描述符,其中,所述申请描述符包括所述第一源节点的内存地址和所述第一目标节点的内存地址,第一源节点和第一目标节点为通用计算图形处理单元节点;身份信息获取模块,用于根据所述第一源节点的内存地址获取所述第一源节点的身份信息,所述第一目标节点的内存地址获取所述第一目标节点的身份信息;通信动作模块,用于根据所述第一源节点的身份信息和所述第一目标节点的身份信息,通过远程直接存储器访问模块对所述第一源节点和所述第一目标节点执行通信动作。
[0023]第三方面,本申请还提供了一种电子设备,该电子设备包括处理器和存储器,存储器存储可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面的节点间通信方法的步骤。
[0024]第四方面,本申请实施例提供了一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种节点间通信方法,应用于一种Kubernetes集群管理系统中,其特征在于,所述方法包括:获取现场可编程门阵列的列表;根据所述现场可编程门阵列的列表将所述现场可编程门阵列虚拟化得到第一源节点和第一目标节点,其中,所述第一源节点和所述第一目标节点为通用计算图形处理单元节点;获取所述第一源节点和所述第一目标节点之间的申请描述符,其中,所述申请描述符包括所述第一源节点的内存地址和所述第一目标节点的内存地址;根据所述第一源节点的内存地址获取所述第一源节点的身份信息,根据所述第一目标节点的内存地址获取所述第一目标节点的身份信息;根据所述第一源节点的身份信息和所述第一目标节点的身份信息,通过远程直接存储器访问模块对所述第一源节点和所述第一目标节点执行通信动作。2.根据权利要求1所述的方法,其特征在于,所述获取第一源节点和第一目标节点之间的申请描述符之前,还包括:对多个节点进行身份信息分配,其中,所述多个节点包括第一源节点和第一目标节点;根据所述多个节点的身份信息分配顺序对多个所述节点进行统一内存地址编辑。3.根据权利要求2所述的方法,其特征在于,所述多个节点位于集群中,所述对多个节点进行身份信息分配包括:对所述多个节点执行集群动态分配动作,获取对应的身份信息。4.根据权利要求2所述的方法,其特征在于,所述获取第一源节点和第一目标节点之间的申请描述符包括:构建所述多个节点的申请描述表,其中,所述申请描述表中携带所述多个节点之间的申请描述符;根据先入先出原则从所述申请描述表中获取所述第一源节点和第一目标节点之间的申请描述符。5.根据权利要求1所述的方法,其特征在于,所述根据所述第一源节点的内存地址获取所述第一源节点的身份信息,所述第一目标节点的内存地址获取所述第一目标节点的身份信息包括:对所述第一源节点的内存地址进行地址解析,获取所述第一源节点的本地地址和所述第一源节点的身份信息;对所述第一目标节点的内存地址进行地址解析,获取所述第一目标节点的本地地址和所述第一目标节点的身份信息。6.根据权利要求5所述的方法,其特征在于,所述对所述第一源节点的内存地址进行地址解析,获取所述第一源节点的本地地址和所述第一源节点的身份信息之前,还包括:生成多个节点的内存地址与对应本地地址的映射和反映射。7.根据权利要求1所述的方法,其特征在于,所述根据所述第一源节点的身份信息和所述第一目标节点的身份信息,通过远程直接存储器访问模块对所述第一源节点和所述第一目标节点执行通信动作包括:根据所述第一源节点的身份信息获取所述第一源节点的互联网协议地址信息;
根据所述第一目标节点的身份信息获取所述第一目标节点的互联网协议地址信息;根据所述第一源节点的互联网协议地址信息和所述第一目标节点的互联网协议地址信息,通过所述远程直接存储器访问模块中预先设置的协议对所述第一源节点和所述第一目标节点执行通信动作。8.根据权利要求7所述的方法,其特征在于,所述根据所述第一源节点的身份信息获取所述第一源节点的互联网协议地址信息之前,还包括:生成所述多个节点身份信息和对应互联网协议地址信息的映射。9.根据权利要求7所述的方法,其特征在于,所述远程直接存储器访问模块与所述通用计算图形处理单元节点对应的图形处理单元共享内存,所述根据所述第一源节点的互联网协议地址信息和所述第一目标节点的互联网协议地址信息,通过所述远程直接存储器访问模块中预先设置的协议对所述第一源节点和所述第一目标节点执行通信动作包括:根据所述第一源节点的互联网协议地址信息和所述第一目标节点的互联网协议地址信息,通过所述远程直接存储器访问模块中预先设置的协议对所述第一源节点和所述第一目标节点执行零拷贝动作。10.根据权利要求9所述的方法,其特征在于,所述预先设置的协议包括传输控制协议,所述根据所述第一源节点的互联网协议地址信息和所述第一目标节点的互联网协议地址信息,通过所述远程直接存储器访问模块中预先设置的协议对所述第一源节点和所述第一目标节点执行零拷贝动作包括:根据所述第一源节点的互联网协议地址信息和所述第一目标节点的互联网协议地址信息,通过所述远程直接存储器访问模块中预先设置的所述传输控制协议对所述第一源节点和所述第一目标节点执行内存读写动作。11.根据权利要求9所述的方法,其特征在于,所述预先设置的协议包括用户数据...

【专利技术属性】
技术研发人员:赵谦谦阚宏伟郝锐肖麟阁
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1