【技术实现步骤摘要】
节点间通信方法、装置、电子设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种节点间通信方法、装置、电子设备及非易失性可读存储介质。
技术介绍
[0002]集群管理难度随着大规模集群和超大规模集群的出现呈指数级增长,越来越多的用户选择集群管理工具对集群进行管理。现有的集群管理工具往往采用容器技术进行部署。但是这种部署方式中单一图形处理单元(Graphics Processing Unit,GPU)只能被一个容器占用,GPU的芯片算力存在浪费。
[0003]针对上述问题,现有技术往往采用虚拟化技术实现多个不同容器间的GPU资源共享,但是,多个虚拟图像处理单元(Vitual Graphics Processing Unit,VGPU)容器间同样需要多条网络进行通信,而这些网络通信需要中央处理单元(Central Processing Unit ,CPU)参与。当处理任务复杂时,CPU长时间被不同容器间的通信严重占用,通信处理能力差。
技术实现思路
[0004]本申请提供了一种节点间通信方法、装置、电子设备及非易失性可读存储介质。本申请提供的节点间通信方法中,节点间通信方法通过携带第一源节点的内存信息和第一目标节点的内存信息确定第一源节点的身份信息和第一目标节点的身份信息,根据第一源节点的身份信息和第一目标节点的身份信息,通过远程直接存储器访问(Remote Direct Memory Access,RDMA)模块对第一源节点和第一目标节点执行通信动作。由于本申请提供的节点间通信方法依 ...
【技术保护点】
【技术特征摘要】
1.一种节点间通信方法,应用于一种Kubernetes集群管理系统中,其特征在于,所述方法包括:获取现场可编程门阵列的列表;根据所述现场可编程门阵列的列表将所述现场可编程门阵列虚拟化得到第一源节点和第一目标节点,其中,所述第一源节点和所述第一目标节点为通用计算图形处理单元节点;获取所述第一源节点和所述第一目标节点之间的申请描述符,其中,所述申请描述符包括所述第一源节点的内存地址和所述第一目标节点的内存地址;根据所述第一源节点的内存地址获取所述第一源节点的身份信息,根据所述第一目标节点的内存地址获取所述第一目标节点的身份信息;根据所述第一源节点的身份信息和所述第一目标节点的身份信息,通过远程直接存储器访问模块对所述第一源节点和所述第一目标节点执行通信动作。2.根据权利要求1所述的方法,其特征在于,所述获取第一源节点和第一目标节点之间的申请描述符之前,还包括:对多个节点进行身份信息分配,其中,所述多个节点包括第一源节点和第一目标节点;根据所述多个节点的身份信息分配顺序对多个所述节点进行统一内存地址编辑。3.根据权利要求2所述的方法,其特征在于,所述多个节点位于集群中,所述对多个节点进行身份信息分配包括:对所述多个节点执行集群动态分配动作,获取对应的身份信息。4.根据权利要求2所述的方法,其特征在于,所述获取第一源节点和第一目标节点之间的申请描述符包括:构建所述多个节点的申请描述表,其中,所述申请描述表中携带所述多个节点之间的申请描述符;根据先入先出原则从所述申请描述表中获取所述第一源节点和第一目标节点之间的申请描述符。5.根据权利要求1所述的方法,其特征在于,所述根据所述第一源节点的内存地址获取所述第一源节点的身份信息,所述第一目标节点的内存地址获取所述第一目标节点的身份信息包括:对所述第一源节点的内存地址进行地址解析,获取所述第一源节点的本地地址和所述第一源节点的身份信息;对所述第一目标节点的内存地址进行地址解析,获取所述第一目标节点的本地地址和所述第一目标节点的身份信息。6.根据权利要求5所述的方法,其特征在于,所述对所述第一源节点的内存地址进行地址解析,获取所述第一源节点的本地地址和所述第一源节点的身份信息之前,还包括:生成多个节点的内存地址与对应本地地址的映射和反映射。7.根据权利要求1所述的方法,其特征在于,所述根据所述第一源节点的身份信息和所述第一目标节点的身份信息,通过远程直接存储器访问模块对所述第一源节点和所述第一目标节点执行通信动作包括:根据所述第一源节点的身份信息获取所述第一源节点的互联网协议地址信息;
根据所述第一目标节点的身份信息获取所述第一目标节点的互联网协议地址信息;根据所述第一源节点的互联网协议地址信息和所述第一目标节点的互联网协议地址信息,通过所述远程直接存储器访问模块中预先设置的协议对所述第一源节点和所述第一目标节点执行通信动作。8.根据权利要求7所述的方法,其特征在于,所述根据所述第一源节点的身份信息获取所述第一源节点的互联网协议地址信息之前,还包括:生成所述多个节点身份信息和对应互联网协议地址信息的映射。9.根据权利要求7所述的方法,其特征在于,所述远程直接存储器访问模块与所述通用计算图形处理单元节点对应的图形处理单元共享内存,所述根据所述第一源节点的互联网协议地址信息和所述第一目标节点的互联网协议地址信息,通过所述远程直接存储器访问模块中预先设置的协议对所述第一源节点和所述第一目标节点执行通信动作包括:根据所述第一源节点的互联网协议地址信息和所述第一目标节点的互联网协议地址信息,通过所述远程直接存储器访问模块中预先设置的协议对所述第一源节点和所述第一目标节点执行零拷贝动作。10.根据权利要求9所述的方法,其特征在于,所述预先设置的协议包括传输控制协议,所述根据所述第一源节点的互联网协议地址信息和所述第一目标节点的互联网协议地址信息,通过所述远程直接存储器访问模块中预先设置的协议对所述第一源节点和所述第一目标节点执行零拷贝动作包括:根据所述第一源节点的互联网协议地址信息和所述第一目标节点的互联网协议地址信息,通过所述远程直接存储器访问模块中预先设置的所述传输控制协议对所述第一源节点和所述第一目标节点执行内存读写动作。11.根据权利要求9所述的方法,其特征在于,所述预先设置的协议包括用户数据...
【专利技术属性】
技术研发人员:赵谦谦,阚宏伟,郝锐,肖麟阁,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。