一种基于分布式深度学习的GPU调度方法及系统技术方案

技术编号：28622462 阅读：11 留言：0更新日期：2021-05-28 16:18

本发明专利技术涉及计算机技术领域，尤其涉及一种基于分布式深度学习的GPU调度方法，包括：向调度中心创建任务，任务根据优先级被依次放入任务队列中，等待被调度；调度中心周期性地从任务队列中调取任务，并根据任务所需的GPU资源，向节点选择器查询空闲的工作节点；节点选择器在复数个工作节点中查询到空闲的工作节点后，将空闲的工作节点的节点信息反馈给调度中心；调度中心将任务与节点信息组成一个综合任务信息放入任务池中；各个节点对任务池进行实时监测，当工作节点监测到任务池中存在可执行任务时，调取对应的综合任务信息以执行。有益效果：提升GPU的使用率并对任务进行有效管理，提高了深度学习的训练和测试效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于分布式深度学习的GPU调度方法及系统
本专利技术涉及计算机
，尤其涉及一种基于分布式深度学习的GPU调度方法及系统。
技术介绍
随着计算机技术的快速发展，深度学习已经被广泛地运用于信息搜索、数据挖掘、图像识别、语音处理、自然语言、推理、决策等各方面实际场景中。深度学习是学习样本数据的内在规律和表示层次，在多层神经网络上运用各种机器学习算法解决图像、文本等各种问题的算法集合，其最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。当前深度学习所面临的问题除了数据处理、算法网络外，还需要对大量的数据进行训练与测试，因此需要足够的GPU(GraphicsProcessingUnit，图形处理器)算力来支撑，通常一台计算机不足以执行深度学习的任务，因此需要采用多台计算机组成的分布式系统，将任务拆分给多个GPU来进行处理，由多台计算机分别计算，再上传运算结果后，将结果统一合并得出数据结论的科学。在一个分布式系统中，一组独立的计算机展现给用户的是一个统一的整体，系统拥有多种通用的物理和逻辑资源，可以动态的分配任务，分散的物理和逻辑资源通过计算机网络实现信息交换。因此，如何协调分配任务是实现GPU调度的核心问题。
技术实现思路
本专利技术的其他特征和优点将在随后的说明书中阐述，并且部分地从说明书中变得显而易见，或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过说明书、权利要求书以及其他说明书附图中所特别指出的结构来实现和获得。本专利技术的目的在于...

【技术保护点】
1.一种基于分布式深度学习的GPU调度方法，其特征在于，包括以下步骤：/n步骤S1，向调度中心创建任务，所述任务根据优先级被依次放入任务队列中，等待被调度；/n步骤S2，所述调度中心周期性地从所述任务队列中调取所述任务，并根据所述任务所需的GPU资源，向节点选择器查询空闲的工作节点；/n步骤S3，所述节点选择器在复数个所述工作节点中查询到空闲的所述工作节点后，将空闲的所述工作节点的节点信息反馈给所述调度中心；/n步骤S4，所述调度中心将所述任务与所述节点信息组成一个综合任务信息放入任务池中；/n步骤S5，各个所述节点对所述任务池进行实时监测，当所述工作节点监测到所述任务池中存在可执行任务时，调取对应的所述综合任务信息以执行。/n

【技术特征摘要】
1.一种基于分布式深度学习的GPU调度方法，其特征在于，包括以下步骤：
步骤S1，向调度中心创建任务，所述任务根据优先级被依次放入任务队列中，等待被调度；
步骤S2，所述调度中心周期性地从所述任务队列中调取所述任务，并根据所述任务所需的GPU资源，向节点选择器查询空闲的工作节点；
步骤S3，所述节点选择器在复数个所述工作节点中查询到空闲的所述工作节点后，将空闲的所述工作节点的节点信息反馈给所述调度中心；
步骤S4，所述调度中心将所述任务与所述节点信息组成一个综合任务信息放入任务池中；
步骤S5，各个所述节点对所述任务池进行实时监测，当所述工作节点监测到所述任务池中存在可执行任务时，调取对应的所述综合任务信息以执行。

2.根据权利要求1所述的GPU调度方法，其特征在于，所述步骤S1包括：
步骤S101，创建所述任务；
步骤S102，将所述任务传送至所述调度中心；
步骤S103，所述调度中心判断所述任务的优先级；
步骤S104，依照所述优先级将所述任务放入所述任务队列中。

3.根据权利要求1所述的GPU调度方法，其特征在于，所述步骤S3包括：
步骤S301，所述节点选择器在复数个所述工作节点中查询是否存在空闲的所述工作节点：
若是，则转向步骤S302；
若否，则返回所述步骤S301；
步骤S302，所述节点选择器查询当前所述工作节点的负载，判断所述工作节点是否能够执行所述调度中心当前分配的所述任务：
若是，则转向步骤S303；
若否，则返回所述步骤S301；
步骤S303，所...

【专利技术属性】
技术研发人员：陈光泽，陈健法，史憬烨，李剑辉，
申请(专利权)人：福建紫辰信息科技有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人