管理资源的方法、装置及计算机存储介质制造方法及图纸

技术编号：26890425 阅读：13 留言：0更新日期：2020-12-29 16:06

本申请公开了一种管理资源的方法、装置及计算机存储介质，属于深度学习技术领域。所述方法包括：确定深度学习训练平台中部署的参考资源的可使用总量，根据可使用总量确定多个用户的使用量阈值。由于使用量阈值用于指示用户提交的任务能够使用的参考资源的量，因此，通过本申请实施例提供的管理资源的方法可以实现按照各个用户对参考资源进行分配，以提高参考资源的利用率。

全部详细技术资料下载

【技术实现步骤摘要】
管理资源的方法、装置及计算机存储介质
本申请涉及深度学习
，特别涉及一种管理资源的方法、装置及计算机存储介质。
技术介绍
在深度学习领域中，计算机通常需要调用GPU(graphicsprocessingunit，图像处理单元)以及存储器等资源，以完成深度学习过程中的训练任务。为了避免这些资源的浪费，需要对计算机中的资源进行管理，以提高这些资源的利用率。
技术实现思路
本申请实施例提供了一种管理资源的方法、装置及计算机存储介质，可以提高资源的利用率。所述技术方案如下：一方面、提供了一种管理资源的方法，该方法包括：确定深度学习训练平台中部署的参考资源的可使用总量；根据所述可使用总量确定多个用户的使用量阈值，所述使用量阈值用于指示用户提交的任务能够使用的所述参考资源的量。可选地，所述多个用户被划分为多个用户群，所述多个用户群中每个用户群配置一个分配比例；所述根据所述可使用总量确定多个用户的使用量阈值。包括：根据所述可使用总量和所述多个用户群中每个用户群的分配比例，确定所述多个用户群中每个用户群的可使用量；对于所述多个用户群中的第一用户群，根据所述第一用户群的可使用量和所述第一用户群包括的用户，确定所述第一用户群中每个用户的可使用量，所述第一用户群为所述多个用户群中任一个；根据每个用户的可使用量确定每个用户的使用量阈值。可选地，所述根据所述可使用总量确定多个用户的使用量阈值，包括：显示资源分配提示消息，所述资源分配提示消息携带所...

【技术保护点】
1.一种管理资源的方法，其特征在于，所述方法包括：/n确定深度学习训练平台中部署的参考资源的可使用总量；/n根据所述可使用总量确定多个用户的使用量阈值，所述使用量阈值用于指示用户提交的任务能够使用的所述参考资源的量。/n

【技术特征摘要】
1.一种管理资源的方法，其特征在于，所述方法包括：
确定深度学习训练平台中部署的参考资源的可使用总量；
根据所述可使用总量确定多个用户的使用量阈值，所述使用量阈值用于指示用户提交的任务能够使用的所述参考资源的量。

2.如权利要求1所述的方法，其特征在于，所述多个用户被划分为多个用户群，所述多个用户群中每个用户群配置一个分配比例；
所述根据所述可使用总量确定多个用户的使用量阈值。包括：
根据所述可使用总量和所述多个用户群中每个用户群的分配比例，确定所述多个用户群中每个用户群的可使用量；
对于所述多个用户群中的第一用户群，根据所述第一用户群的可使用量和所述第一用户群包括的用户，确定所述第一用户群中每个用户的可使用量，所述第一用户群为所述多个用户群中任一个；
根据每个用户的可使用量确定每个用户的使用量阈值。

3.如权利要求1所述的方法，其特征在于，所述根据所述可使用总量确定多个用户的使用量阈值，包括：
显示资源分配提示消息，所述资源分配提示消息携带所述可使用总量和/或每个用户的任务资源需求，用于指示管理员根据所述可使用总量和/或每个用户的任务资源需求对所述参考资源进行分配，以得到所述多个用户的使用量阈值；
检测所述管理员触发的第一上报指令，所述第一上报指令携带所述多个用户的使用量阈值。

4.如权利要求1所述的方法，其特征在于，所述深度学习训练平台上部署的存储器包括公共存储资源和私有存储资源，所述参考资源为所述存储器中的私有存储资源，所述参考资源的可使用总量用于指示所述私有存储资源的可使用存储容量。

5.如权利要求4所述的方法，其特征在于，所述确定深度学习训练平台中部署的参考资源的可使用总量，包括：
在所述深度学习训练平台初始化时，确定所述存储器的最大存储容量；
显示容量提示消息，所述容量提示消息携带所述最大存储容量，用于指示管理员根据所述最大存储容量将所述存储器划分为所述公共存储资源和私有存储资源，以得到所述公共存储资源的理论最大存储容量和所述私有存储资源的理论最大存储容量；
检测所述管理员触发的第二上报指令，所述第二上报指令携带所述公共存储资源的理论最大存储容量和所述私有存储资源的理论最大存储容量，将所述私有存储资源的理论最大存储容量作为所述私有存储资源的可使用总量。

6.如权利要求1所述的方法，其特征在于，所述参考资源为所述深度学习训练平台上部署的图像处理单元GPU，所述参考资源的可使用总量用于指示GPU的可使用时长。

7.如权利要求6所述的方法，其特征在于，所述确定深度学习训练平台中部署的参考资源的可使用总量，包括：
如果当前时间为更新时间点，则确定当前时间之前且距离当前时间最近的第一参考时间段内所述GPU的历史总使用时长，所述第一参考时间段为相邻的两个更新时间点之间的时长，将所述历史总使用时长作为所述GPU的可使用总量。

8.如权利要求6所述的方法，其特征在于，所述确定深度学习训练平台中部署的参考资源的可使用总量，包括：
如果当前时间为所述深度学习训练平台初始化时的时间，则获取所述GPU中每个GPU的类型和每个GPU的理论使用时长；
根据每个GPU的类型...

【专利技术属性】
技术研发人员：林丹峰，
申请(专利权)人：杭州海康威视数字技术股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人