深度学习模型的资源使用情况预测制造技术

技术编号：29200931 阅读：22 留言：0更新日期：2021-07-10 00:35

根据本公开的实现，提出了一种用于预测深度学习模型的资源使用情况的方案。在该方案中，与深度学习模型有关的信息被获取。该信息包括用于描述深度学习模型的第一信息、以及与深度学习模型所关联的任务的运行环境有关的第二信息。该任务的静态资源使用情况基于第一信息被确定。该任务在运行环境中运行时的策略基于第一信息和第二信息被确定。然后，基于该策略和静态资源使用情况来预测该任务在运行环境中运行时的资源使用情况。该方案能够准确地预测深度学习模型在特定运行时策略下的各种资源的使用情况，诸如算力消耗、存储器消耗和执行时间等。此外，该方案具有可扩展架构，便于支持各种不同类型的深度学习框架。于支持各种不同类型的深度学习框架。于支持各种不同类型的深度学习框架。

全部详细技术资料下载

【技术实现步骤摘要】
深度学习模型的资源使用情况预测

技术介绍

[0001]近年来，深度学习在信息技术行业变得非常流行，并且正在改变人们的生活。了解深度学习任务在其整个生命周期中的准确资源使用情况对于提高生产效率至关重要。如果能够准确地预测深度学习任务的资源使用情况，则深度学习开发人员可以预先选择最佳模型参数，以避免由于资源不足而导致的故障，并且在资源限制的情况下获得最佳模型性能。此外，如果能够准确地预测深度学习任务的资源使用情况，则可以通过动态调整深度学习任务的执行计划来确保深度学习任务在给定的服务水平协议(SLA)下完成(例如，满足给定的时间或预算要求)。

技术实现思路

[0002]根据本公开的实现，提出了一种用于预测深度学习模型的资源使用情况的方案。在该方案中，与深度学习模型有关的信息被获取。该信息包括用于描述深度学习模型的第一信息、以及与深度学习模型所关联的任务的运行环境有关的第二信息。该任务的静态资源使用情况基于第一信息被确定。该任务在运行环境中运行时的策略基于第一信息和第二信息被确定。然后，基于该策略和静态资源使用情况来预测该任务在运行环境中运行时的资源使用情况。该方案能够准确地预测深度学习模型在特定运行时策略下的各种资源的使用情况，诸如算力消耗、存储器消耗和执行时间等。此外，该方案具有可扩展架构，便于支持各种不同类型的深度学习框架。
[0003]提供
技术实现思路
部分是为了简化的形式来介绍对概念的选择，其在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识要求保护的主题的关键特征或主要特征，也无意限制要求保护的主题的范...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的方法，包括：获取与深度学习模型有关的信息，所述信息包括用于描述所述深度学习模型的第一信息、以及与所述深度学习模型所关联的任务的运行环境有关的第二信息；基于所述第一信息，确定所述任务的静态资源使用情况；基于所述第一信息和所述第二信息，确定所述任务在所述运行环境中运行时的策略；以及基于所述策略和所述静态资源使用情况，预测所述任务在所述运行环境中运行时的资源使用情况。2.根据权利要求1所述的方法，其中所述第一信息包括所述深度学习模型的配置参数。3.根据权利要求1所述的方法，其中所述第一信息包括以下至少一项：所述深度学习模型的模型文件；以及所述任务的程序代码。4.根据权利要求1所述的方法，其中所述第二信息包括以下至少一项：所述深度学习模型的框架类型；所述运行环境中用于执行所述任务的计算设备的规格和数目；以及所述任务在所述计算设备上的执行策略。5.根据权利要求1所述的方法，其中所述资源使用情况包括以下至少一项：算力消耗；存储器消耗；I/O资源消耗；执行时间；以及功率消耗。6.根据权利要求5所述的方法，其中所述资源使用情况包括基于所述算力消耗和所述存储器消耗中的至少一项而确定的其他资源消耗。7.根据权利要求1所述的方法，其中确定所述静态资源使用情况包括：基于所述第一信息，生成与所述深度学习模型相对应的计算图，所述计算图包括多个节点，所述多个节点对应于所述深度学习模型中的多个算子，连接所述多个节点的边缘指示所述多个算子之间的依赖关系；基于所述计算图和所述多个算子的相应资源预测模型，预测所述多个算子的相应静态资源使用情况；以及基于所述多个算子的相应静态资源使用情况，确定所述任务的所述静态资源使用情况。8.根据权利要求1所述的方法，其中所述策略包括以下至少一项：所述深度学习模型的资源分配策略；以及所述任务在所述运行环境中的执行策略。9.根据权利要求8所述的方法，其中预测所述任务在所述运行环境中运行时的所述资源使用情况包括：基于所述资源分配策略和所述执行策略中的至少一项来调整所述静态资源使用情况，以得到所述任务在所述运行环境中运行时的所述资源使用情况。10.根据权利要求1所述的方法，还包括：利用经训练的机器学习模型，生成用于优化经预测的所述资源使用情况的参数；以及基于所述参数，优化经预测的所述资源使用情况。11.一种电子设备，包括：处理单元；以及
存储器，耦合至所述处理单元并且包含存储于其上的指令，所述指令在由所述处理单元执行时，使得所述设备执行动作，所述动作包括：获取与深度学习模型有关的信息，所述信息包括用于描述所述深度学习模型的第一信息、以及与所述深度学习模型所关联的...

【专利技术属性】
技术研发人员：高彦杰，林昊翔，刘雨，杨懋，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人