神经网络剪枝方法及相关产品技术

技术编号：39194754 阅读：19 留言：0更新日期：2023-10-27 08:41

本申请实施例公开了一种神经网络剪枝方法及相关产品，方法包括：确定第一模型，其中，所述第一模型支持细粒度训练；对所述第一模型进行分析，以剪去不达标的权值，得到第二模型；对所述第二模型对应的权值进行初始化，得到第三模型；对所述第三模型进行迭代训练，直至所述第三模型收敛或迭代次数达到最大迭代次数；在每一代所述迭代训练中，判断每一代迭代训练得到的第四模型对应的压缩比是否达标；若所述压缩比达标，则确定剪枝操作结束。采用本申请实施例有利于提高训练灵活性，并有利于开发者针对自身的应用场景进行灵活定制，从而避免由于剪去部分不重要的权重而造成神经网络模型表达能力受损的影响。表达能力受损的影响。表达能力受损的影响。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络剪枝方法及相关产品

[0001]本申请涉及电子设备
，具体涉及一种神经网络剪枝方法及相关产品。

技术介绍

[0002]随着深度学习技术的进步，神经网络模型(例如，深度神经网络(Deep Neural Network，DNN)、卷积神经网络(Convolutional Neural Network，CNN)等等)在机器视觉、自动驾驶、自然语言等领域中的应用日益广泛。然而其复杂的结构导致即使在推理时需占用大量的功耗和资源(例如，算力、内存、存储空间等)，严重限制了此类技术在功耗和资源受限的移动和嵌入式平台上的部署，因而会对其进行一定的压缩。目前对神经网络模型进行压缩的方法主要有量化(quantization)、剪枝(pruning)、知识蒸馏(knowledge distillation)、神经网络结构搜索(neural architecture search，NAS)等。
[0003]其中，剪枝是指从原始神经网络模型(Neural Network，NN)中系统性地剪去部分不重要的权重而尽量少地损失精度，以减少NN的参数量；在这种情况下，即使剪去的主要是不重要的权重，但是仍然会对神经网络的表达能力造成一定程度的影响。

技术实现思路

[0004]本申请实施例提供了一种神经网络剪枝方法及相关产品，有利于提高训练灵活性，并有利于开发者针对自身的应用场景进行灵活定制，从而避免由于剪去部分不重要的权重而造成神经网络模型表达能力受损的影响
[0005]第一方面，本申请实施例提供一种神经网...

【技术保护点】

【技术特征摘要】
1.一种神经网络剪枝方法，其特征在于，包括：确定第一模型，其中，所述第一模型支持细粒度训练；对所述第一模型进行分析，以剪去不达标的权值，得到第二模型；对所述第二模型对应的权值进行初始化，得到第三模型；对所述第三模型进行迭代训练，直至所述第三模型收敛或迭代次数达到最大迭代次数；在每一代所述迭代训练中，判断每一代迭代训练得到的第四模型对应的压缩比是否达标；若所述压缩比达标，则确定剪枝操作结束。2.根据权利要求1所述的方法，其特征在于，所述确定第一模型，包括：获取原始模型以及所述原始模型中每一层网络模型对应的训练细粒度；根据所述每一层网络模型对应的训练细粒度，确定在所述每一代迭代训练过程中所述每一层网络模型需要打开和/或关闭和/或减慢的权值；根据所述需要打开和/或关闭和/或减慢的权值，对所述原始模型的每一层网络模型进行调度，得到所述第一模型。3.根据权利要求1或2所述的方法，其特征在于，所述对所述第一模型进行分析，以剪去不达标的权值，得到第二模型，包括：确定所述第一模型对应的最小剪枝单位；根据所述最小剪枝单位，对所述第一模型对应的权值进行分组，得到多个权值组；根据所述多个权值组，对所述第一模型进行逐层或者全局识别，以筛选出不达标的权值，得到所述第二模型。4.根据权利要求3所述的方法，其特征在于，所述根据所述多个权值组，对所述第一模型进行逐层或者全局识别，以筛选出不达标的权值，得到所述第二模型，包括：根据所述多个权值组，确定每一权值组对应的L0范数和/或L1范数和/或L2范数；确定所述L0范数和/或所述L1范数和/或所述L2范数小于预设阈值的权值组包括的权值为所述不达标的权值；剪去所述不达标的权值，得到所述第二模型。5.根据权利要求4所述的方法，其特征在于，...

【专利技术属性】
技术研发人员：李文进，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人