模型处理方法以及相关产品技术

技术编号：33132870 阅读：10 留言：0更新日期：2022-04-17 00:53

本申请实施例公开了一种模型处理方法以及相关产品，可用于智慧交通和自动驾驶领域。模型处理方法包括：获取待处理深度网络模型，待处理深度网络模型包括N个处理层，任一处理层均包含一个或多个剪枝对象，N是正整数；获取待处理深度网络模型对应的剪枝结构先验知识，剪枝结构先验知识包括N个处理层的N个剪枝率所呈现的分布规律；根据剪枝结构先验知识，对各处理层包含的剪枝对象分别进行剪枝处理，得到精简深度网络模型；输出精简深度网络模型。采用本申请，可以降低深度学习模型的计算量以及降低模型占用的存储空间。及降低模型占用的存储空间。及降低模型占用的存储空间。

全部详细技术资料下载

【技术实现步骤摘要】
模型处理方法以及相关产品

[0001]本申请涉及智慧交通及自动驾驶领域，尤其涉及一种模型处理方法以及相关产品。

技术介绍

[0002]深度学习已成为机器学习中最主流的分支之一。然而，随着深度学习的不断优化，模型的深度从几层扩展到上百层，随之而来的是计算量的同步膨胀。对非计算密集型终端设备而言，如果直接部署深度学习模型，计算量以及模型占用存储空间的大小等都会成为问题。进一步地，在特定领域(例如，医疗领域或者高频视频领域)，图片的分辨率已经达到2k*2k，甚至5k*5k，图片分辨率的增大，进一步增加了模型计算量。
[0003]因此，如何降低深度学习模型的计算量以及降低模型占用的存储空间成为了亟待解决的重点问题。

技术实现思路

[0004]本申请实施例提供一种模型处理方法以及相关产品，可以降低深度学习模型的计算量以及降低模型占用的存储空间。
[0005]本申请实施例一方面提供了一种模型处理方法，包括：
[0006]获取待处理深度网络模型，所述待处理深度网络模型包括N个处理层，任一处理层均包含一个或多个剪枝对象，N是正整数；
[0007]获取所述待处理深度网络模型对应的剪枝结构先验知识，所述剪枝结构先验知识包括所述N个处理层的N个剪枝率所呈现的分布规律；
[0008]根据所述剪枝结构先验知识，对各处理层包含的剪枝对象分别进行剪枝处理，得到精简深度网络模型；
[0009]输出所述精简深度网络模型。
[0010]本申请实施例一方面提供了一种模型处理装置，包括...

【技术保护点】

【技术特征摘要】
1.一种模型处理方法，其特征在于，所述方法包括：获取待处理深度网络模型，所述待处理深度网络模型包括N个处理层，任一处理层均包含一个或多个剪枝对象，N是正整数；获取所述待处理深度网络模型对应的剪枝结构先验知识，所述剪枝结构先验知识包括所述N个处理层的N个剪枝率所呈现的分布规律；根据所述剪枝结构先验知识，对各处理层包含的剪枝对象分别进行剪枝处理，得到精简深度网络模型；输出所述精简深度网络模型。2.根据权利要求1所述的方法，其特征在于，所述根据所述剪枝结构先验知识，对各处理层包含的剪枝对象分别进行剪枝处理，得到精简深度网络模型，包括：按照处理层在所述待处理深度网络模型中的位置，将所述N个处理层划分为M阶，M≤N，且M是正整数；根据所述剪枝结构先验知识，分别确定每一阶包含的处理层的剪枝率，属于同一阶的处理层的剪枝率相同；按照各处理层的剪枝率，对N个处理层的剪枝对象分别进行剪枝处理，将剪枝处理后的N个处理层组合为所述精简深度网络模型。3.根据权利要求2所述的方法，其特征在于，所述剪枝结构先验知识还包括最大剪枝率，当所述分布规律为抛物线分布规律时，所述根据所述剪枝结构先验知识，分别确定每一阶包含的处理层的剪枝率，包括：将所述最大剪枝率作为第阶的剪枝率；根据所述最大剪枝率以及第t阶与第阶之间的距离，确定第t阶的剪枝率，t是正整数，且将第t阶的剪枝率作为所述第t阶包含的处理层的剪枝率。4.根据权利要求2所述的方法，其特征在于，第一处理层是N个处理层中一个处理层，所述第一处理层包括多个剪枝对象，按照所述第一处理层的剪枝率，对所述第一处理层的剪枝对象进行剪枝处理，得到剪枝处理以后的第一处理层的过程，包括：根据所述第一处理层包含的剪枝对象的数量以及所述第一处理层的剪枝率，确定第一剪枝数量；根据所述第一剪枝数量，对所述第一处理层的剪枝对象进行剪枝处理，得到剪枝处理后的第一处理层。5.根据权利要求4所述的方法，其特征在于，当所述待处理深度网络模型是卷积神经网络模型，且所述第一卷积层为卷积层，所述第一处理层的剪枝对象为卷积核时，所述根据所述第一剪枝数量，对所述第一处理层的剪枝对象进行剪枝处理，得到剪枝处理后的第一处理层，包括：分别确定所述第一处理层包含的每个卷积核的卷积核系数；将所述第一处理层对应的多个卷积核系数按照从小到大的顺序排序；根据排序结果和所述第一剪枝数量，对所述第一处理层的剪枝对象进行剪枝处理，得到剪枝处理后的第一处理层。
6.根据权利要求5所述的方法，其特征在于，所述根据排序结果和所述第一剪枝数量，对所述第一处理层的剪枝对象进行剪枝处理，得到剪枝处理后的第一处理层，包括：若所述第一处理层是N个处理层中的第一个处理层，则裁剪前第一剪枝数量个卷积核系数对应的卷积核，得到所述剪枝处理后的第一处理层；若所述第一处理层不是N个处理层中的第一个处理层，则裁剪前第一剪枝数量个卷积核系数对应的卷积核，得到待处理卷积层；获取在第二处理层中被裁剪的剪枝对象在所述第二处理层中的对象位置，其中，所述第二处理层是N个处理层中所述第一处理层的前一个处理层；在所述待处理卷积层中，裁剪与所述对象位置对应的卷积核通道，得到剪枝处理后的第一处理层。7.根据权利要求4所述的方法，其特征在于，当所述待处理深度网络模型是卷积神经网络模型，且所述第一卷积层为归一化层，所述第一处理层的剪枝对象为缩放因子时，所述根据所述第一剪枝数量，对所述第一处理层的剪枝对象进行剪枝处理，得到剪枝处理后的第一处理层，包括：若所述第一处理层是N个处理层中的第一个处理层，则将所述第一处理层对应的多个缩放因子按照从小到大的顺序排序；裁剪前第一剪枝数量个缩放因子，得到剪枝处理后的第一处理层。8.根据权利要求7所述的方法...

【专利技术属性】
技术研发人员：刘瑞，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人