模型处理方法以及相关产品技术

技术编号:33132870 阅读:10 留言:0更新日期:2022-04-17 00:53
本申请实施例公开了一种模型处理方法以及相关产品,可用于智慧交通和自动驾驶领域。模型处理方法包括:获取待处理深度网络模型,待处理深度网络模型包括N个处理层,任一处理层均包含一个或多个剪枝对象,N是正整数;获取待处理深度网络模型对应的剪枝结构先验知识,剪枝结构先验知识包括N个处理层的N个剪枝率所呈现的分布规律;根据剪枝结构先验知识,对各处理层包含的剪枝对象分别进行剪枝处理,得到精简深度网络模型;输出精简深度网络模型。采用本申请,可以降低深度学习模型的计算量以及降低模型占用的存储空间。及降低模型占用的存储空间。及降低模型占用的存储空间。

【技术实现步骤摘要】
模型处理方法以及相关产品


[0001]本申请涉及智慧交通及自动驾驶领域,尤其涉及一种模型处理方法以及相关产品。

技术介绍

[0002]深度学习已成为机器学习中最主流的分支之一。然而,随着深度学习的不断优化,模型的深度从几层扩展到上百层,随之而来的是计算量的同步膨胀。对非计算密集型终端设备而言,如果直接部署深度学习模型,计算量以及模型占用存储空间的大小等都会成为问题。进一步地,在特定领域(例如,医疗领域或者高频视频领域),图片的分辨率已经达到2k*2k,甚至5k*5k,图片分辨率的增大,进一步增加了模型计算量。
[0003]因此,如何降低深度学习模型的计算量以及降低模型占用的存储空间成为了亟待解决的重点问题。

技术实现思路

[0004]本申请实施例提供一种模型处理方法以及相关产品,可以降低深度学习模型的计算量以及降低模型占用的存储空间。
[0005]本申请实施例一方面提供了一种模型处理方法,包括:
[0006]获取待处理深度网络模型,所述待处理深度网络模型包括N个处理层,任一处理层均包含一个或多个剪枝对象,N是正整数;
[0007]获取所述待处理深度网络模型对应的剪枝结构先验知识,所述剪枝结构先验知识包括所述N个处理层的N个剪枝率所呈现的分布规律;
[0008]根据所述剪枝结构先验知识,对各处理层包含的剪枝对象分别进行剪枝处理,得到精简深度网络模型;
[0009]输出所述精简深度网络模型。
[0010]本申请实施例一方面提供了一种模型处理装置,包括
[0011]获取模块,用于获取待处理深度网络模型,所述待处理深度网络模型包括N个处理层,任一处理层均包含一个或多个剪枝对象,N是正整数;
[0012]所述获取模块,还用于获取所述待处理深度网络模型对应的剪枝结构先验知识,所述剪枝结构先验知识包括所述N个处理层的N个剪枝率所呈现的分布规律;
[0013]剪枝模块,用于根据所述剪枝结构先验知识,对各处理层包含的剪枝对象分别进行剪枝处理,得到精简深度网络模型;
[0014]输出模块,用于输出所述精简深度网络模型。
[0015]本申请实施例一方面提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述各实施例中的方法。
[0016]本申请实施例一方面提供了一种计算机存储介质,计算机存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时,执行上述各实施例中的方
法。
[0017]本申请实施例一方面提供了一种计算机程序产品,计算机程序产品包括计算机程序/指令,计算机程序/指令存储在计算机可读存储介质中,计算机程序/指令被计算机设备的处理器执行时,执行上述各实施例中的方法。
[0018]本申请通过对深度网络模型进行剪枝处理,裁剪掉模型的冗余部分,以压缩模型占用存储空间的大小,进而模型在进行前向传播计算时,参与计算的参数变少,可以降低计算量提升模型运行效率;再有,按照先验知识即N个剪枝率所对应的分布规律,对各处理层进行裁剪,相比于对各处理层的剪枝对象进行随机裁剪,不仅可以精简模型,还可以保证裁剪后的模型精度;进一步地,按照先验知识对各处理层进行裁剪,相比于改变模型的损失函数以进行稀疏化训练然后再确定各层的裁剪对象,本申请的精简方式更简单且更灵活,有利于扩大本申请的应用范围。
附图说明
[0019]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本申请实施例提供的一种模型处理的系统架构图;
[0021]图2是本申请实施例提供的一种模型处理的流程示意图;
[0022]图3a是本申请实施例提供的一种抛物线分布规律示意图;
[0023]图3b是本申请实施例提供的一种直线分布规律示意图;
[0024]图3c是本申请实施例提供的一种对线分布规律示意图;
[0025]图3d是本申请实施例提供的一种指数分布规律示意图;
[0026]图4是本申请实施例提供的一种确定剪枝结构先验知识的示意图;
[0027]图5是本申请实施例提供的一种剪枝率示意图;
[0028]图6是本申请实施例提供的一种裁剪模型的流程示意图;
[0029]图7是本申请实施例提供的一种剪枝处理的流程示意图一;
[0030]图8是本申请实施例提供的一种裁剪卷积核的示意图;
[0031]图9是本申请实施例提供的一种裁剪卷积核通道的示意图;
[0032]图10是本申请实施例提供的一种剪枝处理的流程示意图二;
[0033]图11是本申请实施例提供的一种裁剪缩放因子的示意图;
[0034]图12是本申请实施例提供的一种剪枝处理的流程示意图三;
[0035]图13a

图13b是本申请实施例提供的一种裁剪连接权重示意图;
[0036]图14是本申请实施例提供的一种剪枝处理的流程示意图四;
[0037]图15a

图15b是本申请实施例提供的一种裁剪神经元示意图;
[0038]图16是本申请实施例提供的一种模型处理装置的结构示意图;
[0039]图17是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0040]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0041]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0042]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。本申请提出的模型处理方法属于人工智能软件层面的技术,通过对已有模型进行剪枝操作得到一个参数更少的模型来达到精简模型的目的,以降低模型占用的存储空间以及降低模型的计算量。
[0043]本申请可以应用于各种深度网络模型加速场景,例如,可以应用于超分辨率图像作为输入数据的深度网络模型的加速场景中,通过对深度网络模型的结构进行优化(即对模型进行剪枝),可以大大降低模型体积,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型处理方法,其特征在于,所述方法包括:获取待处理深度网络模型,所述待处理深度网络模型包括N个处理层,任一处理层均包含一个或多个剪枝对象,N是正整数;获取所述待处理深度网络模型对应的剪枝结构先验知识,所述剪枝结构先验知识包括所述N个处理层的N个剪枝率所呈现的分布规律;根据所述剪枝结构先验知识,对各处理层包含的剪枝对象分别进行剪枝处理,得到精简深度网络模型;输出所述精简深度网络模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述剪枝结构先验知识,对各处理层包含的剪枝对象分别进行剪枝处理,得到精简深度网络模型,包括:按照处理层在所述待处理深度网络模型中的位置,将所述N个处理层划分为M阶,M≤N,且M是正整数;根据所述剪枝结构先验知识,分别确定每一阶包含的处理层的剪枝率,属于同一阶的处理层的剪枝率相同;按照各处理层的剪枝率,对N个处理层的剪枝对象分别进行剪枝处理,将剪枝处理后的N个处理层组合为所述精简深度网络模型。3.根据权利要求2所述的方法,其特征在于,所述剪枝结构先验知识还包括最大剪枝率,当所述分布规律为抛物线分布规律时,所述根据所述剪枝结构先验知识,分别确定每一阶包含的处理层的剪枝率,包括:将所述最大剪枝率作为第阶的剪枝率;根据所述最大剪枝率以及第t阶与第阶之间的距离,确定第t阶的剪枝率,t是正整数,且将第t阶的剪枝率作为所述第t阶包含的处理层的剪枝率。4.根据权利要求2所述的方法,其特征在于,第一处理层是N个处理层中一个处理层,所述第一处理层包括多个剪枝对象,按照所述第一处理层的剪枝率,对所述第一处理层的剪枝对象进行剪枝处理,得到剪枝处理以后的第一处理层的过程,包括:根据所述第一处理层包含的剪枝对象的数量以及所述第一处理层的剪枝率,确定第一剪枝数量;根据所述第一剪枝数量,对所述第一处理层的剪枝对象进行剪枝处理,得到剪枝处理后的第一处理层。5.根据权利要求4所述的方法,其特征在于,当所述待处理深度网络模型是卷积神经网络模型,且所述第一卷积层为卷积层,所述第一处理层的剪枝对象为卷积核时,所述根据所述第一剪枝数量,对所述第一处理层的剪枝对象进行剪枝处理,得到剪枝处理后的第一处理层,包括:分别确定所述第一处理层包含的每个卷积核的卷积核系数;将所述第一处理层对应的多个卷积核系数按照从小到大的顺序排序;根据排序结果和所述第一剪枝数量,对所述第一处理层的剪枝对象进行剪枝处理,得到剪枝处理后的第一处理层。
6.根据权利要求5所述的方法,其特征在于,所述根据排序结果和所述第一剪枝数量,对所述第一处理层的剪枝对象进行剪枝处理,得到剪枝处理后的第一处理层,包括:若所述第一处理层是N个处理层中的第一个处理层,则裁剪前第一剪枝数量个卷积核系数对应的卷积核,得到所述剪枝处理后的第一处理层;若所述第一处理层不是N个处理层中的第一个处理层,则裁剪前第一剪枝数量个卷积核系数对应的卷积核,得到待处理卷积层;获取在第二处理层中被裁剪的剪枝对象在所述第二处理层中的对象位置,其中,所述第二处理层是N个处理层中所述第一处理层的前一个处理层;在所述待处理卷积层中,裁剪与所述对象位置对应的卷积核通道,得到剪枝处理后的第一处理层。7.根据权利要求4所述的方法,其特征在于,当所述待处理深度网络模型是卷积神经网络模型,且所述第一卷积层为归一化层,所述第一处理层的剪枝对象为缩放因子时,所述根据所述第一剪枝数量,对所述第一处理层的剪枝对象进行剪枝处理,得到剪枝处理后的第一处理层,包括:若所述第一处理层是N个处理层中的第一个处理层,则将所述第一处理层对应的多个缩放因子按照从小到大的顺序排序;裁剪前第一剪枝数量个缩放因子,得到剪枝处理后的第一处理层。8.根据权利要求7所述的方法...

【专利技术属性】
技术研发人员:刘瑞
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1