模型压缩方法、装置、电子设备和存储介质制造方法及图纸

技术编号：37582093 阅读：11 留言：0更新日期：2023-05-15 07:56

本申请涉及一种模型压缩方法、装置、电子设备和存储介质。所述方法包括：对源模型进行优化处理，得到优化后的源模型；优化处理包括扩充源模型的至少一层卷积层的输出通道数；对优化后的源模型进行模型压缩，得到经压缩的模型。本申请从优化源模型的角度出发，通过通道扩充提升源模型的表现，进而在提高待压缩源模型的性能的同时，弥补压缩过程中的精度损失。弥补压缩过程中的精度损失。弥补压缩过程中的精度损失。

全部详细技术资料下载

【技术实现步骤摘要】
模型压缩方法、装置、电子设备和存储介质

[0001]本申请涉及人工智能
，特别是涉及一种模型压缩方法、装置、电子设备和存储介质。

技术介绍

[0002]随着人工智能技术的不断发展，越来越多的领域开始应用基于深度学习的网络模型，例如，将基于计算机视觉的网络模型应用于图像识别和图像处理，将基于自然语言处理的网络模型应用于语义识别和自动问答等。
[0003]目前需要对网络模型进行压缩，以提高其在部署在电子设备后的推理运行速度。然而，传统的模型压缩方法存在精度损失大的问题。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够减小精度损失的模型压缩方法、装置、电子设备和存储介质。
[0005]第一方面，本申请提供了一种模型压缩方法，方法包括：
[0006]对源模型进行优化处理，得到优化后的源模型；优化处理包括扩充源模型的至少一层卷积层的输出通道数；
[0007]对优化后的源模型进行模型压缩，得到经压缩的模型。
[0008]在其中一个实施例中，对源模型进行优化处理，得到优化后的源模型的步骤，包括：
[0009]基于源模型的模型算力和模型性能，确定出最优扩充数值；
[0010]根据最优扩充数值调整至少一层卷积层的输出通道数，得到优化后的源模型。
[0011]在其中一个实施例中，基于源模型的模型算力和模型性能，确定出最优扩充数值的步骤，包括：
[0012]若至少一层卷积层的数量为一层，则按照各候选扩充数值分别调整源模型的...

【技术保护点】

【技术特征摘要】
1.一种模型压缩方法，其特征在于，所述方法包括：对源模型进行优化处理，得到优化后的源模型；所述优化处理包括扩充所述源模型的至少一层卷积层的输出通道数；对所述优化后的源模型进行模型压缩，得到经压缩的模型。2.根据权利要求1所述的方法，其特征在于，所述对源模型进行优化处理，得到优化后的源模型的步骤，包括：基于所述源模型的模型算力和模型性能，确定出最优扩充数值；根据所述最优扩充数值调整所述至少一层卷积层的输出通道数，得到所述优化后的源模型。3.根据权利要求2所述的方法，其特征在于，所述基于所述源模型的模型算力和模型性能，确定出最优扩充数值的步骤，包括：若所述至少一层卷积层的数量为一层，则按照各候选扩充数值分别调整所述源模型的所述至少一层卷积层的输出通道数，得到各通道扩充后的源模型；在所述通道扩充后的源模型的所述模型算力满足任务算力要求的情况下，利用测试集分别获取各所述通道扩充后的源模型的所述模型性能；其中，所述模型性能包括所述通道扩充后的源模型的分类准确率；比较各所述通道扩充后的源模型的所述模型性能，得到所述模型性能最优的所述通道扩充后的源模型；将所述模型性能最优的所述通道扩充后的源模型所对应的所述候选扩充数值，确认为所述最优扩充数值。4.根据权利要求2所述的方法，其特征在于，所述基于所述源模型的模型算力和模型性能，确定出最优扩充数值的步骤，包括：若所述至少一层卷积层的数量为至少两层，则获取各通道扩充后的源模型；所述通道扩充后的源模型为分别按照各候选扩充数值调整所述源模型的所述卷积层的输出通道数得到；在所述通道扩充后的源模型的所述模型算力满足任务算力要求的情况下，通过搜索策略获取所述模型性能最优的所述通道扩充后的源模型；其中，所述搜索策略为基于所述至少一层卷积层的数量以及所述候选扩充数值的数量所确定；将所述模型性能最优的所述通道扩充后的源模型所对应的各所述候选扩充数值，确认为所述最优扩充数值。5.根据权利要求4所述的方法，其特征在于，所述方法还包括：对所述模型性能最优的所述通道扩充后的源模型进行训练调优；响应于所述模型性能最优的所述通道扩充后的源模型的模型性能收敛，确定完成所述模型性能最优的所述通道扩充后的源模型的所述训练调优；将完成所述训练调优的所述模型性能最优的所述通道扩充后的源模型，作为所述优化后的源模型。6.根据权利要求4所述的方法，其特征在于，所述方法还包括：若所述至少一层卷积层的数量小于或等于数量阈值、且所述候选扩充数值的数量小于或等于预设数量，则确认所述搜索策略为枚举算法。
7.根据权利要求4所述的方法，其特征在于，所述方法还包括：若所述至少一层卷积层的数量大于数量阈值、且所述候选扩充数值的数量大于预设数量，则确认所述搜索策略为基于进化算法的网络架构搜索。8.根据权利要求7所述的方法，其特征在于...

【专利技术属性】
技术研发人员：董旭炯，
申请(专利权)人：哲库科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人