一种面向遥感应用的卷积神经网络剪枝和量化同步压缩方法技术

技术编号：30076958 阅读：13 留言：0更新日期：2021-09-18 08:32

本发明专利技术提供了一种面向遥感应用的卷积神经网络剪枝和量化同步压缩方法，与其他的卷积神经网络剪枝和量化压缩方法相比，本方法融合了模型剪枝和量化过程，实现了卷积神经网络模型的同步剪枝和量化，在提高模型参数压缩比例的同时，减少了模型压缩后的精度损失；对剪枝和量化后的模型进行再训练，可以得到更为精确的参数数值，提高网络精度；设定编码时需要遵守的规则度约束条件，即在实际的遥感平台处理器中对卷积神经网络模型进行实现时，对同一层中的不同滤波器处于相同位置的卷积核同时剪枝可以提高计算单元的通用程度，并提高计算的并行度；本发明专利技术压缩后的模型可以在机载、星载等资源有限的平台处理器上进行移植和应用。等资源有限的平台处理器上进行移植和应用。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向遥感应用的卷积神经网络剪枝和量化同步压缩方法

[0001]本专利技术涉及人工智能
，尤其涉及一种面向遥感应用的卷积神经网络压缩方法。

技术介绍

[0002]随着各种卷积神经网络模型在遥感数据处理领域的广泛应用，将卷积神经网络模型移植到机载、星载、车载等移动平台上的需求也越来越强烈。在这些资源约束严格的平台上应用时，由于可选的专用器件资源有限，且需通过多模冗余等方式保障可靠性等原因，能够用于实现卷积神经网络模型的资源十分有限。高性能的卷积神经网络往往具有海量的参数数量和浮点计算次数，难以在这些资源有限的平台上进行应用，需要进行剪枝、量化等一系列的参数压缩工作。然而当前的卷积神经网络剪枝和量化压缩方法还存在压缩后模型精度损失大的问题。剪枝和量化过程均会影响模型精度，两步压缩后精度损失会叠加。先剪枝再量化会导致模型精度损失大。

技术实现思路

[0003]有鉴于此，本专利技术的目的是提供一种面向遥感应用的卷积神经网络压缩方法，提高了模型参数压缩比例的同时，保证了压缩后模型的精度。
[0004]一种面向遥感应用的卷积神经网络剪枝和量化同步压缩方法，包括如下步骤：
[0005]S1、采用包含遥感图像的数据对卷积神经网络进行参数训练，得到模型M2；
[0006]S2、对所述模型M2进行剪枝和量化参数的编码，具体如下：
[0007]对卷积神经网络中的各层的参数，定义其编码为：
[0008]O
k
＝(p1,p2,...,p
n
,q...

【技术保护点】

【技术特征摘要】
1.一种面向遥感应用的卷积神经网络剪枝和量化同步压缩方法，其特征在于，包括如下步骤：S1、采用包含遥感图像的数据对卷积神经网络进行参数训练，得到模型M2；S2、对所述模型M2进行剪枝和量化参数的编码，具体如下：对卷积神经网络中的各层的参数，定义其编码为：O
k
＝(p1,p2,...,p
n
,q1,q2,...,q
n
)其中，n表示网络中各层的参数数量；p1,p2,...,p
n
表示对各参数是否剪枝，取值为0或1，0表示是对该参数进行剪枝，1表示保留该参数，不进行剪枝；q1,q2,...,q
n
表示对各参数的量化位数；S3、按照步骤S2的编码，生成设定数量的初始的种群，每个种群中包含若干个体；S4、根据步骤S3的种群中每个个体的编码对模型M2中的参数剪枝和量化进行设置，由此得到与个体数量对应的模型，采用遥感图像数据对模型的参数数值进行训练，得到参数训练后的模型；S5、对参数训练后得到的模型进行精度评估，将每个种群中精度最差的部分个体进行剔除，并对剩余个体的编码进行随机改变，对个体间的编码进行交叉和/或迁移，生成新的个体和种群；S6、重复执行步骤S5，直到满足设定条件，停止对模型参数的训练；其中，在训练的过程中，当前训练使用的模型参数数值为上一次训练的参数数值；S7、对S6得到的模型进行精度评估，保留精度最高的部分个体，则完成卷积神经网络的剪枝和量化。2.如权利要求1所述的一种面向遥感应用的卷积神经网络剪枝和量化同步压缩方法，其特征在于，对S7精度最高的部分个体进行重新训练，具体为：首先，按照S7剪枝结果构建浮点参数的卷积神经网络模型，采用训练数据对该网络模型参数进行训练；然后，在该剪枝后模型参数的基础上，依次对模型的每一层的量化参数进行训练，具体为：根据S7对参数量化结果，对网络模型的第一层的参数进行量化，网络模型其他各层为浮点参数，在剪枝后模型参数的基础上，对整个卷积神经网络进行训练，完成后，固定第一层的量化后参数，根据S7的结果对第二层的参数进行量化，第三层及以后各层保持为浮点参数，再对网络进行训练，依次类推，直到网络最后一层，完成模型参数的最终训练...

【专利技术属性】
技术研发人员：陈禾，齐保贵，陈亮，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人