一种深度神经网络的二阶段三角剪枝方法技术

技术编号：38890650 阅读：20 留言：0更新日期：2023-09-22 14:15

本发明专利技术涉及一种深度神经网络的二阶段三角剪枝方法，属于人工智能领域。该方法执行如下步骤：S1对初始矩阵进行一阶段三角剪枝；S2对所述一阶段剪枝后矩阵进行二阶段剪枝；二阶段以斜边向直角端点修剪的方式进行或以斜边向直角端点保留的方式进行；最终完成对初始矩阵的剪枝。本发明专利技术提供一种高效、快速、灵活的神经网络剪枝方法，并可以有效解决计算量大和跟踪非零值时产生巨大索引开销的问题。踪非零值时产生巨大索引开销的问题。踪非零值时产生巨大索引开销的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种深度神经网络的二阶段三角剪枝方法

[0001]本专利技术涉及一种深度神经网络的二阶段三角剪枝方法，属于人工智能领域。

技术介绍

[0002]数据分割压缩方法层出不穷，大体上有网络剪枝、低秩分解、紧凑网络设计等等。后两个方法相比于方法一预算复杂，不宜实现，不适合后期神经网络的训练。所以现今神经网络为了减少设计复杂度大多采用网络剪枝(Pruning)这一方法。
[0003]网络剪枝是一种传统的网络压缩方法。它主要是通过移除神经网络中的部分连接，来降低网络的存储资源和计算资源。近些年来，网络剪枝的方法又重新受到了越来越多的关注。网络剪枝可以分为结构化剪枝与非结构化剪枝，分类的依据在于其是否对可以剪掉的元素位置做约束。
[0004]非结构化剪枝是指不刻意追求剪枝后的网络的结构性，只管剪掉任意位置的参数。这样就导致非结构化剪枝对其形式没有做任何其它的约束，这样便可以达到很高的稀疏度。2015年，Han等人在论文中提出了一个三阶段的深度压缩框架(Deep Compression)：网络剪枝、量化和霍夫曼编码。通过使用这种方法，AlexNet可以在没有精度损失的情况下压缩35倍。网络剪枝之后，还需要对网络进行重训练，以弥补剪枝过程中的精度损失。在其论文中，某个权值一旦被剪掉，在后续的重训练过程中一直保持为零，所以可能导致精度下降。因此，该类方法导致剪枝后的权值矩阵是无规则稀疏的，实际加速效果较低。
[0005]不同于非结构化剪枝，结构化剪枝对去除权值的位置做了一定限制。根据结构化粒度的不同，又可以分为组...

【技术保护点】

【技术特征摘要】
1.一种深度神经网络的二阶段三角剪枝方法，其特征在于执行如下步骤：S1对初始矩阵进行一阶段三角剪枝；S11以方阵结构为目标对初始矩阵进行补零；S12根据zkwd均分补零后的初始矩阵以获得子块；所述子块为方阵结构；S13遍历各子块，对子块对应的四种三角区域的元素求绝对值，然后再对这四个区域求11范数；S14对这四种三角区域的l1范数做比较，保留l1范数最大的三角区域并对其进行掩膜化处理；当每个子块处理完毕后便得到了一阶段剪枝后矩阵；S2对所述一阶段剪枝后矩阵进行二阶段剪枝；S21计算稀疏度的可选值；并从所述可选值中选择基准值；所述可选值的数量与zkwd的值正相关；S22从所述一阶段剪枝后矩阵中的三角区域的斜边开始修剪，并保留修剪结果，之后修剪均在前一次基础上进行；S23修剪后计算当前稀疏度，并与基准值比较；S231若当前稀疏度与所述基准值相同，停止...

【专利技术属性】
技术研发人员：余乐，历泉有，
申请(专利权)人：北京工商大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人