当前位置: 首页 > 专利查询>南京大学国网江苏省电力有限公司信息通信分公司国网电力科学研究院有限公司专利>正文

一种基于频域分解神经网络的图像分类加速方法及设备技术

技术编号：35355591 阅读：18 留言：0更新日期：2022-10-26 12:32

本发明专利技术公开了一种基于频域分解神经网络的图像分类加速方法及设备。方法包括：将原始图像转化为RGB图像，并缩放为卷积神经网络的输入特征图所能接纳的图像像素大小相同的图像；将图像输入预先训练好的轻量化神经网络模型，进行图像分类识别，得到图像分类识别结果，其中，所述轻量化神经网络模型为通过对神经网络经过频域分解和轻量化得到。该轻量化神经网络模型将空间域的卷积运算转换为频率域的矩阵乘法运算并进行压缩，可以得到与原始神经网络的输出大致相同的输出，而具有更少的参数量和以FLOPs衡量的计算量。本发明专利技术显著地减少计算成本和存储成本，能够有效加速图像分类任务。务。务。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于频域分解神经网络的图像分类加速方法及设备

[0001]本专利技术涉及图像分类和目标识别，具体涉及一种基于频域分解神经网络的图像分类加速方法及设备。

技术介绍

[0002]图像分类和目标识别等计算机视觉应用程序普遍存在于日常生活之中，而其大量的计算量和资源占用使得推理速度慢、资源开销大，因此需要通过压缩和加速等方法来提升图像分类等应用的性能。神经网络剪枝在过去几年中得到了广泛的研究，大部分的剪枝方法是在空间域进行的。细粒度的剪枝，如非结构化剪枝，通过将权重矩阵中的不重要参数置零，以稀疏化权重矩阵，从而达到减少非零参数的目的。非结构化剪枝的优点是能够大幅度地降低模型的内存占用和参数量，而且还能够利用剪枝后的结果进一步地做权重量化、哈希编码。但是，非结构化剪枝的缺点在于，还需要设计适应特定算法的硬件/函数库，才能获得相应的加速效果。粗粒度的剪枝，如结构化剪枝，能够在已有的硬件和函数库的基础上获得了实际的加速。但与非结构化剪枝相比，在相同的剪枝率下，结构化剪枝的精度损失较大，这使得高剪枝率难以获得良好的效果，且结构化剪枝的可解释性和有效性受到一些学者的质疑。

技术实现思路

[0003]专利技术提出一种新的基于迭代的深度模型频率域压缩和加速方法，旨在提升图像分类和识别等应用的推理速度和降低其资源开销。
[0004]为了达到上述目的，本专利技术采用如下技术方案：
[0005]一种基于频域分解神经网络的图像分类加速方法，包括以下步骤：
[0006]将原始图像转化为具有3个通道的RGB...

【技术保护点】

【技术特征摘要】
1.一种基于频域分解神经网络的图像分类加速方法，其特征在于，包括以下步骤：将原始图像转化为具有3个通道的RGB图像，并将RGB图像缩放为卷积神经网络的输入特征图所能接纳的图像像素大小相同的图像；将图像输入预先训练好的轻量化神经网络模型，进行图像分类识别，得到图像分类识别结果，其中，所述轻量化神经网络模型为通过对神经网络经过频域分解和轻量化得到。2.根据权利要求1所述的基于频域分解神经网络的图像分类加速方法，其特征在于，所述轻量化神经网络模型通过以下方法得到：S1、基于图像数据集对神经网络模型进行预训练，得到完整的神经网络模型；S2、使用离散余弦变换对预训练的神经网络模型进行频率域分解，用一系列频率域的权重矩阵W来表示卷积层，并对频率域中的神经网络模型做稀疏化重训练，获得稀疏化后的权重矩阵W；S3、对于每个权重矩阵W，选择图像数据集的一个样本子集Ω，并应用基于样本的低秩近似算法，在误差容忍度ε下将矩阵W分解为低秩矩阵U和V；S4、对低秩矩阵U和V进行微调后重新组合得到新权重矩阵W
′
＝UV；S5、令W＝W
′
并重复步骤S3
‑
S4，直到满足迭代停止条件。3.根据权利要求2所述的基于频域分解神经网络的图像分类加速方法，其特征在于，所述步骤S1中，使用学习率衰减和随机梯度下降优化方法对神经网络模型进行预训练。4.根据权利要求2所述的基于频域分解神经网络的图像分类加速方法，其特征在于，所述步骤S2包中，使用离散余弦变换对预训练的神经网络模型进行频率域分解，用一系列频率域的权重矩阵来表示卷积层包括：一个卷积层包括c
out
个卷积核，每个卷积核都有大小为d
×
d的c
in
个卷积核，将卷积层表示为4D张量输入为三维张量其中h
in
×
w
in
是输入特征图的尺寸，将卷积层的输出表示为其中h
out
×
w
out
是输出特征图的维度，卷积运算在空间域中表示为其中mat(
·
)是张量的矩阵形式；W，I和O分别是和相应的频率域表示，对于卷积层，应用DCT将每个d
×
d大小的卷积核展平为一个向量，并将该层中的所有向量分组以形成频率权重矩阵同样将DCT应用于输入张量以生成其频率域表示同样将DCT应用于输入张量以生成其频率域表示经过DCT变换后为其中D是一个正交矩阵，经过DCT变换后为5.根据权利要求4所述的基于频域分解神经网络的图像分类加速方法，其特征在于，所述步骤S2中，对频率域中的神经网络模型做稀疏化重训练包括：在正...

【专利技术属性】
技术研发人员：孙林檀，张虎，李文中，曾曜，王凌，樊光明，李志民，杨睿，张烁，
申请(专利权)人：南京大学国网江苏省电力有限公司信息通信分公司国网电力科学研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人