基于GAP8微处理器的卷积神经网络部署方法技术

技术编号:38020349 阅读:8 留言:0更新日期:2023-06-30 10:47
本发明专利技术公开了基于GAP8微处理器的卷积神经网络部署方法,选取卷积神经网络,对卷积神经网络进行训练,将训练后的卷积神经网络作为浮点图像分类模型;选取表征数据集,利用表征数据集将浮点图像分类模型进行全整数量化;按照GAP8微处理器对张量的执行顺序,对量化后的浮点图像分类模型的张量通道顺序进行调整;对调整后的浮点图像分类模型进行解量化;将解量化后的浮点图像分类模型搭载在GAP8微处理器上,实现图像分类任务。本发明专利技术将PC端卷积神经网络进行优化,部署至GAP8微处理器上,并搭载至无人机平台实时运行,执行图像分类任务,构建一个实时飞行计算平台。建一个实时飞行计算平台。建一个实时飞行计算平台。

【技术实现步骤摘要】
基于GAP8微处理器的卷积神经网络部署方法


[0001]本专利技术涉及神经网络算法的部署技术,特别涉及一种基于GAP8微处理器的卷积神经网络部署方法。

技术介绍

[0002]随着深度学习、并行计算和硬件技术的飞速发展,人工智能被推上了时代热潮,基于卷积神经网络的AI算法广泛应用于图像分类、目标检测、语义分割等任务。研究人员为了追求算法的极致性能,可以在实验室环境使用性能强大的GPU进行训练和推理,在某一任务领域取得SOTA水准。然而对于移动设备、微型嵌入式设备,由于计算能力、存储能力的限制难以部署复杂的神经网络模型,使得AI算法的落地对于嵌入式设备成为难题。对于这一问题,有两种解决方案,一是提高微处理器的计算性能,设计专用的硬件加速器;二是模型优化,通过模型参数压缩或者改进网络结构从而减小模型大小。现阶段,手机等移动平台的神经网络模型部署已经比较成熟,一方面由于开源框架的支持,具有一套完整的解决方案,另一方面手机处理器的能力在迅速提高。但是对于微控制器级别的嵌入式设备,性能低,目前并没有合适的神经网络部署方案。
[0003]传统的微处理器多采用Cortex

M(ARM设计的微控制器架构)MCU,如STM32,能耗随MCU主频提升增加很快,运行神经网络模型资源消耗巨大。RISC

V是一种新兴的开放架构,具有精简指令集、低功耗、模块化、可扩展的特点,适合定制用于边缘计算场景的AI处理器。针对微型嵌入式设备,特别是微型无人机上神经网络的部署,现有处理器处理速度还有待提高。r/>
技术实现思路

[0004]专利技术目的:针对以上问题,本专利技术目的是提供一种基于GAP8微处理器的卷积神经网络部署方法。
[0005]技术方案:本专利技术的一种基于GAP8微处理器的卷积神经网络部署方法,包括:
[0006]选取卷积神经网络,对卷积神经网络进行训练,将训练后的卷积神经网络作为浮点图像分类模型;
[0007]选取表征数据集,利用表征数据集将浮点图像分类模型进行全整数量化;
[0008]按照GAP8微处理器对张量的执行顺序,对量化后的浮点图像分类模型的张量通道顺序进行调整;
[0009]对调整后的浮点图像分类模型进行解量化;
[0010]将解量化后的浮点图像分类模型搭载在GAP8微处理器上,实现图像分类任务。
[0011]进一步,对卷积神经网络进行训练包括:
[0012]选取图像分类数据集,将图像分类数据集的图像进行预处理,将预处理后的图像分类数据集划分成训练集和验证集,将训练集输入至卷积神经网络,并利用ImageNet数据集对卷积神经网络进行迁移学习。
[0013]进一步,选取表征数据集,利用表征数据集将浮点图像分类模型进行全整数量化包括:
[0014]将验证集的图像作为表征数据集输入至浮点图像分类模型,根据浮点图像分类模型的输入范围确定量化方案,若输入范围为[0,1],则选择非对称量化,若输入范围为[

1,1],则选择对称量化。
[0015]进一步,对量化后的浮点图像分类模型的张量通道顺序进行调整后还包括:将浮点图像分类模型进行层融合操作。
[0016]进一步,将解量化后的浮点图像分类模型搭载在GAP8微处理器上包括:
[0017]根据输入图像的像素矩阵和浮点图像分类模型输出的张量矩阵,在GAP8微处理器上分配存储空间,通过调用浮点图像分类模型执行的函数,启动浮点图像分类模型。
[0018]有益效果:本专利技术与现有技术相比,其显著优点是:本专利技术将PC端卷积神经网络进行优化,部署至GAP8微处理器上,并搭载至无人机平台实时运行,执行图像分类任务,构建一个实时飞行计算平台。
附图说明
[0019]图1为本专利技术流程图;
[0020]图2为微型无人机图像分类测试数据示意图;
[0021]图3为图像分类查准率。
具体实施方式
[0022]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。
[0023]如图1为本实施例所述的基于GAP8微处理器的卷积神经网络部署方法流程图,包括:
[0024]选取卷积神经网络,对卷积神经网络进行训练,将训练后的卷积神经网络作为浮点图像分类模型;
[0025]选取表征数据集,利用表征数据集将浮点图像分类模型进行全整数量化;
[0026]按照GAP8微处理器对张量的执行顺序,对量化后的浮点图像分类模型的张量通道顺序进行调整;
[0027]对调整后的浮点图像分类模型进行解量化;
[0028]将解量化后的浮点图像分类模型搭载在GAP8微处理器上,实现图像分类任务。
[0029]本实施例针对微型嵌入式设备,特别是GAP8微处理器上卷积神经网络的部署,将卷积神经网络进行训练作为浮点图像分类模型,在保证模型准确率的前提下,极大的极少了模型的体积,提高了神经网络在嵌入式设备上落地的可能性。
[0030]在一个实施例中,对卷积神经网络进行训练包括:
[0031]选取图像分类数据集,将图像分类数据集的图像进行预处理,将预处理后的图像分类数据集划分成训练集和验证集,将训练集输入至卷积神经网络,并利用ImageNet数据集对卷积神经网络进行迁移学习。
[0032]具体地,上述图像分类数据集包含5种类别,共包含4317张图片,将所有图片进行
预处理,首先进行灰度化处理,将三通道的RGB图变为单通道的灰度图片,然后再将单通道灰度图片缩放到224*224大小以适应大部分的卷积神经网络,最后,为了便于卷积神经网络的训练,将图像中每个像素点的数值除以255,即缩放至[0,1],有利于梯度下降。将预处理之后的图片按照8:2划分为训练集和验证集。
[0033]考虑搭载GAP8微处理器的扩展板AI

Deck的DRAM(动态内部存储器)只有8MB,卷积神经网络不能设计的太大,因此考虑适用于移动端的轻量网络结构MobileNet作为卷积神经网络,在MobileNet网络的输入层增加一层1*1*3的卷积层,将单通道输入升至3维。
[0034]在确定卷积神经网络结构和数据集之后,为加快训练速度,采用迁移学习的方式对卷积神经网络进行训练。选用超大规模图像分类任务数据集ImageNet训练的模型文件,在图像分类数据集上对卷积神经网络进行训练,加快网络收敛速度。训练过程中,缩放因子α=0.25,使用SGD(随机梯度下降)优化器,学习率lr设置为0.1,批大小batch

size为32,训练轮次epoch为50轮参数条件下,训练出的浮点图像分类模型大小约为1MB,分类精度约为0.8。
[0035]在一个实施例中,选取表征数据集,利用表征数据集将浮点图像分类模型进行全整数量化包括:
[0036]将验证集的图像作为表征数据集输入至浮点图像分类模型,根据浮点图像分类模型的输入范围确本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于GAP8微处理器的卷积神经网络部署方法,其特征在于,包括:选取卷积神经网络,对卷积神经网络进行训练,将训练后的卷积神经网络作为浮点图像分类模型;选取表征数据集,利用表征数据集将浮点图像分类模型进行全整数量化;按照GAP8微处理器对张量的执行顺序,对量化后的浮点图像分类模型的张量通道顺序进行调整;对调整后的浮点图像分类模型进行解量化;将解量化后的浮点图像分类模型搭载在GAP8微处理器上,实现图像分类任务。2.根据权利要求1所述的卷积神经网络部署方法,其特征在于,对卷积神经网络进行训练包括:选取图像分类数据集,将图像分类数据集的图像进行预处理,将预处理后的图像分类数据集划分成训练集和验证集,将训练集输入至卷积神经网络,并利用ImageNet数据集对卷积神经网络进行迁移学习。3.根据权利要求2所述的卷积神经网络部...

【专利技术属性】
技术研发人员:陶智单冯吴文甲杨明罗军舟
申请(专利权)人:南京逸智网络空间技术创新研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1