一种卷积神经网络的红外图像目标检测FPGA加速器设计方法技术

技术编号:33642562 阅读:26 留言:0更新日期:2022-06-02 20:18
一种卷积神经网络的红外图像目标检测FPGA加速器设计方法,可以同时进行多个目标的检测算法,具体目标的类别可以视训练数据集而定,红外图像目标检测方法采用两个不同尺度检测层,可以明显提升小目标的检测准确率,同时基于的低比特量化方法可以方便地移植到其他基于卷积神经网络的模型中,无须对模型进行过多的修改,能够快速有效地实现红外图像目标识别,而且对于红外图像中尺度较小的目标,也能保持高准备率。保持高准备率。保持高准备率。

【技术实现步骤摘要】
一种卷积神经网络的红外图像目标检测FPGA加速器设计方法


[0001]本专利技术涉及一种卷积神经网络的红外图像目标检测FPGA加速器设计方法,属于红外图像识别加速领域领域。

技术介绍

[0002]智能化红外目标识别跟踪技术是航天红外精确制导中的核心领域之一,具有巨大的军事应用价值。早在20世纪70年代末,以美国为代表的几大军事强国均已实施了红外自动目标识别技术的研制方案。90年代之后,伴随着数字信号处理器(DSP)集成电路的出现,它的高速处理数据能力和强大的对外接口功能,使其更适用于图像处理领域,实现了硬件上智能化红外目标自动识别技术的迅速发展。
[0003]随着以卷积神经网络为基础的图像识别等人工智能技术以及光电子技术、计算机技术和网络信息技术的快速发展,信息化时代要求红外目标识别设备具备更强的探测能力和更快的识别速度。红外成像探测技术、自动目标快速识别技术等是现阶段各个国家提高制导武器系统智能化水平的重点发展方向,对这些关键技术的研究和攻关无疑在军事和民用两方面都具有重要的意义。在航天智能红外目标识别跟踪领域,深度学习方法相比于传统方法的优越性在于它能够用较少的代价处理相对更加复杂的情况。在训练时深度学习模型能够借由反向传播的方式对网络权重进行更新,使其能够学习提取目标特征的方式。卷积神经网络不需要人工设置特征,深度学习算法能够在训练时通过设计好的模型直接从图像中提取所需要的特征来进行目标识别,这种方式能够提高特征提取的质量进而极大的提高识别的精度。相比于人,机器提取特征更加迅速、更加准确。
[0004]特征提取是进行图像分类和识别的基础。传统红外图像检测算法对图像进行预处理,模型通过提取目标特征信息得到相应的特征图,根据各个特征图计算显著性值,再进行加权求和得到显著性图。常见的特征提取方式有经典的统计学特征提取,基于图像像素灰度变化的特征提取和神经网络方法。基于红外图像的目标提取方法的研究目前常用的目标提取的方式包括传统的数字图像处理算法如SIFT算法、达到筛选目的的背景减除法、基于神经网络的特征提取方法等,其中基于神经网络的目标识别方法在近几年发展更新较为迅速,常用的如RCNN系列的Mask

RCNN方法,Fast

RCNN方法和Faster

RCNN方法、SSD方法、YOLO方法等。
[0005]红外目标识别算法在实际环境中的应用还需要依托于硬件,算法的复杂度与硬件的执行效率同时决定了最终算法的实现速度。FPGA全称“可编辑门阵列”(Field Programmable Gate Array),其基本原理是在FPGA芯片内集成大量数字电路基本门电路以及存储器,而用户可以通过烧写FPGA配置文件来定义这些门电路以及存储器之间的连线,从而实现指定的计算功能。它是作为专用集成电路领域中的一种半定制电路而出现的,既解决了全定制电路的不足,又克服了原有可编程逻辑器件门电路数有限的缺点。FPGA在GPU和ASIC中取得了权衡,很好的兼顾了处理速度和控制能力。一方面,FPGA是可编程重构的硬件,因此相比GPU有更强大的可调控能力;另一方面,与日增长的门资源和内存带宽使得它
有更大的设计空间。诸多优点使得FPGA成为深度学习中不可多得的搭建平台。深度卷积神经网络可能包含数百万个浮点参数,并且需要数十亿个浮点运算来识别单个图像。对于更深层次网络,这些需求往往会增加。例如,ILSVRC 2014的VGG

16每幅图像需要552MB参数和308亿此浮点运算。虽然绝大多数CNN都采用浮点参数,但越来越多的研究表明这种方法包含了显著的冗余。

技术实现思路

[0006]本专利技术解决的技术问题是:针对目前现有技术中,传统红外目标识别算法在实际环境中的应用还需要依托于硬件,算法的复杂度与硬件的执行效率并不能适应当前设计任务需求的问题,提出了一种卷积神经网络的红外图像目标检测FPGA加速器设计方法。
[0007]本专利技术解决上述技术问题是通过如下技术方案予以实现的:
[0008]一种卷积神经网络的红外图像目标检测FPGA加速器设计方法,步骤如下:
[0009](1)采集红外图像数据集,对数据集中的红外目标进行人工标注,并分类为训练集、测试集;
[0010](2)设定卷积神经网络模型,设定模型超参数,包括学习率、批大小、迭代次数;
[0011](3)读取训练图像数据集,通过卷积神经网络模型进行训练,降低实际网络输出与指定目标输出间的误差值,并进行训练迭代,迭代至步骤(2)设定的指定迭代次数后,停止训练,获取最终卷积神经网络模型;
[0012](4)读取测试图像,将测试图像输入至最终卷积神经网络模型中,获取测试图像输出并与实际结果比对,获取检测准确率;
[0013](5)对训练完成后的模型权重及卷积神经网络前向推理中生成的特征值进行低比特量化,并重复步骤(3),完成步骤(3)操作后进入步骤(6);
[0014](6)对低比特量化训练后的卷积神经网络信息进行提取,通过HLS语言进行FPGA加速器设计;
[0015](7)进行加速器板上红外检测算法的加速测试。
[0016]所述步骤(2)中,卷积神经网络模型包括13个卷积层、6个最大池化层、1个上采样层、2个route层、2个检测层网络。
[0017]所述步骤(5)中,低比特量化具体为:
[0018]将卷积神经网络的权重限制为一比特或两比特,引入可学习量化区间控制量化范围,并设定精度下降范围,于该范围内,将卷积神经网络的卷积层中权重全部量化为两比特。
[0019]所述步骤(6)中,FPGA加速器使用HLS高级综合语言,采用双缓冲加速器设计、滑窗式的卷积算子加速,整体性能大于50GOPS以实现配置灵活及软件重构。
[0020]所述步骤(1)中,红外图像数据集采集后进行预处理,包括尺度缩放、角度随机调节。
[0021]所述步骤(3)中,红外图像数据集的两个检测层网络对红外图像数据集中不同尺度的目标进行检测以提升对红外小目标的检测能力。
[0022]本专利技术与现有技术相比的优点在于:
[0023](1)本专利技术提供的一种卷积神经网络的红外图像目标检测FPGA加速器设计方法,
可以同时进行多个目标的检测算法,具体目标的类别可以视训练数据集而定,红外图像目标检测方法采用两个不同尺度检测层,可以明显提升小目标的检测准确率,同时基于的低比特量化方法可以方便地移植到其他基于卷积神经网络的模型中,无须对模型进行过多的修改;
[0024](2)本专利技术采用设计的FPGA卷积神经网络加速器采用模板生成法,适当修改配置文件即可适用于不同的卷积神经网络模型,快速高效完成模型迁移及加速器设计,能够快速有效地实现红外图像目标识别,而且对于红外图像中尺度较小的目标,也能保持高准备率。
附图说明
[0025]图1为专利技术提供的红外图像多目标检测框架示意图;
[0026]图2为专利技术提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种卷积神经网络的红外图像目标检测FPGA加速器设计方法,其特征在于步骤如下:(1)采集红外图像数据集,对数据集中的红外目标进行人工标注,并分类为训练集、测试集;(2)设定卷积神经网络模型,设定模型超参数,包括学习率、批大小、迭代次数;(3)读取训练图像数据集,通过卷积神经网络模型进行训练,降低实际网络输出与指定目标输出间的误差值,并进行训练迭代,迭代至步骤(2)设定的指定迭代次数后,停止训练,获取最终卷积神经网络模型;(4)读取测试图像,将测试图像输入至最终卷积神经网络模型中,获取测试图像输出并与实际结果比对,获取检测准确率;(5)对训练完成后的模型权重及卷积神经网络前向推理中生成的特征值进行低比特量化,并重复步骤(3),完成步骤(3)操作后进入步骤(6);(6)对低比特量化训练后的卷积神经网络信息进行提取,通过HLS语言进行FPGA加速器设计;(7)进行加速器板上红外检测算法的加速测试。2.根据权利要求1所述的一种卷积神经网络的红外图像目标检测FPGA加速器设计方法,其特征在于:所述步骤(2)中,卷积神经网络模型包括13个卷积层、6个最大池化层、1...

【专利技术属性】
技术研发人员:钮赛赛杨俊彦陈海宝陈杰林前进
申请(专利权)人:上海航天控制技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1