一种基于FPGA的孪生神经网络硬件加速方法和IP核技术

技术编号：36755012 阅读：39 留言：0更新日期：2023-03-04 10:45

本申请的实施例提供了一种基于FPGA的孪生神经网络硬件加速方法和IP核，该方法包括：对训练完成的孪生神经网络的前向传播过程进行IP核封装，并设计输入输出接口、数据存储方式以及顶层函数；优化封装后的IP核：对所有参数的数据类型进行量化处理；按照卷积核大小和卷积核通道数两个维度对卷积过程进行展开，并对所有循环过程采用pipeline流水化方式实现资源的分时复用；以及对模型各层中间计算结果进行分块处理，并将两条网络分支独立并行执行；将优化后的IP核进行RTL封装。本申请通过对网络进行算法封装和并行化、流水化处理，映射到FPGA平台上，利用硬件换取效率的方法对识别过程进行加速，在保证准确率的同时大幅缩短了运行时间。运行时间。运行时间。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于FPGA的孪生神经网络硬件加速方法和IP核

[0001]本申请的实施例涉及神经网络
，尤其涉及一种基于FPGA的孪生神经网络硬件加速方法和IP核。

技术介绍

[0002]神经网络随着网络层数的增加，其参数量也会随之增加，且计算过程大部分为乘加运算。对于传统的CPU架构来说，其工作方式为串行处理过程，很难充分发挥出卷积神经网络并行化计算的优势，随着参数的增加导致结构更为复杂，对于CPU消耗的时间成本较大。GPU虽然具有较高吞吐量和内存带宽，但受限于冯诺依曼结构，无法发挥并行运算的特点。

技术实现思路

[0003]本申请的实施例提供了一种基于FPGA的孪生神经网络硬件加速方法和IP核，通过FPGA硬件层面的加速，在保证了准确率的同时大幅缩短了运行时间。
[0004]在本申请的第一方面，提供了一种基于FPGA的孪生神经网络硬件加速方法，包括：
[0005]对训练完成的孪生神经网络的前向传播过程进行IP核封装，并设计输入输出接口、数据存储方式以及顶层函数；
[0006]优化封装后的IP核：
[0007]将所有参数的数据类型量化为ap_fixed<11,6,AP_RND,AP_SAT>；
[0008]按照卷积核大小和卷积核通道数两个维度对卷积过程进行展开，并对所有循环过程采用pipeline流水化方式实现资源的分时复用；以及
[0009]对模型各层中间计算结果进行分块处理，并将两条网络分支独立并行执行；
[0010

【技术保护点】

【技术特征摘要】
1.一种基于FPGA的孪生神经网络硬件加速方法，其特征在于，包括：对训练完成的孪生神经网络的前向传播过程进行IP核封装，并设计输入输出接口、数据存储方式以及顶层函数；优化封装后的IP核：将所有参数的数据类型量化为ap_fixed<11,6,AP_RND,AP_SAT>；按照卷积核大小和卷积核通道数两个维度对卷积过程进行展开，并对所有循环过程采用pipeline流水化方式实现资源的分时复用；以及对模型各层中间计算结果进行分块处理，并将两条网络分支独立并行执行；将优化后的IP核进行RTL封装。2.根据权利要求1所述的方法，其特征在于，所述训练完成的孪生神经网络模型包括两条网络分支，每条网络分支包括3个卷积层、3个池化层、1个平坦层以及1个全连接层，所述全连接层包括神经元个数分别为128、512、128的三层隐蔽层。3.根据权利要求2所述的方法，其特征在于，所述前向传播过程包括卷积层计算过程、池化层计算过程、平坦层计算过程、全连接层计算过程、两条网络分支之间的欧式距离计算过程以及判断两条网络分支的输出结果是否为同类目标的计算过程。4.根据权利要求3所述的方法，其特征在于，所述欧式距离计算模块用于：采用如下公式计算两条网络分支间的欧式距离：D
W
(X1,X2)＝||G
W
(X1)
‑
G
W
(X2)||其中，(X1，X2)为输入的样本对，D
W
(X1，X2)为样本X1和X2之间的欧式距离，G
W
(X1)为输入为X1的网络分支的输出结果，G
W
(X2)为输入为X2的网络分支的输出结果。5.根据权利要求3所述的方法，其特征在于，所述训练完成的孪生神经网络模型的损失函数如下：其中，L为样本对个...

【专利技术属性】
技术研发人员：赵旭琛，
申请(专利权)人：天津津航计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人