一种基于Winograd的深度学习处理系统技术方案

技术编号：36795242 阅读：27 留言：0更新日期：2023-03-08 23:01

本公开属于人工智能处理器技术领域，具体而言涉及一种基于Winograd的深度学习处理系统，包括：输入通道，与外部设备通信；输入特征加载器，与所述输入通道相连；路由模块，与所述输入层加载器相连；卷积加速器核心模块，与路由模块相连，所述卷积核加速器核心模块包括至少两个并行设置的卷积核加速器子核心模块；通道累加器，与卷积加速器核心模块相连，用于累加并行的卷积核加速器子核心模块的输出数据；特征卸载器，与通道累加器相连，将所述通道累加器的输出数据传输至处理系统外。通过多尺寸Wino

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Winograd的深度学习处理系统

[0001]本公开属于人工智能处理器
，具体而言涉及一种基于Winograd的深度学习处理系统。

技术介绍

[0002]随着以卷积神经网络(Convolutional Neural Network，CNN)为代表的深度学习技术在图像分类、目标检测等领域的性能不断提高。基于FPGA设计一种高效的深度学习处理器，一直都是业界的研究热点。但是FPGA上DSP资源往往有限，限制了处理器的性能。而Winograd算法则是解决上述问题最有效的途径之一。它可大幅降低卷积计算的复杂度，具体地，可通过增加少量加法数而大幅降低乘法数。但是，基于Winograd算法设计的深度学习处理器只能高效处理固定尺寸卷积核的卷积，对于其他尺寸的卷积效率低下。导致Winograd算法降低计算复杂度的特性往往在深度学习处理器中难以充分发挥作用。此外，通过卷积层嵌套循环展开与局部并行化设计的1
×
1加速器具有很高的灵活性，但是没有等效加速比，算力有限。

技术实现思路

[0003]本公开正是基于现有技术的上述需求而提出的，本公开要解决的技术问题是提供一种基于Winograd的深度学习处理系统提高灵活性和高效性。
[0004]为了解决上述问题，本公开提供的技术方案包括：
[0005]提供了一种基于Winograd的深度学习处理系统，包括：输入通道，与外部设备通信；输入层加载器，与所述输入通道相连；路由模块，与所述输入层加载器相连；卷积加速器核心模块，与路由模块相...

【技术保护点】

【技术特征摘要】
1.一种基于Winograd的深度学习处理系统，其特征在于，包括：输入通道，与外部设备通信；输入特征加载器，与所述输入通道相连；路由模块，与所述输入层加载器相连；卷积加速器核心模块，与路由模块相连，所述卷积核加速器核心模块包括至少两个并行设置的卷积核加速器子核心模块；通道累加器，与卷积加速器核心模块相连，用于累加并行的卷积核加速器子核心模块的输出数据；和特征卸载器，与通道累加器相连，将所述通道累加器的输出数据传输至处理系统外。2.根据权利要求1所述的一种基于Winograd的深度学习处理系统，其特征在于，所述输入层加载器包括特征加载器、数据加载器和权重加载器，所述输入层加载器与外部设备通过AXI数据总线相连，以获取数据或指令。3.根据权利要求2所述的一种基于Winograd的深度学习处理系统，其特征在于，所述特征加载器、数据加载器和权重加载器均与所述路由模块通过FIFO
‑
A数据线相连。4.根据权利要求1所述的一种基于Winograd的深度学习处理系统，其特征在于，所述卷积核加速器核心模块所包括的多个卷积核加速器子核心模块具有不同的卷积核尺寸和输出尺寸。5.根据权利要求1所述的一种基于Winograd的深度学习处理系统，其特征在于，所述通道累加器的通道数与所述卷积核...

【专利技术属性】
技术研发人员：王晓峰，周辉，赵雄波，盖一帆，蒋彭龙，路坤锋，李晓敏，李超然，谢宇嘉，林平，董文杰，吴松龄，弥寒光，黄鹂，吴敏，赵冠杰，李杨珺，王森，李杰，徐天运，靳蕊溪，林玉野，
申请(专利权)人：北京航天自动控制研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人