面向深度学习的粗粒度可重构阵列仿真器系统和计算方法技术方案

技术编号：37705632 阅读：6 留言：0更新日期：2023-06-01 23:54

本公开提供了一种面向深度学习的粗粒度可重构阵列仿真器系统和计算方法，可以应用于深度学习技术领域以及可重构阵列技术领域。该面向深度学习的粗粒度可重构阵列仿真器系统包括：存储模块，用于存储初始图数据；数据调度模块，用于存储包括多个指令的指令集，以及使存储模块根据指令集将初始图数据传输至可重构阵列中；可重构阵列，用于接收初始图数据，以及根据深度学习模型的网络层的计算类型，调用图形处理器对初始图数据进行并行计算得到输出结果。出结果。出结果。

全部详细技术资料下载

【技术实现步骤摘要】
面向深度学习的粗粒度可重构阵列仿真器系统和计算方法

[0001]本公开涉及深度学习
以及可重构阵列
，更具体地，涉及一种面向深度学习的粗粒度可重构阵列仿真器系统和计算方法。

技术介绍

[0002]粗粒度可重构阵列具有较好的灵活性和计算能效。在大规模片上系统((System on Chip，SOC)设计的前期，利用粗粒度可重构阵列仿真器进行设计能够降低芯片开发成本，并且可以减少芯片开发周期，后期可以与寄存器转换级(Register Transfer Level，RTL)模型进行联合仿真，验证仿真结果正确性。
[0003]在实现本公开构思的过程中，专利技术人发现相关技术中至少存在如下问题：相关技术中，在面对大规模数据处理的情况下，需要耗费大量时间，导致数据处理的效率较低。

技术实现思路

[0004]有鉴于此，本公开提供了一种面向深度学习的粗粒度可重构阵列仿真器系统和计算方法。
[0005]本公开的一个方面提供了一种面向深度学习的粗粒度可重构阵列仿真器系统，包括：
[0006]存储模块，用于存储初始图数据；
[0007]数据调度模块，用于存储包括多个指令的指令集，以及使存储模块根据指令集将初始图数据传输至可重构阵列中；
[0008]可重构阵列，用于接收初始图数据，以及根据深度学习模型的网络层的计算类型，调用图形处理器对初始图数据进行并行计算得到输出结果。
[0009]根据本公开的实施例，其中，可重构阵列包括：
[0010]第一处理单元，用于...

【技术保护点】

【技术特征摘要】
1.一种面向深度学习的粗粒度可重构阵列仿真器系统，包括：存储模块，用于存储初始图数据；数据调度模块，用于存储包括多个指令的指令集，以及使所述存储模块根据所述指令集将所述初始图数据传输至可重构阵列中；可重构阵列，用于接收所述初始图数据，以及根据深度学习模型的网络层的计算类型，调用图形处理器对所述初始图数据进行并行计算得到输出结果。2.根据权利要求1所述的系统，其中，所述可重构阵列包括：第一处理单元，用于在所述深度学习模型的所述网络层的计算类型为线性计算类型的情况下，接收所述初始图数据以及调用所述图形处理器对所述初始图数据进行并行计算得到第一子输出结果；第二处理单元，用于在所述深度学习模型的所述网络层的计算类型为非线性类型的的情况下，接收所述初始图数据以及对所述初始图数据进行计算得到第二子输出结果，以及基于所述第一子输出结果和所述第二子输出结果，得到所述输出结果。3.根据权利要求2所述的系统，其中，所述第一处理单元包括：第一子处理单元，用于在所述深度学习模型的网络层的计算类型为线性计算类型的情况下，接收所述初始图数据，将所述初始图数据传输至中央处理器；第二子处理单元，用于利用所述中央处理器将所述初始图数据传输至所述图形处理器，以及利用所述图形处理器根据所述初始图数据调用指定数量的线程对所述初始图数据进行并行计算得到第一子输出结果。4.根据权利要求1所述的系统，其中，所述存储模块包括：第一存储单元，用于存储特征图数据；第二存储单元，用于根据所述可重构阵列的容量，对所述特征图数据从多个维度进行切分，得到所述初始图数据。...

【专利技术属性】
技术研发人员：白雪飞，赵高飞，陈松，康一，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人