一种面向深度神经网络的芯片布图规划方法技术

技术编号：26971259 阅读：23 留言：0更新日期：2021-01-06 00:01

本发明专利技术公开了一种面向深度神经网络的芯片布图规划方法，首先，估计神经网络每个核的面积；其次，根据实际数据和核库，计算参数h’、w’、c’和k’；并对其进行优化，得到神经网络中每一层核对应的符合预设条件的较好的矩形模块形状；然后，采用核贪婪排序算法和核适配增长算法，对矩形模块进行布局，迭代地增加核对应的矩形模块，使得下一个将被布局的模块被放置到使布图规划目标函数最优的地方，直到所有核被分配完，从而获得最终布局方案。本发明专利技术能在有限的资源下，有效提高现有深度神经网络算力。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向深度神经网络的芯片布图规划方法
本专利技术属于人工智能领域，具体涉及一种面向深度神经网络的芯片布图规划方法。
技术介绍
深度神经网络的实现依赖于大量的计算资源和存储资源，这对神经网络实现带来了诸多挑战。CPU有限的计算单元和串行的执行方式不能提供足够的计算能力，GPU具有并行处理的优点，虽可保证算力，但其功耗大，只能应用于服务器端。随着人工智能逐渐向深度学习领域发展，神经网络的深度不断加深，数据量也呈现几何级增长速度，海量的数据对芯片的计算能力也随之提出了更高的要求，通过改进硬件性能和芯片架构研发人工智能专用芯片成为行业重要的努力方向。晶圆级引擎CerebrasWSE是目前史上最大的人工智能芯片，与其他芯片相比，它包含了更多的个核心(约400000个，排列成633×633的正方形)，提供18Gigabytes的片上内存，内存带宽高达9Petabytes/s。它可以在较低的延迟和较少的功耗下实现快速、灵活的计算。WSE的计算资源和存储资源有限，在有限的资源下，实现高性能、低功耗的神经网络加速是当下需解决的技术问题。Cerebras软件平台专门为加速人工智能计算而设计，它主要包括机器学习框架、Cerebras图编译器(CGC)、高性能内核库和内核API以及支持调试和分析的开发工具。对于一个指定的深度神经网络，CGC利用XLA将TensorFlow图编译成一系列专门为给定神经网络模型生成的计算内核，并将其转化为中间表示形式。CGC将中间表示与Cerebras核库中的核进行适配，适配结果是一个描述神经...

【技术保护点】
1.一种面向深度神经网络的芯片布图规划方法，其特征在于，包括以下步骤：/n(1)估计神经网络对应的核图中所有核的面积；/n(2)根据实际数据和核库，计算在输入图像高度、宽度、特征数和输出四个维度上的资源分配数量h’、w’、c’和k’；/n(3)针对神经网络中的核全是conv的情况和神经网络中的核部分是dblock部分是cblock的情况，对参数c’，k’进行优化，得到神经网络中每一层核对应的符合预设条件的较好的矩形模块形状；/n(4)采用核贪婪排序算法确定摆放核图中所有核的摆放顺序；/n(5)基于步骤(4)中的线性顺序，对步骤(3)获得的矩形模块进行布局：采用核适配增长算法，迭代地增加核对应的矩形模块，使得下一个将被布局的模块被放置到使布图规划目标函数最优的地方，直到所有核被分配完。/n

【技术特征摘要】
1.一种面向深度神经网络的芯片布图规划方法，其特征在于，包括以下步骤：
(1)估计神经网络对应的核图中所有核的面积；
(2)根据实际数据和核库，计算在输入图像高度、宽度、特征数和输出四个维度上的资源分配数量h’、w’、c’和k’；
(3)针对神经网络中的核全是conv的情况和神经网络中的核部分是dblock部分是cblock的情况，对参数c’，k’进行优化，得到神经网络中每一层核对应的符合预设条件的较好的矩形模块形状；
(4)采用核贪婪排序算法确定摆放核图中所有核的摆放顺序；
(5)基于步骤(4)中的线性顺序，对步骤(3)获得的矩形模块进行布局：采用核适配增长算法，迭代地增加核对应的矩形模块，使得下一个将被布局的模块被放置到使布图规划目标函数最优的地方，直到所有核被分配完。

2.根据权利要求1所述的面向深度神经网络的芯片布图规划方法，其特征在于，所述步骤(1)的实现过程如下：
由核库中核conv的性能函数：
Areaconv＝height*width＝3*h′w′k′(c′+1)≈3*h′w′k′c′

得：

每个核理想执行时间为myT，则：

对于核dblock：

对于核cblock：

其中，H，W，R，S，C，K，T分别代表输入图像的高和宽、感受野大小、输入和输出数据和步幅大小。

3.根据权利要求1所述的面向深度神经网络的芯片布图规划方法，其特征在于，所述步骤(2)的实现过程如下：
计算time的式中有上取整函数ceil，因此有而H，W均为整数；为控制time，考虑让和为整数，先确定参数h’和w’，并取h’和w’的值为H，W的质因数；再由h’和w’去确定c’和k’的值；根据memory确定参数c’和k’，由：

R＝S∈{1，2，3}，粗略地，令

可以确定参数：

又因为memory＜memlimit，得：

取：

4.根据权利要求1所述的面向深度神经网络的芯片布图规划方法，其特征在于，所述步骤(3)的实现过程如下：
(31)神经网络中的核全是conv的情况：指定神经网络中的核全是conv时，其中间层的层数主要有52层和100层两种结构；若中间层层数是52层时，令若中间层层数是100层，令利...

【专利技术属性】
技术研发人员：张晓岩，郭龙坤，孙龙，常希文，徐楚楚，戴国伟，王文骐，
申请(专利权)人：南京师范大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人