获得卷积结果的装置与板卡制造方法及图纸

技术编号：33992144 阅读：16 留言：0更新日期：2022-07-02 09:58

本发明专利技术涉及获得卷积结果的计算装置、集成电路装置及板卡，其中计算装置包括：正变换单元、对位乘累加运算器、逆变换单元。正变换单元用以正变换所述神经元数据，以产生正变换数据；对位乘累加运算器用以对所述正变换数据与所述Winograd权值进行对位乘累加运算，以产生对位乘数据；逆变换单元用以逆变换所述对位乘数据，以获得所述卷积结果。本发明专利技术具有保证网络精度、性能加速、面积缩减以及功耗降低的技术效果。术效果。术效果。

全部详细技术资料下载

【技术实现步骤摘要】
获得卷积结果的装置与板卡

[0001]本专利技术一般地涉及神经网络领域。更具体地，本专利技术涉及获得卷积结果的计算装置、集成电路装置及板卡。

技术介绍

[0002]随着信息化时代的高速发展，人工智能与机器学习领域的研究炙手可热，相关产业蓬勃发展。卷积神经网络在计算机视觉、自动驾驶、机器翻译、语音识别、智能家居等各方面都有着广泛的作用。
[0003]卷积神经网络的参数量大，运算量大，使得卷积神经网络模型在便携移动终端有限面积和算力下被严重的限制其执行性能，同时非专用性设计的处理器在进行卷积运算时也会造成功耗的巨大开销。
[0004]Winograd卷积是一种基于多项式插值算法的卷积加速实现方式。它通过对卷积操作的两个输入：神经元及权值进行一定规模切分后，分别做线性变换，也就是Winograd正变换，再将变换后的神经元和权值进行对位乘法，把对位乘法结果再次进行线性变换，即Winograd逆变换，最后得到与原卷积操作等价的卷积结果。
[0005]由于在Winograd卷积操作的过程中，神经元和权值的正逆变换矩阵都由简单的固定数值构成，故而可以仅利用加法来实现Winograd神经元和权值的正逆变换过程。而Winograd算法中所需的乘法操作仅出现在对位乘过程中，此过程的乘法复杂度较原始卷积算法有相当程度缩减。由于硬件实现乘法运算的开销(时序、功耗、面积)比实现同位宽的加法要高很多，因此以Winograd卷积替代原始卷积操作能够带来硬件能效比和运算时间上的明显收益。
[0006]然而，目前没有一...

【技术保护点】

【技术特征摘要】
1.一种获得卷积结果的计算装置，连接至片外内存，所述片外内存存储有神经元数据及Winograd权值，所述计算装置包括：正变换单元，用以正变换所述神经元数据，以产生正变换数据；对位乘累加运算器，用以对所述正变换数据与所述Winograd权值进行对位乘累加运算，以产生对位乘数据；以及逆变换单元，用以逆变换所述对位乘数据，以获得所述卷积结果。2.根据权利要求1所述的计算装置，还包括正变换数据缓存，用以暂存所述正变换数据，其中所述对位乘累加运算器自所述正变换数据缓存读取所述正变换数据。3.根据权利要求1所述的计算装置，还包括对位乘数据缓存，用以暂存所述对位乘数据，其中所述逆变换单元自所述对位乘数据缓存读取所述对位乘数据。4.根据权利要求1所述的计算装置，还包括直接存储器访问模块，用以控制所述计算装置与所述片上内存的数据传输。5.根据权利要求4所述的计算装置，其中所述直接存储器访问模块包括神经元直接存储器访问，用以自所述片外内存输入所述神经元数据。6.根据权利要求5所述的计算装置，还包括神经元缓存，用以暂存所述神经元直接存储器访问发送的所述神经元数据，其中所述正变换单元自所述神经元缓存读取所述神经元数据。7.根据权利要求4所述的计算装置，其中所述直接存储器访问模块还包括权值直接存储器访问，用以自所述片外内存输入所述Winograd权值。8.根据权利要求7所述的计算装置，还包括权值缓存，用以暂存所述权值直接存储器访问发送的...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：安徽寒武纪信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人