能量高效的存储器系统和方法技术方案

技术编号：23763366 阅读：19 留言：0更新日期：2020-04-11 18:34

本文描述了增加诸如存储空间和计算时间之类的计算资源的利用率和性能，从而降低计算成本的系统和方法。本发明专利技术的各种实施例提供了一种硬件结构，该硬件结构既允许消除冗余的数据传输的对源数据的流送，又允许进行消除对去往和来自中间存储装置的数据传输的要求的存储器中的计算。在某些实施例中，通过使用硬件结构来降低计算成本，该硬件结构使得能够自动地且高效地执行数学运算，例如，由卷积神经网络采用的逐元素矩阵乘法。

Energy efficient memory system and method

全部详细技术资料下载

【技术实现步骤摘要】
能量高效的存储器系统和方法相关专利申请的交叉引用本申请根据35U.S.C.§119(e)要求享有以下申请的优先权权益：于2018年10月3日提交的题为“Energy-EfficientTornadoMemorySystemsandMethods”、专利技术人为MarkAlanLovell和RobertMichaelMuchsel的共同未决且共同转让的美国临时专利申请第62/740,679号，该申请以其整体内容通过引用方式合并于此。该专利文档中提及的每个参考文献均以其整体通过引用方式合并与此。
本公开总体上涉及数据处理。更具体地，本公开涉及用于在执行算术运算(例如，卷积运算和池化运算)时改进计算和存储器资源的利用率的系统和方法。
技术介绍
机器学习的最令人兴奋的应用中的一些使用卷积神经网络(CNN)。CNN将多个分层网络层和子层应用于例如输入图像，以确定是否将图像分类为包含人或某种其他物体。CNN使用基于神经网络的图像分类器，该图像分类器可以自动学习复杂特征以用于分类和物体识别任务。针对卷积的算术运算典型地在通用计算设备(例如，常规的微处理器)上操作的软件中执行。这种方法在功率和时间两者方面都非常昂贵，并且对于许多计算密集型应用(例如，实时应用)，通用硬件无法以及时的方式执行必要的操作，因为计算速率受到现有硬件设计的计算资源和能力的限制。此外，使用通用处理器的算术功能来生成中间结果由于增加的从各种存储器位置存储并取回中间结果以完成操作的步骤而以牺牲计算时间为代价。例如，许多常规的乘法器都是标量机...

【技术保护点】
1.一种用于执行算术计算的高吞吐量计算系统，所述计算系统包括：/n源存储器，其存储用于算术运算的源数据；/n计算高速缓存，其用于缓存所述源数据中的一些源数据；/n计算存储器，其与所述计算高速缓存耦合，所述计算存储器在所述算术运算的一个或多个周期中被使用，所述计算高速缓存和所述计算存储器形成计算结构；/n权重存储器，其与所述计算存储器耦合，所述权重存储器存储用于所述算术运算的权重数据；以及/n控制器，其与所述计算结构耦合，所述控制器执行包括以下各项的步骤：/n响应于位于所述计算结构的第一端处的第一行中的数据已经在所述计算结构的第二端的方向上经历了完整的旋转周期，而丢弃位于所述计算结构的第三端处的第二行中的数据；/n将所述计算结构中的数据元素朝向所述第三端移位；/n在所述第一端处，将来自第三行的数据加载到所述计算结构中以替换所述第一行中的数据；/n将所述计算结构中的所述数据元素朝向所述第二端移位，使得在第四端处新的数据元素被加载到所述计算结构中；以及/n使用所述计算结构中的两个或更多个数据元素来执行所述算术运算。/n

【技术特征摘要】
20181003 US 62/740,6791.一种用于执行算术计算的高吞吐量计算系统，所述计算系统包括：
源存储器，其存储用于算术运算的源数据；
计算高速缓存，其用于缓存所述源数据中的一些源数据；
计算存储器，其与所述计算高速缓存耦合，所述计算存储器在所述算术运算的一个或多个周期中被使用，所述计算高速缓存和所述计算存储器形成计算结构；
权重存储器，其与所述计算存储器耦合，所述权重存储器存储用于所述算术运算的权重数据；以及
控制器，其与所述计算结构耦合，所述控制器执行包括以下各项的步骤：
响应于位于所述计算结构的第一端处的第一行中的数据已经在所述计算结构的第二端的方向上经历了完整的旋转周期，而丢弃位于所述计算结构的第三端处的第二行中的数据；
将所述计算结构中的数据元素朝向所述第三端移位；
在所述第一端处，将来自第三行的数据加载到所述计算结构中以替换所述第一行中的数据；
将所述计算结构中的所述数据元素朝向所述第二端移位，使得在第四端处新的数据元素被加载到所述计算结构中；以及
使用所述计算结构中的两个或更多个数据元素来执行所述算术运算。

2.根据权利要求1所述的计算系统，其中，所述计算高速缓存被实现为RAM单元结构，所述RAM单元结构在不要求多个访问步骤的情况下实现数据访问。

3.根据权利要求1所述的计算系统，其中，所述计算存储器包括基于寄存器的硬件结构，并且所述控制器包括状态机。

4.根据权利要求1所述的计算系统，其中，所述计算高速缓存大于所述计算存储器。

5.根据权利要求1所述的计算系统，其中，所述源存储器具有等于或小于所述计算结构的宽度。

6.根据权利要求1所述的计算系统，其中，移位所述数据元素包括移位数量N个元素，以实现卷积运算中的跨步。

7.一种用于使用高吞吐量计算结构来执行计算的方法，所述方法包括：
响应于位于计算结构的第一端处的第一行中的数据已经在所述计算结构的第二端的方向上经历了完整的旋转周期，而丢弃位于所述计算结构的第三端处的第二行中的数据；
将所述计算结构中的数据元素朝向所述第三端移位；
在所述第一端处，将来自第三行的数据加载到所述计算结构中以替换所述第一行中的数据；
将所述计算结构中的所述数...

【专利技术属性】
技术研发人员：M·A·洛弗尔，R·M·马奇塞尔，
申请(专利权)人：马克西姆综合产品公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人