一种GPU缓存子系统互联的数字电路设计方法技术方案

技术编号：30155586 阅读：15 留言：0更新日期：2021-09-25 15:06

本发明专利技术公开了一种GPU缓存子系统互联的数字电路设计方法，包括划分GPU的设备内存地址；设置区域内独立的交叉通路，该交叉通路连接该区域的包含L1缓存片的计算核心作为请求发起方，该区域的L2缓存片作为请求接收方；设置区域内L2缓存片的缓存方式；连接区域内L2缓存片与设备内存及其内存控制器；设置区域内的原始拥有者缓存，负责其区域内设备内存地址的初次读取和最终写回；将本区域的每个L2缓存片和另一半区域的一个L2缓存片组成镜像L2缓存片组。本发明专利技术可节省芯片走线面积，缩短平均访问延时，提高运算核心访问缓存数据的效率，支持在硬件层面完成不同缓存层级间的数据共享和同步的处理。步的处理。步的处理。

全部详细技术资料下载

【技术实现步骤摘要】
一种GPU缓存子系统互联的数字电路设计方法

[0001]本专利技术属于数字电路
，具体涉及一种GPU缓存子系统互联的数字电路设计方法。

技术介绍

[0002]图1是一个GPU常规片内缓存子系统的互联结构。每一组运算核心共享一个独立的私有缓存L1，所有的运算核心再共享一个容量较大的二级缓存L2缓存片。L2缓存片为了能够同时提供所有的运算核心足够的访问带宽，L2缓存片一般用分布式缓存的方式来组织，即根据访问的地址所属的空间，将L2缓存片分成若干L2缓存片，每个L2缓存片都能提供一份访问带宽，所有的运算核心和所有的L2缓存片以交叉总线相互连接。一个常规的4X4的交叉总线互联如图2所示。该常规方法通常再配和访存请求地址哈希等功能来达到交叉通路根据地址路由各个L2缓存片片时，访问均衡的目的，以充分利用所有L2缓存片片带宽。
[0003]随着GPU片内规模的不断扩大，使用上述分布式缓存的方式组织GPU缓存访问，主要面临以下几个问题：
[0004]1.越多的运算核心，访存总带宽需求更大，也需要提供更大的L2缓存片访问总带宽。这要求将L2缓存片分成更多的L2缓存片，实现更多路的交叉总线通路以满足需要。交叉通路走线的面积可能成为瓶颈。
[0005]2.更多的运算核心和更多的L2缓存片使得交叉通路的最长走线越来越长，当单个运算核心的任务希望使用所有地址空间即访存请求关联所有的L2缓存片，则一次数据块的搬移最终会取决于该运算核心到某个最长走线路径L2缓存片的延时。
[0006]所以在GPU缓存子系统及...

【技术保护点】

【技术特征摘要】
1.一种GPU缓存子系统互联的数字电路设计方法，其特征在于，包括：步骤1：划分GPU的设备内存地址，设置计算核心、L1缓存片、L2缓存片、设备内存及其内存控制器；步骤2：设置区域内独立的交叉通路，该交叉通路连接该区域的包含L1缓存片的计算核心作为请求发起方，该区域的L2缓存片作为请求接收方；步骤3：设置区域内L2缓存片的缓存方式；步骤4：连接区域内L2缓存片与设备内存及其内存控制器；步骤5：设置区域内的原始拥有者缓存，负责其区域内设备内存地址的初次读取和最终写回；步骤6：将本区域的每个L2缓存片和另一半区域的一个L2缓存片组成镜像L2缓存片组。2.根据权利要求1所述的一种GPU缓存子系统互联的数字电路设计方法，其特征在于，所述步骤1具体为：将GPU的设备内存地址分为两个区域，每个区域内设有：GPU一半计算核心和其私有的L1缓存片，共享的、占L2缓存片总容量一半的L2缓存片，占总容量一半的设备内存及其内存控制器。3.根据权利要求2所述的一种GPU缓存子系统互联的数字电路设计方法，其特征在于，所述步骤2具体为：设置区域内独立的交叉通路，该交叉通路连接该区域的包含L1缓存片的计算核心作为请求发起方，该区域的L2缓存片作为请求接收方。4.根据权利要求3所述的一种GPU缓存子系统互联的数字电路设计方法，其特征在于，所述步骤3具体为：设置区域内L2缓存片的缓存方式：每个区域的L2缓存片，采用常规的分布式缓存方式，根据系统的实际带宽要求分成若干L2缓存片与交叉通路相连接。5.根据权利要求4所述的一种GPU缓存子系统互联的数...

【专利技术属性】
技术研发人员：王俊，
申请(专利权)人：上海天数智芯半导体有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人