The invention belongs to the field of graphics processor design, relates to a uniform dyeing graphics processor architecture single instruction multi thread dyeing cluster structure, including: CU used for unit control and scheduling of SSC (3); for instruction fetch FDU decoding unit (2); I$unit for accelerating the access speed (instruction 4); some units for performing SPU staining procedures (1); SSRAM for sharing unit data in SPU (8); for internal memory access decoding and RAC control unit of Arbitration (7); for the SSRAM unit (8), SPU (1) LSU unit data exchange unit between the internal memory and the RF unit (6); C$unit for accelerating constant access (5); the invention realizes single instruction multi thread processing.
【技术实现步骤摘要】
本专利技术属于图形处理器设计领域,涉及一种统一染色架构图形处理器单指令多线程染色簇结构。
技术介绍
图形处理器(GraphicProcessUnit,GPU)是现代计算机硬件的重要组成部分,是进行图形绘制、处理和显示的关键部件,普遍存在于工作站、个人电脑、笔记本、手机以及各类需进行图形显示的系统中。GPU负责产生2D和3D的图形、图像和视频,以支持基于窗口的操作系统、图形用户界面、视频游戏、可视化图像应用和视频播放等可视化计算。GPU技术的发展主要经历了固定功能流水线阶段、分离染色器架构阶段、统一染色器架构阶段,其图形处理能力不断提升,应用领域也从最初的图形绘制逐步扩展到通用计算领域。GPU流水线高速、并行的特征和灵活的可编程能力,为图形处理和通用并行计算提供了良好的运行平台。目前,我国GPU研制能力薄弱,各领域显示控制系统中大量采用国外进口的商用GPU芯片。尤其是在军用领域中,国外进口商用GPU芯片存在安全性、可靠性、保障性等方面的隐患,无法满足军用环境的需求;而且,出于政治、军事、经济等原因,国外对我国实行技术“封锁”和产品“垄断”,难以获得GPU芯片的底层技术资料,如寄存器资料、详细内部微架构、核心软件源码等,导致GPU功能、性能无法充分发挥,且移植性较差;上述问题严重制约了我国显示系统的独立研制和自主发展,研制具有自主知识产权的统一染色图形处理器芯片已迫在眉睫,而单指令多线程染色簇作为统一染色图形处理器中统一染色阵列单元的关键和核心,对其设计技术进行研究和突破已刻不容缓。
技术实现思路
本专利技术的目的是:提供一种统一染色架构图形处理器单指令多线程染 ...
【技术保护点】
一种统一染色架构图形处理器单指令多线程染色簇结构,其特征在于,包括:用于对SSC进行控制和调度的CU单元(3);用于对指令进行取指译码的FDU单元(2);用于加速指令存取速度的I$单元(4);若干用于执行染色程序的SPU单元(1);用于在SPU间共享数据的SSRAM单元(8);用于对内部存储器访问进行译码和仲裁控制的RAC单元(7);用于在SSRAM单元(8)、SPU单元(1)内部存储器和RF单元之间进行数据交换的LSU单元(6);用于加速常量存取的C$单元(5);所述CU单元(3)具有与SSC单元外部的输入接口,用于从外部接收控制信息;所述CU单元(3)具有与SSC单元外部的输出接口,用于向外部输出状态信息;所述I$单元(4)具有与SSC单元外部的输入接口,用于从外部接收染色指令;所述C$单元(5)具有与SSC单元外部的输入接口,用于从外部接收染色所需常量参数;所述RAC单元(7)具有与SSC单元外部的输入、输出接口,分别用于从外部接收染色程序需要加工的输入数据,及向外部输出染色程序对输入数据加工后的输出结果;所述的CU单元(3)与FDU单元(2)相连,用于和FDU单元(2)交互控制 ...
【技术特征摘要】
1.一种统一染色架构图形处理器单指令多线程染色簇结构,其特征在于,包括:用于对SSC进行控制和调度的CU单元(3);用于对指令进行取指译码的FDU单元(2);用于加速指令存取速度的I$单元(4);若干用于执行染色程序的SPU单元(1);用于在SPU间共享数据的SSRAM单元(8);用于对内部存储器访问进行译码和仲裁控制的RAC单元(7);用于在SSRAM单元(8)、SPU单元(1)内部存储器和RF单元之间进行数据交换的LSU单元(6);用于加速常量存取的C$单元(5);所述CU单元(3)具有与SSC单元外部的输入接口,用于从外部接收控制信息;所述CU单元(3)具有与SSC单元外部的输出接口,用于向外部输出状态信息;所述I$单元(4)具有与SSC单元外部的输入接口,用于从外部接收染色指令;所述C$单元(5)具有与SSC单元外部的输入接口,用于从外部接收染色所需常量参数;所述RAC单元(7)具有与SSC单元外部的输入、输出接口,分别用于从外部接收染色程序需要加工的输入数据,及向外部输出染色程序对输入数据加工后的输出结果;所述的CU单元(3)与FDU单元(2)相连,用于和FDU单元(2)交互控制和状态信息,并告知FDU发射哪个warp的控制信号和数据到SPU上执行;所述SPU单元(1)与所述CU单元(3)相连,用于将SPU单元(1)的分支跳转结果发送到CU单元(3);所述I$单元(4)与FDU单元(2)连接,用于向FDU单元(2)提供染色指令;所述SPU单元(1)与FDU单元(2)连接,用于FDU单元(2)读取SPU单元(1)内部的寄存器文件;所述FDU单元(2)与SPU单元(1)、所述LSU单元(6)相连,用于向SPU单元(1)、LSU单元(6)提供指令译码后的控制信号和所需的源操作数;所述SSRAM单元(8)与RAC相连,用于为LSU单元(6)和SSC单元外部对SSRAM单元(8)的访问提供数据通路;所述SPU单元(1)与RAC相连,用于为LSU单元(6)和SSC单元外部对SPU单元(1)内部的存储器访问提供数据通路;所述LSU单元(6)和所述RAC单元(7)相连,用于为LSU单元(6)通过RAC单元(7)对SSRAM单元(8)和SPU单元(1)内...
【专利技术属性】
技术研发人员:田泽,任向隆,张骏,韩立敏,马城城,郑新建,
申请(专利权)人:中国航空工业集团公司西安航空计算技术研究所,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。