具有共用算术逻辑单元的图形处理单元制造技术

技术编号:5458189 阅读:178 留言:0更新日期:2012-04-11 18:40
本发明专利技术描述一种使用一个或一个以上共用算术逻辑单元(ALU)的图形处理单元(GPU)管线。为了促进ALU的此共用,可相对于常规GPU管线而重新布置所述揭示的GPU管线的级。另外,通过重新布置所述GPU管线的所述级可在图像处理中实现效率。举例来说,不同于常规GPU管线,属性梯度设置级可定位在管线中的较后处,且属性内插器级可紧跟在所述属性梯度设置级之后。此允许所述属性梯度设置级与属性内插器级共用一ALU。本发明专利技术还描述了用于所述GPU管线的若干其它技术和特征,其可改进性能且可能实现额外的处理效率。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及图形处理单元,且更特定来说,涉及具有用于处理图像的多级管线化配 置的图形处理单元。背景技水图形处理单元(GPU)是用以操纵并显示显示器上的计算机化图形的专用图形再现 装置。GPU建置有高度并行的结构,所述结构针对一定范围复杂的图形相关算法提供比 典型通用中央处理单元(CPU)更有效的处理。举例来说,复杂的算法可对应于对三维 计算机化图形的表示。与使用CPU将图像直接绘制到显示器上相比,GPU可实施例如 形成点、线和三角形的大量所谓的"原始"图形操作,以更快地在显示器上形成复杂的 三维图像。视频游戏工业中常常使用顶点着色和像素着色来确定计算机化图像的最终表面特 性,例如光吸收和散射、纹理映射、光反射和折射、造影、表面移位和后处理效果。GPU 通常包括大量管线级,例如一个或一个以上着色器级、设置级、光栅化器级和内插级。举例来说,通常将顶点着色器应用于图像数据(例如图像的几何形状)且顶点着色 器产生图像数据内顶点的顶点坐标和属性。顶点属性可包括与顶点相关联的颜色坐标、 正规坐标和纹理坐标。 一个或一个以上原始设置和拒收模块可基于图像数据内的顶点而 形成例如点、线或三角形的原始形状,且可拒收隐藏或不可见的原始形状。属性设置模 块计算出图像数据的原始形状内的属性的梯度。 一旦计算出属性梯度值,则可将图像数 据的原始形状转换为像素,且可相对于隐藏的原始形状执行像素拒收。接着,属性内插器基于属性梯度值将属性内插在图像数据的原始形状内的像素上, 且将内插的属性值发送到片段着色器以用于像素再现。片段着色器的结果被输出到后处 理区块和帧缓冲器以用于将经处理的图像表示在显示器上。沿GPU管线的后续级执行 此过程。
技术实现思路
一般来说,本专利技术描述一种使用一个或一个以上共用算术逻辑单元(ALU)的图形处理单元(GPU)管线。为了促进ALU的所述共用,可相对于常规GPU管线而重新布 置所揭示的GPU管线的级。此外,通过重新布置GPU管线的级可在图像处理中实现效 率。本专利技术还描述了用于GPU管线的若干其它技术和特征,其可改进性能且可能实现 额外的处理效率。举例来说,也针对GPU管线描述了延伸顶点高速缓冲存储器,其可 显著减少需要通过GPU管线的连续级而转移的数据的量。在一个实施例中,本专利技术提供一种方法,其包含在GPU管线内接收图像的图像 数据;以及在使用用于属性梯度设置级与属性内插器级的共用算术逻辑单元的GPU管 线内处理所述图像数据。在另一实施例中,本专利技术提供一种装置,其包含GPU管线,所述GPU管线接收 图像的图像数据且在多个级内处理所述图像数据,其中所述多个级包括属性梯度设置级 和属性内插器级;以及共用算术逻辑单元,其执行与所述属性梯度设置级和所述属性内 插器级相关联的属性梯度设置和属性内插。在另一实施例中,本专利技术提供一种装置,其包含用于接收图像的图像数据的装置; 用于在使用共用算术逻辑单元的属性梯度设置级中处理所述图像数据的装置;以及用于 在使用所述共用算术逻辑单元的属性内插器级中处理所述图像数据的装置。本文中所描述的技术可以硬件、软件、固件或其任何组合来实施。如果以软件实施, 则可整个地或部分地通过包含指令的计算机可读媒体来实现所述技术,所述指令在由例 如处理器的机器执行时执行本文中所描述的方法中的一者或一者以上。因此,本专利技术还涵盖一种包含指令的计算机可读媒体,所述指令在被执行时使机器 在GPU管线内接收图像的图像数据;以及在使用用于属性梯度设置级与属性内插器级的共用算术逻辑单元的GPU管线内处理所述图像数据。附图和以下描述中陈述了一个或一个以上实施例的细节。从所述描述和图式且从权 利要求书将明白本专利技术的其它特征、目的和优势。附图说明图1为说明包括图形处理单元(GPU)的示范性装置的方框图,所述图形处理单元 (GPU)使用一个或一个以上共用算术逻辑单元(ALU)和延伸顶点高速缓冲存储器。 图2为说明常规GPU管线的方框图。图3为说明根据本专利技术的一实施例的示范性GPU的方框图。图4为说明根据本专利技术的另一实施例的示范性GPU的方框图。图5和图6为说明根据本专利技术的实施例的可在GPU管线中执行的技术的流程图。具体实施例方式图1为说明包括图形处理单元(GPU) 14的示范性装置10的方框图,所述图形处 理单元(GPU) 14包括用于处理计算机化图像的GPU管线18。根据本专利技术,GPU管线 18使用一个或一个以上共用算术逻辑单元(ALU) 15来降低GPU 14的复杂性且产生图 像处理方面的效率。此外,GPU管线可实施延伸顶点高速缓冲存储器16以便减少通过 GPU管线18而传播的数据的量。如下文中更详细论述,可相对于常规GPU管线而重新 布置GPU管线18的级,其可改进图像处理的过程且促进共用ALU 15的使用。然而, 一些级可仍使用专用(不共用)ALU,如同常规GPU管线的级中所使用的那些ALU。在图l的实例中,装置10包括控制器12、 GPU14和显示器20。装置10也可包括 许多其它组件(未图示)。举例来说,装置IO可包含无线通信装置,且显示器20可包 含位于无线通信装置内的显示器。如另一实例,装置10可包含台式或笔记型计算机, 且显示器20可包含计算机的专用监视器或显示器。装置10也可包含有线通信装置或不 主要针对通信的装置。如其它实例,装置10可包含包括显示器20的个人数字助理 (PDA)、掌上型视频游戏装置、游戏控制台或电视装置。在各种实施例中,可从远程装 置或从本地装置获得计算机化视频图像,所述装置例如为产生视频或视频对象的视频服 务器或检索所存储的视频或视频对象的视频档案。控制器12控制GPU 14的操作。控制器12可为GPU 14的特定控制器或控制装置 IO的整体操作的更一般的控制器。根据本文中所描述的技术,GPU 14包括实施并存取 共用ALU 15的GPU管线18。此外,GPU 14可包括耦合到GPU管线18的延伸顶点高 速缓冲存储器16。而且,共用ALU可产生图像处理方面的效率且延伸顶点高速缓冲存 储器16的并入可降低通过GPU 14内的GPU管线18而传递的数据的量。可以非常规的 方式来布置GPU管线18以促进共用ALU 15和延伸顶点高速缓冲存储器16的使用。GPU 14从装置10内的控制器12接收例如几何数据的图像数据和图像的再现命令。 图像数据可对应于对复杂、二维或三维计算机化图形的表示。GPU 14处理图像数据以 (例如)经由显示器20向装置10的使用者呈现图像效果、背景图像或视频游戏图像。 图像可形成为视频帧序列中的视频帧。显示器20可包含与装置IO整合或耦合到装置10 的液晶显示器(LCD)、阴极射线管(CRT)显示器、等离子体显示器或另一类型的显示 器。在一些情形中,控制器12可从在装置10内操作的应用程序接收图像数据。举例来 说,装置10可包含基于从内部硬盘驱动器或可移除数据存储装置接收的图像数据来操置。在其它情形中,控制器12可从在装置IO外部操作的应用程序接收图像数据。举例来说,装置10可包含基于经由有线网络或无线网络(例如因特网)从外部服务器接收的图像数据来操作视频游戏应用程序的计算装置。可经由可为有线、无线或两者的组合的串流媒体或广播媒体来接收图像数据。本文档来自技高网
...

【技术保护点】
一种方法,其包含: 在图形处理单元(GPU)管线内接收图像的图像数据;以及 在使用用于属性梯度设置级和属性内插器级的共用算术逻辑单元的所述GPU管线内处理所述图像数据。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:焦国方布莱恩鲁滕伯格于春杜云
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1