棋盘多GPU配置内的可缩放几何形状处理制造技术

技术编号：10251228 阅读：156 留言：0更新日期：2014-07-24 11:19

本发明专利技术描述了系统、设备和方法，包括将成批的几何对象分发到多核系统，在每一个处理器核处，对对应的成批的几何对象执行顶点处理和几何形状设置处理，将顶点处理的结果存储在可以被所有核访问的共享存储器中，并将几何形状设置处理的结果存储在本地存储中。然后，每一个特定核都可以使用从特定核内的本地存储中获取以及从其他处理器核中的至少一个的本地存储获取的几何形状设置结果，执行栅格化。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】棋盘多GPU配置内的可缩放几何形状处理背景提供有竞争力的处理器图形子系统依赖于高效并且可缩放的图形体系结构。需要可缩放性来使用单一体系结构和有限的设计资源来支持一系列图形性能点。跨多个相同的图形核并行化图形工作负荷通常会提供这样的可缩放性。并行图形流水线的体系结构中固有的一个问题是高效并行化流水线的几何形状处理和栅格化阶段。并行化两个阶段是需要的——假定任何一个阶段都会在处理单一帧的过程中在不同的时间成为性能瓶颈。令人遗憾的是，并行化几何形状处理最天然地需要跨图形核分布几何对象，而并行化栅格化最天然地需要跨图形核分布图像空间(例如，帧缓冲器)。然而，几何对象以及它们的图像空间占用空间之间的关联不是先验已知的。另外，几何对象需要以与它们被提交来进行几何形状处理相同的时间顺序栅格化。因此，需要以高性能/电源和性能/区域特征，并以不需要大量的软件干预的方式，跨并行栅格化流水线，组装、重新排序和分发并行几何形状处理的结果的机制。包括多个、并行图形核并能够通过使用棋盘呈现(CheckBoardRendering：CBR)方案来进行分布式栅格化的常规图形系统，可以将目标表面(例如，帧缓冲器)细分为小的矩形区域。然后，可以将这些区域的不相重叠的规则网格子集分配给每一个图形核，以便指派所有目标表面像素。然后，图形核中的栅格化流水线可以并行地操作，以便对于每一个已栅格化的对象，栅格化流水线将只呈现(render)包含在其目标表面像素的子集内的那些像素。在当前CBR方案中，每一个图形核都对于所有提交的几何对象执行几何形状处理，将结果只传递到其内部栅格化流水线。由于在这样的常规系...
棋盘多GPU配置内的可缩放几何形状处理

【技术保护点】
一种设备，包括：用于执行三维(3D)图形处理的多个处理器核，每一个处理器核包括用于缓存几何形状设置结果的本地存储；通信地耦合到所述多个处理器核的共享存储，所述共享存储缓存由每一个处理器核所提供的顶点处理结果；以及通信地耦合到每一个处理器核的所述本地存储的总线，所述总线用于在所述多个处理器核之间分布几何形状设置结果中的至少某些。

【技术特征摘要】
【国外来华专利技术】1.一种用于执行三维(3D)图形处理的设备，包括：多个处理器核，每一个处理器核包括用于缓存几何形状设置结果的本地存储装置；通信地耦合到所述多个处理器核的共享存储装置，所述共享存储装置用于缓存由每一个处理器核所提供的顶点处理结果；以及通信地耦合到每一个处理器核的所述本地存储装置的总线，所述总线用于在所述多个处理器核之间分布几何形状设置结果中的至少某些，其中所述本地存储装置包括先进先出(FIFO)缓冲器，所述先进先出(FIFO)缓冲器包括至少两组读取指针，其中一组读取指针将引用只跨越包括所述FIFO缓冲器的所述处理器核的目标像素的对象，其中另一组读取指针将引用跨越包括所述FIFO缓冲器的所述处理器核的目标像素和至少一个其他处理器核的目标像素的对象。2.如权利要求1所述的设备，其特征在于，还包括用于向所述多个处理器核提供对所述顶点处理结果的共享访问的互连装置；并且其中每一个处理器核包括用于在所述多个处理器核之间分摊顶点处理工作负荷的批处理装置。3.如权利要求1所述的设备，其特征在于，所述FIFO缓冲器还将缓冲在所述多个处理器核之间分摊几何形状设置结果的控制信息，所述控制信息基于棋盘呈现CBR方案来指定几何形状设置结果的分摊。4.如权利要求1所述的设备，其特征在于，每一个处理器核包括：栅格化装置；以及通信地耦合到所述栅格化装置以及所述本地存储装置的交叉开关多路复用器，其中所述交叉开关多路复用器将通过所述总线在源自所述本地存储装置的内部对象和源自其他处理器核的外...

【专利技术属性】
技术研发人员：P·L·多伊尔，J·S·波尔斯，A·D·小亨特，A·考克，A·纳瓦勒，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人