当前位置: 首页 > 专利查询>英特尔公司专利>正文

棋盘多GPU配置内的可缩放几何形状处理制造技术

技术编号:10251228 阅读:146 留言:0更新日期:2014-07-24 11:19
本发明专利技术描述了系统、设备和方法,包括将成批的几何对象分发到多核系统,在每一个处理器核处,对对应的成批的几何对象执行顶点处理和几何形状设置处理,将顶点处理的结果存储在可以被所有核访问的共享存储器中,并将几何形状设置处理的结果存储在本地存储中。然后,每一个特定核都可以使用从特定核内的本地存储中获取以及从其他处理器核中的至少一个的本地存储获取的几何形状设置结果,执行栅格化。

【技术实现步骤摘要】
【国外来华专利技术】棋盘多GPU配置内的可缩放几何形状处理背景提供有竞争力的处理器图形子系统依赖于高效并且可缩放的图形体系结构。需要可缩放性来使用单一体系结构和有限的设计资源来支持一系列图形性能点。跨多个相同的图形核并行化图形工作负荷通常会提供这样的可缩放性。并行图形流水线的体系结构中固有的一个问题是高效并行化流水线的几何形状处理和栅格化阶段。并行化两个阶段是需要的——假定任何一个阶段都会在处理单一帧的过程中在不同的时间成为性能瓶颈。令人遗憾的是,并行化几何形状处理最天然地需要跨图形核分布几何对象,而并行化栅格化最天然地需要跨图形核分布图像空间(例如,帧缓冲器)。然而,几何对象以及它们的图像空间占用空间之间的关联不是先验已知的。另外,几何对象需要以与它们被提交来进行几何形状处理相同的时间顺序栅格化。因此,需要以高性能/电源和性能/区域特征,并以不需要大量的软件干预的方式,跨并行栅格化流水线,组装、重新排序和分发并行几何形状处理的结果的机制。包括多个、并行图形核并能够通过使用棋盘呈现(CheckBoardRendering:CBR)方案来进行分布式栅格化的常规图形系统,可以将目标表面(例如,帧缓冲器)细分为小的矩形区域。然后,可以将这些区域的不相重叠的规则网格子集分配给每一个图形核,以便指派所有目标表面像素。然后,图形核中的栅格化流水线可以并行地操作,以便对于每一个已栅格化的对象,栅格化流水线将只呈现(render)包含在其目标表面像素的子集内的那些像素。在当前CBR方案中,每一个图形核都对于所有提交的几何对象执行几何形状处理,将结果只传递到其内部栅格化流水线。由于在这样的常规系统中跨图形核复制几何形状处理,因此,利用图形核的数量,没有几何形状处理速率的正缩放(positivescaling)。附图简述此处所描述的材料是作为示例说明的,而不仅限于各个附图的图形。为说明简单和清楚起见,图形中所示出的元件不一定是按比例绘制的。例如,为了清楚起见,某些元件的尺寸可以相对于其他元件而放大。此外,在合适的情况下,在不同的图形中参考标签重复使用,以表示对应的或类似的元件。在图形中:图1是示例图形系统的说明图;图2示出了示例棋盘呈现方案;图3和5示出了示例并行呈现过程的流程图;图4示出了图3的示例方案的一部分;以及图6是所有都根据本专利技术的至少某些实现的排列的示例系统的说明图。详细描述现在将参考附图来描述一个或多个实施例或实现。尽管讨论了特定配置以及布局,但是,应该理解,这只是为了说明。那些精通相关技术的人员将认识到,在不偏离描述的主题的精神和范围的情况下,可以使用其他配置和布局。对于那些精通相关技术的人来说显而易见的是,此处所描述的技术和/或布局也可以用于此处所描述的之外各种其他系统和应用中。尽管下列描述阐述了可以在诸如,例如,片上系统(SoC)体系结构之类的体系结构中表现的各种实现,但是,此处所描述的技术和/或布局的实现不局限于特定体系结构和/或计算系统,并可以通过用于类似的目的的任何体系结构和/或计算系统来实现。例如,使用,例如,多个集成电路(IC)芯片和/或封装,和/或各种计算设备和/或诸如机顶盒、智能电话等等之类的消费电子(CE)设备的各种体系结构可以实现此处所描述的技术和/或布局。进一步地,尽管下列描述可以阐述诸如系统组件的逻辑实现、类型和相互关系,以及逻辑分区/集成选择之类的很多具体细节,但是,要求权利保护的主题也可以在没有这些具体细节的情况下实施。在其他情况下,诸如,例如,没有详细示出控制结构和完全软件指令序列,以便不至于使此处所公开的材料变得模糊。此处所公开的材料可以以硬件、固件、软件,或其任何组合来实现。此处所公开的材料还可实现为存储在机器可读取的介质中的可以由一个或多个处理器读取和执行的指令。机器可读的介质可以包括用于以机器(例如,计算设备)可读的形式存储或传输信息的任何介质和/或机制。例如,机器可读的介质可以包括,只读存储器(ROM);随机存取存储器(RAM);磁盘存储介质;光存储介质;闪存设备;电的、光学的、声音或其他形式的传播信号(例如,载波、红外信号、数字信号等等);及其他。说明书中对“一个实现”、“实现”、“示例实现”等等的引用表示所描述的实现可包括特定特征、结构或特性,但是,每一个实现都可以不一定包括该特定特征、结构或特征。此外,这样的短语不一定是指同一个实现。此外,当结合一个实现描述特定特征、结构或特性时,认为在本领域技术人员学识范围内,可以与其他实现一起实施这样的特征、结构或特性,无论此处是否显式地描述。图1示出了根据本公开的示例图形系统100。在各实现中,系统100包括多个并行图形核102和104、共享存储106和并行共享总线108。在各实现中,共享存储108可以是任何类型的存储器,诸如,但不局限于,随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态RAM(SRAM)、闪存等等。图形核102和104中的每一个都可以是被配置成执行三维(3D)图形处理的微处理器核。进一步地,图形核102和104可以类似地配置和/或构建。在各实现中,核102/104可以被配置成根据各种应用程序编程接口(API)、标准,和/或规范,来执行3D图形处理,包括,但不仅限于,OpenGL规范(参见,例如,TheOpenGLGraphicsSystem:ASpecification(Version4.0(CoreProfile)-March11,2010)(“OpenGL图形系统:规范(版本4.0(核概况)-2010年3月11日)”)),或Direct3DAPI(参见,例如,“TheDirect3D10System″ACMTransactionsonGraphics(TOG)-ProceedingsofACMSIGGRAPH,Volume25Issue3,July2006”(“Direct3D10系统”ACM图形学报-ACMSIGGRAPH会议录,2006年7月第3期第25卷))(下面简称为“Direct3DAPI”)。为了清楚起见,各种设备、系统和过程是在Direct3DAPI的上下文中描述的,虽然本专利技术不仅限于任何特定3D图形API、标准,和/或规范。在图1中详细示出了图形核102的内部组件,包括3D图形流水线103,具有输入处理模块110(包括批处理逻辑112)、可通信地耦合到输入处理模块110以及共享存储106的顶点处理模块114、可通信地耦合到顶点处理模块114的几何形状设置模块116、可通信地耦合到几何形状设置模块116以及共享总线108的诸如先进先出(FIFO)缓冲器118之类的本地存储器结构、可通信地耦合到FIFO118以及共享总线108的交叉开关多路复用器(MUX)120、以及可通信地耦合到交叉开关MUX120、共享存储106,以及共享总线108的栅格化模块122(包括非关联化逻辑(dereferencinglogic)123)。提供给核102/104中的每一个的互连107提供对共享存储器108的读和写访问。并行图形核104中的每一个都可以包括类似的项目。在各实现中,图形核102和104中的每一个都可以被称为图形处理单元(GPU)。那些精通本技术的普通人员将认识到,为了清楚起见,在图1本文档来自技高网...
棋盘多GPU配置内的可缩放几何形状处理

【技术保护点】
一种设备,包括:用于执行三维(3D)图形处理的多个处理器核,每一个处理器核包括用于缓存几何形状设置结果的本地存储;通信地耦合到所述多个处理器核的共享存储,所述共享存储缓存由每一个处理器核所提供的顶点处理结果;以及通信地耦合到每一个处理器核的所述本地存储的总线,所述总线用于在所述多个处理器核之间分布几何形状设置结果中的至少某些。

【技术特征摘要】
【国外来华专利技术】1.一种用于执行三维(3D)图形处理的设备,包括:多个处理器核,每一个处理器核包括用于缓存几何形状设置结果的本地存储装置;通信地耦合到所述多个处理器核的共享存储装置,所述共享存储装置用于缓存由每一个处理器核所提供的顶点处理结果;以及通信地耦合到每一个处理器核的所述本地存储装置的总线,所述总线用于在所述多个处理器核之间分布几何形状设置结果中的至少某些,其中所述本地存储装置包括先进先出(FIFO)缓冲器,所述先进先出(FIFO)缓冲器包括至少两组读取指针,其中一组读取指针将引用只跨越包括所述FIFO缓冲器的所述处理器核的目标像素的对象,其中另一组读取指针将引用跨越包括所述FIFO缓冲器的所述处理器核的目标像素和至少一个其他处理器核的目标像素的对象。2.如权利要求1所述的设备,其特征在于,还包括用于向所述多个处理器核提供对所述顶点处理结果的共享访问的互连装置;并且其中每一个处理器核包括用于在所述多个处理器核之间分摊顶点处理工作负荷的批处理装置。3.如权利要求1所述的设备,其特征在于,所述FIFO缓冲器还将缓冲在所述多个处理器核之间分摊几何形状设置结果的控制信息,所述控制信息基于棋盘呈现CBR方案来指定几何形状设置结果的分摊。4.如权利要求1所述的设备,其特征在于,每一个处理器核包括:栅格化装置;以及通信地耦合到所述栅格化装置以及所述本地存储装置的交叉开关多路复用器,其中所述交叉开关多路复用器将通过所述总线在源自所述本地存储装置的内部对象和源自其他处理器核的外...

【专利技术属性】
技术研发人员:P·L·多伊尔J·S·波尔斯A·D·小亨特A·考克A·纳瓦勒
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1