一种基于像素的stile图形处理器及其自适应tile判断方法技术

技术编号:35744635 阅读:16 留言:0更新日期:2022-11-26 18:48
本发明专利技术属于计算机硬件技术领域,涉及了一种基于像素的stile图形处理器及其自适应tile判断方法,能够有效剔除掉无用的像素tile,提高后级tile的工作效率。具体使用原则如下:1)判断发生于三角形光栅化过程中;2)判断基本单元为像素stile(8*8);3)后续处基本单元为像素tile(4*4);4)stile拆分时,剔除掉无用的tile,提高后级工作效;5)stile需携带四个顶点与三角形位置关系边函数信息;6)可为后级单元提供每个周期一个像素tile。本发明专利技术解决了stile拆分过程中无效tile对后级流水效率的影响,提高了后级流水计算的工作效率。了后级流水计算的工作效率。了后级流水计算的工作效率。

【技术实现步骤摘要】
一种基于像素的stile图形处理器及其自适应tile判断方法


[0001]本专利技术属于计算机硬件
,具体涉及一种自适应tile判断方法,尤其涉及一种基于像素的stile图形处理器及其自适应tile判断方法;该方法涉及到图形图像处理领域中图形处理器单元(GPU)中的数据计算。

技术介绍

[0002]在3D图形图形处理结构中,几何图元的处理为重中之重,将其可分为三种基本图元:点、线与三角形。而在三种图元中,三角形图元是作为最重要的处理对象,它的处理效率直接决定了一款GPU的处理性能。如何提高GPU的处理性能,成为了当前GPU研发的主要目标。考虑到设计资源问题以及整个流水单元的利用率,将前级流水单元生成的stile单元进行拆分,已实现属性插值流水线的满负荷运行,同时剔除流水线中无用的像素,提高整个渲染流水的效率。

技术实现思路

[0003]基于
技术介绍
中存在的问题,本专利技术提供了一种基于像素的stile图形处理器及其自适应tile判断方法,本专利技术有效的解决了stile拆分过程中无效tile对后级流水效率的影响,提高了后级流水计算的工作效率。
[0004]本专利技术的
技术实现思路
是:一种基于像素的stile图形处理器,其特殊之处在于:包括像素stile产生单元、像素stile拆分单元和像素属性插值单元;
[0005]上述像素stile产生单元用于产生几何图元;上述几何图元用于后续进行扫描填充与属性插值;上述像素stile拆分单元用于对像素stile进行拆分,后级采用其子单元进行计算操作;上述像素属性插值单元用于完成像素stile的坐标填充与填充后每个像素的属性插值。
[0006]上述的像素stile产生单元,接收到三角形三个顶点后,通过像素stile扫描算法,生成以像素stile为单元的像素块;
[0007]上述的像素stile拆分单元,将像素stile块拆分为tile像素块,根据每个tile的特点进行判定和筛选,并将与几何图元没有交集的tile剔除掉;
[0008]上述的像素属性插值单元包括像素插值系数计算、Quad级属性计算、属性步进因子以及TILE中像素属性计算。
[0009]上述的像素stile产生单元生成的stile包含8*8像素块。
[0010]上述的像素stile产生单元包括三角形三条边的边函数的计算以及后端属性插值需要的计算参数;
[0011]上述像素stile产生单元包括点与直线的位置关系判断电路、点与三角形的位置关系判断电路以及四边形与三角形三角形的位置关系判断电路;
[0012]上述像素stile产生单元包括预判段反馈单元,上述预判段反馈单元判断到stile像素块与三角形的位置关系后,会丢弃流水线中无用的像素块信息;
[0013]上述的像素stile拆分单元对于stile像素块的信息,采用并行比较4个tile的动态选择电路;
[0014]上述动态选择电路根据4个tile与三角形的位置关系,自适应筛选后,流水进入后端的属性插值电路。
[0015]上述像素stile拆分单元每个tile自适应拆分后,采用递推电路,计算每个tile的4个顶角的边函数,相对应包含4组并行的边函数递推电路;
[0016]上述的属性插值电路包括一个用于计算像素tile携带的属性计算的属性插值系数计算电路;上述属性插值系数计算电路中至少包括两个用于用于进行定点数乘法运算的乘法运算单元。
[0017]一种实现上述的基于像素的stile图形处理器的自适应tile的判断方法,其特殊之处在于:包括以下步骤:
[0018]步骤1:几何引擎在进行光栅化过程中,优先需要判断像素stile;
[0019]步骤2:几何引擎在进行光栅化过程中在判断像素stile时,以像素stile(8*8)为基本处理单元;
[0020]步骤3:对有效的像素stile,以像素tile(4*4)为基本单元,再次进行判断,该操作需要对像素stile进行拆分;
[0021]步骤4:在对像素stile拆分时,设计算法会剔除掉无用的tile,提高像素级处理单元的工作效率;
[0022]步骤5:拆分后的每个tile需携带拆分前stile四个顶点与三角形位置关系边函数信息;
[0023]步骤6:通过步骤1

5,为后级单元提供每个周期一个像素tile。
[0024]本专利技术的有益效果是:
[0025]本发提供了一种基于像素的stile图形处理器及其自适应tile判断方法,能够在基于块处理的图形处理领域进行使用,减小了流水险种冗余的像素块,提高整个渲染通路的效率。其中,第一硬件单元描述了如何快速产生像素stile单元;第二硬件单元给出如何进行像素stile自适应拆分;第三硬件单元给出了基于拆分后的tile,如何高效的进行后续的插值计算等,较为完善的给出了三角形图元渲染流水的实现。
附图说明
[0026]图1是本专利技术中几何图元光栅化总体结构图;
[0027]图2是本专利技术第一硬件像素stile扫描结构图;
[0028]图3是本专利技术第二硬件像素stile自适应拆分tile结构图;
[0029]图4是本专利技术第三硬件属性插值计算结构图;
[0030]图5时本专利技术属性插值计算流水详细结构。
具体实施方式
[0031]下面结合附图和具体实施例,对本专利技术的技术方案进行清楚、完整地表述。显然,所表述的实施例仅是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提所获得的所有其他实施例,都属于本专利技术的保
护范围。
[0032]参见图1

5,本专利技术提供的一种基于像素的stile图形处理器具体实施例的结构包括像素stile产生单元、像素stile拆分单元和像素属性插值单元;
[0033]上述像素stile产生单元用于产生几何图元;上述几何图元用于后续进行扫描填充与属性插值;上述像素stile拆分单元用于对像素stile进行拆分,后级采用其子单元进行计算操作;上述像素属性插值单元用于完成像素stile的坐标填充与填充后每个像素的属性插值。
[0034]上述的像素stile产生单元,接收到三角形三个顶点后,通过像素stile扫描算法,生成以像素stile为单元的像素块;
[0035]上述的像素stile拆分单元,将像素stile块拆分为tile像素块,根据每个tile的特点进行判定和筛选,并将与几何图元没有交集的tile剔除掉;
[0036]上述的像素属性插值单元包括像素插值系数计算、Quad级属性计算、属性步进因子以及TILE中像素属性计算。
[0037]上述的像素stile产生单元生成的stile包含8*8像素块。
[0038]上述的像素stile产生单元包括三角形三条边的边函数的计算以及后端属性插值需要的计算参数;
[0039]上述像素sti本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于像素的stile图形处理器,其特征在于:包括像素stile产生单元、像素stile拆分单元和像素属性插值单元;所述像素stile产生单元用于产生几何图元;所述几何图元用于后续进行扫描填充与属性插值;所述像素stile拆分单元用于对像素stile进行拆分,后级采用其子单元进行计算操作;所述像素属性插值单元用于完成像素stile的坐标填充与填充后每个像素的属性插值。所述的像素stile产生单元,接收到三角形三个顶点后,通过像素stile扫描算法,生成以像素stile为单元的像素块;所述的像素stile拆分单元,将像素stile块拆分为tile像素块,根据每个tile的特点进行判定和筛选,并将与几何图元没有交集的tile剔除掉;所述的像素属性插值单元包括像素插值系数计算、Quad级属性计算、属性步进因子以及TILE中像素属性计算。2.根据权利要求1所述的一种基于像素的stile图形处理器,其特征在于:所述的像素stile产生单元生成的stile包含8*8像素块。3.根据权利要求2所述的一种基于像素的stile图形处理器,其特征在于:所述的像素stile产生单元包括三角形三条边的边函数的计算以及后端属性插值需要的计算参数;所述像素stile产生单元包括点与直线的位置关系判断电路、点与三角形的位置关系判断电路以及四边形与三角形三角形的位置关系判断电路;所述像素stile产生单元包括预判段反馈单元,所述预判段反馈单元判断到stile像素块与三角形的位置关系后,会丢弃流水线中无用的像素块信息。4.根据权...

【专利技术属性】
技术研发人员:刘天江田泽许宏杰伏文生
申请(专利权)人:西安翔腾微电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1