一种嵌入式GPU的低功耗光栅化设计方法技术

技术编号：42483031 阅读：5 留言：0更新日期：2024-08-21 13:03

本发明专利技术提供一种嵌入式GPU的低功耗光栅化设计方法，包括：对视窗变换后的图元进行光栅化处理，得到离散片段，基于片段着色器对片段进行着色；对视窗变换后的图元进行光栅化处理，包括：接收视窗变换下发的数据，对所述数据进行解析，采用通用数据存储方式对解析出的图元数据进行存储；对图元进行初始化，计算图元的初始化参数，并基于图元的初始化参数，采用并行扫描方式对图元进行插值扫描。本发明专利技术对图元数据进行存储，使得在对上一个图元进行插值扫描的同时，能够对下一个图元进行初始化，提高图元渲染的效率，采用并行扫描方式对图元进行插值扫描，可加速图元的渲染。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图形渲染领域，更具体地，涉及一种嵌入式gpu的低功耗光栅化设计方法。

技术介绍

1、在嵌入式gpu（graphics processing unit图形处理器）图形渲染管线中，光栅化是运算最为复杂的操作，其扫描效率将直接影响gpu图形渲染的关键性能。光栅化是将变换到屏幕空间的图元离散化为片段的过程，也就是将基本图元（点、线、三角形）转变为二维图像的过程。为节省计算量、降低功耗，嵌入式图形处理器一般会采用延迟渲染技术，先进行片段测试将被覆盖的片段剔除，只渲染可见像素从而大大减少了片段着色的任务量。为突破延迟渲染的关键技术，需从光栅化算法出发，完成延迟渲染设计。

2、光栅化操作会涉及大量数据运算，如初始化参数建立、三角形边线确定、透视校正及属性插值等，因此研究光栅化算法、流水线结构、并行扫描方法及低功耗处理等就尤为重要。

技术实现思路

1、本专利技术针对现有技术中存在的技术问题，提供一种嵌入式gpu的低功耗光栅化设计方法，包括：

2、基于顶点着色器对顶点进行着色，将着色后的顶点装配成图元，对图元进行裁剪、背面消隐处理和视窗变换；

3、基于光栅化加速单元对视窗变换后的图元进行光栅化处理，得到离散片段，基于片段着色器对片段进行着色；

4、其中，所述光栅化加速单元包括图元初始化单元和多个块扫描插值单元，所述图元初始化单元包括存储单元和初始化计算单元；

5、所述存储单元，用于对接收的视窗变换下发的数据进行解析，采用通用数

6、所述初始化计算单元，用于对图元进行初始化，计算图元的初始化参数；

7、所述块扫描插值单元，用于基于图元的初始化参数，采用并行扫描方式对图元进行插值扫描；

8、其中，所述存储单元对图元数据进行存储，使得在对上一个图元进行插值扫描的同时，能够对下一个图元进行初始化。

9、在上述技术方案的基础上，本专利技术还可以作出如下改进。

10、可选的，所述接收视窗变换下发的数据，对所述数据进行解析，采用通用数据存储方式对解析出的图元数据进行存储，包括：

11、接收视窗变换下发的数据，对所述数据进行解析，解析出对应的命令信息和图元数据，如果解析出的是命令信息直接设置对应寄存器，如果解析出的是图元数据，将图元数据采用通用数据存储方式存储于电路结构的存储空间中。

12、可选的，所述将图元数据采用通用数据存储方式存储于电路结构的存储空间中，包括：

13、读取视窗变换下发的数据，判断所述数据是否为点、线、三角形图元，若否，则结束流程；

14、若所述数据为点图元，则读取一个顶点数据；

15、若所述数据为线图元，则读取两个顶点数据；

16、若所述数据为三角形图元，则读取三个顶点数据；

17、将读取的顶点数据存储于电路结构的存储空间中。

18、可选的，所述图元的初始化参数包括边界函数的初始值和偏移量、属性的透视校正初始值和偏移量以及三角形面积及面积倒数计算；

19、其中，所述图元的初始化参数的计算过程包括加减法运算、乘法运算和除法运算，以倒数的超越函数来设计除法器，所述超越函数是通过二次多项式逼近的流水线方法实现的；

20、以及在图元的初始化参数的计算过程，对加减法运算、乘法运算和除法运算进行排序，按照顺序进行相应的运算，完成图元的初始化计算过程。

21、可选的，所述采用并行扫描方式对图元进行插值扫描，包括：

22、根据图元的不同类型，采用相应的插值扫描算法进行扫描；

23、其中，当为点图元时，按照逐点扫描算法扫描；

24、当为线图元时，按照改进后的bresenham算法扫描；

25、当为三角形图元时，按照多扫描块并行扫描算法扫描。

26、可选的，所述当为点图元时，按照逐点扫描算法扫描，包括：

27、当所述命令信息中设置点大小ponit size为1时，直接输出点图元；

28、当所述命令信息中设置点大小ponit size为大于1时，按照指定大小的方块输出点图元。

29、可选的，所述当为线图元时，按照改进后的bresenham算法扫描，包括：

30、当所述命令信息中设置扫描线宽line width为1时，为单线宽扫描；

31、当所述命令信息中设置扫描线宽line width大于1时，为多线宽扫描，其中，多线宽扫描包括：

32、以扫描线宽line width为1时扫描的离散片段为中心上下扫描当前线宽的片段，再通过bresenham算法计算出下一个片段，以此类推，完成多线宽扫描。

33、可选的，所述当为三角形图元时，按照多扫描块并行扫描算法扫描，包括：

34、将三角形图元切割为多个三角形块，所述多个三角形块覆盖在不同的扫描块中，并计算出每个三角形块的初始属性；

35、基于多个扫描块对切割后的多个三角形块进行并行行扫描；

36、其中，根据当前三角形图元初始化计算的边界函数确定扫描块的数量，且每个扫描块的大小能够动态调整。

37、可选的，所述对视窗变换后的图元进行光栅化处理，得到离散片段，对片段进行着色，包括：

38、对插值扫描的片段按照多路并行的方式输出；

39、经片段调度器fdpr将输出的片段调度给片段着色器，对扫描的片段进行着色。

40、可选的，所述顶点着色器和所述片段着色器分别是基于流多处理器smpu对顶点进行着色和对片段进行着色。

41、本专利技术提供的一种嵌入式gpu的低功耗光栅化设计方法，对图元数据进行存储，使得在对上一个图元进行插值扫描的同时，能够对下一个图元进行初始化，提高图元渲染的效率，采用并行扫描方式对图元进行插值扫描，可加速图元的渲染。

本文档来自技高网...

【技术保护点】

1.一种嵌入式GPU的低功耗光栅化设计方法，其特征在于，包括：

2.根据权利要求1所述的嵌入式GPU的低功耗光栅化设计方法，其特征在于，所述接收视窗变换下发的数据，对所述数据进行解析，采用通用数据存储方式对解析出的图元数据进行存储，包括：

3.根据权利要求2所述的嵌入式GPU的低功耗光栅化设计方法，其特征在于，所述将图元数据采用通用数据存储方式存储于电路结构的存储空间中，包括：

4.根据权利要求1所述的嵌入式GPU的低功耗光栅化设计方法，其特征在于，所述图元的初始化参数包括边界函数的初始值和偏移量、属性的透视校正初始值和偏移量以及三角形面积及面积倒数计算；

5.根据权利要求2所述的嵌入式GPU的低功耗光栅化设计方法，其特征在于，所述采用并行扫描方式对图元进行插值扫描，包括：

6.根据权利要求5所述的嵌入式GPU的低功耗光栅化设计方法，其特征在于，所述当为点图元时，按照逐点扫描算法扫描，包括：

7.根据权利要求5所述的嵌入式GPU的低功耗光栅化设计方法，其特征在于，所述当为线图元时，按照改进后的Bresenham算法扫描，包括：

8.根据权利要求5所述的嵌入式GPU的低功耗光栅化设计方法，其特征在于，所述当为三角形图元时，按照多扫描块并行扫描算法扫描，包括：

9.根据权利要求5所述的嵌入式GPU的低功耗光栅化设计方法，其特征在于，所述对视窗变换后的图元进行光栅化处理，得到离散片段，对片段进行着色，包括：

10.根据权利要求1所述的嵌入式GPU的低功耗光栅化设计方法，其特征在于，所述顶点着色器和所述片段着色器分别是基于流多处理器SMPU对顶点进行着色和对片段进行着色。

...

【技术特征摘要】

1.一种嵌入式gpu的低功耗光栅化设计方法，其特征在于，包括：

2.根据权利要求1所述的嵌入式gpu的低功耗光栅化设计方法，其特征在于，所述接收视窗变换下发的数据，对所述数据进行解析，采用通用数据存储方式对解析出的图元数据进行存储，包括：

3.根据权利要求2所述的嵌入式gpu的低功耗光栅化设计方法，其特征在于，所述将图元数据采用通用数据存储方式存储于电路结构的存储空间中，包括：

4.根据权利要求1所述的嵌入式gpu的低功耗光栅化设计方法，其特征在于，所述图元的初始化参数包括边界函数的初始值和偏移量、属性的透视校正初始值和偏移量以及三角形面积及面积倒数计算；

5.根据权利要求2所述的嵌入式gpu的低功耗光栅化设计方法，其特征在于，所述采用并行扫描方式对图元进行插值扫描，包括：

6....

【专利技术属性】
技术研发人员：张彦芳，秦泰，呙涛，
申请(专利权)人：武汉凌久微电子有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人