【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本公开内容要求于2013年10月14日提交的美国临时专利申请No.61/890,583的优先权和权益,将其整体通过引用并入本文中。
在本专利文档中描述的技术大体涉及图形处理,并且更具体地涉及对图形处理单元的功率管理。
技术介绍
图形处理单元(GPU)常常包括并行结构,该并行结构通过快速地执行一系列基元操作并将得到的图像显示在图形显示器上来高效地操纵图形对象。GPU已经被使用在诸如移动电话、个人计算机、工作站、以及游戏控制台的许多电子设备中。
技术实现思路
根据本文中描述的教导,提供了用于图形处理单元(GPU)的频率调整的系统和方法。一种系统包括:命令解析器,被配置为解析与一个或多个未来GPU操作相关联的一个或多个命令以获得命令信息;处理部件,被配置为至少部分地基于命令信息来确定用于未来GPU操作的操作时间;以及频率控制部件,被配置为至少部分地基于用于未来GPU操作的操作时间来调整GPU频率。在一个实施例中,提供了一种用于图形处理单元(GPU)的频率调整的方法。解析与未来GPU操作相关联的一个或多个命令以获得命令信息。至少部分地基于命令信息来确定用于未来GPU操作的操作时间。至少部分地基于用于未来GPU操作的操作时间来调整GPU频率。在另一实施例中,提供了一种用于图形处理单元(GPU)的频率调整的计算机实施的系统。该系统包括一个或多个数据处理器和计算 >机可读存储介质。该存储介质被编码有用于命令一个或多个数据处理器来执行某些操作的指令。解析与未来GPU操作相关联的一个或多个命令以获得命令信息。至少部分地基于命令信息来确定用于未来GPU操作的操作时间。至少部分地基于用于未来GPU操作的操作时间来调整GPU频率。附图说明图1-图4描绘了示出用于GPU频率调整的系统的示例图。图5描绘了示出用于GPU频率调整的系统的示例框图。图6描绘了用于GPU频率调整的示例流程图。具体实施方式可以采用许多不同的方法来改善图形处理单元(GPU)的性能,例如增加更多着色器(shader)、更多内核以及更多处理单元,执行更多纹理压缩,以及增大GPU的运行频率。然而,伴随着这样的性能改善,GPU的功率消耗常常明显增大。为了在减少功率消耗的同时实现高效图形处理,可以在采样窗口(例如,100ms)期间监视GPU的工作负载,并且根据所采样的工作负载来调整GPU的运行频率。例如,如果所采样的工作负载高,则可以增大GPU的运行频率。相反地,如果所采样的工作负载低,则可以减小GPU的运行频率。这样的基于采样的功率管理使得GPU的运行频率要基于GPU的过去工作负载来被调整,这可能导致例如在对波动的工作负载的处理期间对工作负载改变的延迟响应。图1描绘了示出用于GPU频率调整的系统的示例图。如图1所示,与未来GPU操作相关联的一个或多个命令102被分析以用于预测用于未来GPU操作的操作时间104,并且根据所预测的操作时间104来调整GPU运行频率。具体地,操作时间预测部件106(例如,在预测时间段期间)至少部分地基于命令102来确定操作时间104。频率控制部件108根据所预测的操作时间104来确定频率调整110,使得GPU运行频率针对由操作时间104指示的预测的未来工作负载而被调整。如图2所示,操作时间预测部件106包括命令解析器202和处理部件204。具体地,命令解析器204分析命令102以获得命令信息206,并且处理部件204至少部分地基于命令信息206来确定操作时间104。对操作时间104的预测还可以将根据先前GPU操作的历史信息考虑在内。如图3所示,历史信息部件208生成历史信息210,并且处理部件204使用命令信息206和历史信息210两者来确定所预测的操作时间104。处理部件204可以通过估计GPU带宽和GPU周期来确定操作时间104。在一些实施例中,命令102包括与三维GPU操作相关的一个或多个三维命令。针对三维命令,命令信息206包括:清晰范围(C.w,C.h)、顶点计数(VC)、顶点着色器指令(VSI)、像素着色器指令(PSI)、以及纹理的每像素平均字节数(tbpp)等等。历史信息210包括:顶点切割率(VCR)、三角形剔除率(TCR)、每三角形像素(PPT)、采样的纹理像素(TPS)、以及深度测试通过率(DTPR)等等。处理部件204使用命令信息206和历史信息210两者来确定操作时间104:Tbusy=max(TSIfshader×SC,TMBTB)---(1)]]>其中,Tbusy表示操作时间104,TSI表示总GPU着色器指令,fshader表示着色器频率,SC表示着色器计数,TMB表示总GPU存储器带宽,并且TB表示与三维命令相关联的GPU总带宽。具体地,处理部件204如下来确定三角形计数(TC):TC=(VC-VCR)a×(1-TCR)---(2)]]>其中,VC表示顶点数,VCR表示顶点切割率,TCR表示三角形剔除率,并且a表示第一恒定参数。例如,对于三角形,a等于3,并且对于三角形条带和三角形扇,a等于1。此外,处理部件204如下来确定像素计数(PC):PC=TC×PPT(3)其中,PPT表示每三角形像素。处理部件204如下来确定总GPU着色器指令(TSI):TSI=sum(VC×VSI)+sum(PC×DTPR×PSI)(4)其中,VSI表示顶点着色器指令,DTPR表示深度测试通过率,PSI表示像素着色器指令,并且sum表示求和运算。另外,处理部件204如下来确定总GPU存储器带宽(TMB):TMB=((C.w×C.h)×b+PC×DTPR)×bpp+PC×TPS×tbpp(5)其中,(C.w,C.h)表示清晰范围,bpp表示每像素字节数,tbpp表示纹理的每像素平均字节数,TPS表示采样的纹理像素,并且b表示第二恒定参数。在某些实施例中,命令102包括与二维GPU操作相关的一个或多个二维命令(例如,复制、缩放、旋转、缩放并旋转、滤波等等)。针对二维命令,命令信息206包括:源宽度、源高度、源格式、源图像的每像素字节数(SBPP)、目的宽度、目的高度、目的格式、目的图像的每像素字节数(DBPP)、源图像的像素计数(PSB)、目的图像的像素计数(PDB)、滤波器质量、旋转角度、缩放参数等等。处理部件204如下来确定本文档来自技高网...
【技术保护点】
一种用于图形处理单元(GPU)的频率调整的系统,所述系统包括:命令解析器,被配置为解析与一个或多个未来GPU操作相关联的一个或多个第一命令以获得命令信息;处理部件,被配置为至少部分地基于所述命令信息来确定用于所述未来GPU操作的操作时间;以及频率控制部件,被配置为至少部分地基于用于所述未来GPU操作的所述操作时间来调整GPU频率。
【技术特征摘要】
【国外来华专利技术】2013.10.14 US 61/890,5831.一种用于图形处理单元(GPU)的频率调整的系统,所述系统包
括:
命令解析器,被配置为解析与一个或多个未来GPU操作相关联的
一个或多个第一命令以获得命令信息;
处理部件,被配置为至少部分地基于所述命令信息来确定用于所
述未来GPU操作的操作时间;以及
频率控制部件,被配置为至少部分地基于用于所述未来GPU操作
的所述操作时间来调整GPU频率。
2.根据权利要求1所述的系统,还包括:
历史信息部件,被配置为生成与一个或多个先前GPU操作相关联
的历史信息;
其中所述处理部件还被配置为使用所述命令信息和所述历史信息
来确定所述操作时间。
3.根据权利要求2所述的系统,还包括:
性能计数器部件,被配置为确定与所述先前GPU操作相关联的一
个或多个反馈参数并且向所述历史信息部件提供所述反馈参数。
4.根据权利要求2所述的系统,其中:
所述第一命令包括一个或多个三维命令;
所述命令信息包括以下的一项或多项:清晰范围(C.w,C.h)、顶点
计数(VC)、顶点着色器指令(VSI)、像素着色器指令(PSI)以及纹
理的每像素平均字节数(tbpp);并且
所述历史信息包括以下的一项或多项:顶点切割率(VCR)、三角
形剔除率(TCR)、每三角形像素(PPT)、采样的纹理像素(TPS)以
及深度测试通过率(DTPR)。
5.根据权利要求1所述的系统,其中:
所述第一命令包括一个或多个三维命令;并且
所述处理部件还被配置为如下来确定所述操作时间(Tbusy):
Tbusy=max(TSIfshader×SC,TMBTB)]]>其中TSI表示总GPU着色器指令,fshader表示着色器频率,SC表示
着色器计数,TMB表示总GPU存储器带宽,并且TB表示与所述三维
命令相关联的GPU总带宽。
6.根据权利要求5所述的系统,其中:
所述处理部件还被配置为如下来确定三角形计数(TC):
TC=(VC-VCR)a×(1-TCR)]]>其中VC表示顶点计数,VCR表示顶点切割率,TCR表示三角形剔
除率,并且a表示第一恒定参数;
所述处理部件还被配置为如下来确定像素计数(PC):
PC=TC×PPT
其中PPT表示每三角形像素;
所述处理部件还被配置为如下来确定所述总GPU着色器指令
(TSI):
TSI=sum(VC×VSI)+sum(PC×DTPR×PSI)
其中VSI表示顶点着色器指令,DTPR表示深度测试通过率,PSI
表示像素着色器指令,并且sum表示求和运算;并且
所述处理部件还被配置为如下来确定所述总GPU存储器带宽
(TMB):
TMB=((C.w×C.h)×b+PC×DTPR)×bpp+PC×TPS×tbpp
其中(C.w,C.h)表示清晰范围,bpp表示每像素字节数,tbpp表示
纹理的每像素平均字节数,TPS表示采样的纹理像素,并且b表示第二
恒定参数。
7.根据权利要求1所述的系统,其中:
所述第一命令包括一个或多个二维命令;
所述命令信息包括以下的一项或多项:源宽度、源高度、源格
式、源图像的每像素字节数(SBPP)、目的宽度、目的高度、目的格
式、目的图像的每像素字节数(DBPP)、所述源图像的像素计数
\t(PSB)、所述目的图像的像素计数(PDB)、滤波器质量、旋转角度、
以及缩放参数。
8.根据权利要求1所述的系统,其中:
所述第一命令包括一个或多个二维命令;并且
所述处理部件还被配置为如下来确定所述操作时间(Tbusy):
Tbusy=max(CCf2D,TTBTB)]]>其中CC表示与所述二维命令相关联的时钟周期数,f2D表示与所述
二维命令相关联的频率,TTB表示与所述二维命令相关联的总带宽,
并且TB表示与所述二维命令相关联的GPU总带宽。
9.根据权利要求8所述的系统,其中:
所述处理部件还被配置为如下来确定与所述二维命令相关联的所
述总带宽(TTB):
TTB=OB×(1+CP)
其中OB表示原始带宽,并且CP表示缓存代价;并且
所述处理部件还被配置为如下来确定与所述二维命令相关联的所
述时钟周期数(CC):
CC=PD...
【专利技术属性】
技术研发人员:李俊涛,史蒂文·高,
申请(专利权)人:马维尔国际贸易有限公司,
类型:发明
国别省市:巴巴多斯;BB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。