【技术实现步骤摘要】
最小侵入性指令指针-察觉处理资源活动概要分析的方法和设备
实施例一般涉及数据处理,并且更特定地涉及经由设备(例如,通用图形处理单元)的最小侵入性指令指针-察觉处理资源活动概要分析(awareprocessingresourceactivityprofiling)。
技术介绍
当前的并行图形数据处理包含开发用于对图形数据执行特定操作的系统和方法,所述特定操作例如线性插值、曲面细分(tessellation)、栅格化(rasterization)、纹理映射、深度测试等。传统上,图形处理器使用固定功能计算单元来处理图形数据;但是,更近一些,图形处理器的某些部分已变得可编程,从而使此类处理器可支持用于处理顶点和片段数据的各种各样的操作。为了进一步提高性能,图形处理器通常实现诸如流水线技术(pipelining)之类的处理技术,这些技术试图在整个图形流水线的不同部分中并行处理尽可能多的图形数据。具有单指令多线程(SIMT)架构的并行图形处理器被设计成使图形流水线中的并行处理量最大化。在SIMT架构中,并行线程的群组尝试尽可能频繁地一起同步执行程序指令,以提高处理效率。对于SIMT架构的软件和硬件的总体概述,可在ShaneCook的CUDAProgramming第3章,第37-51页(2013)中找到。附图说明为了可详细地理解本实施例的上述特征的方式,可通过参考实施例来得到对上文简要概述的实施例的更特定描述,其中一些实施例在附图中示出。然而,要注意,附图仅示出了典型的实施例,并且因此不应被 ...
【技术保护点】
1.一种图形处理器,包括:/n处理资源的分组;和/n与所述处理资源的分组相关联的控制逻辑,所述控制逻辑被配置成对所述处理资源的分组中的至少一个处理资源的状态进行采样并根据所述状态来确定活动数据,其中所述活动数据包含以下至少一项:停顿活动的停顿和原因计数、指令类型、流水线利用率、线程利用率或着色器活动。/n
【技术特征摘要】
20190927 US 16/5854271.一种图形处理器,包括:
处理资源的分组;和
与所述处理资源的分组相关联的控制逻辑,所述控制逻辑被配置成对所述处理资源的分组中的至少一个处理资源的状态进行采样并根据所述状态来确定活动数据,其中所述活动数据包含以下至少一项:停顿活动的停顿和原因计数、指令类型、流水线利用率、线程利用率或着色器活动。
2.根据权利要求1所述的图形处理器,还包括:
与所述处理资源的分组相关联的高速缓存单元,所述高速缓存单元用于接收包含与所述高速缓存单元相关联的处理资源的每种状态的停顿原因的所述活动数据和指令指针地址。
3.根据权利要求2所述的图形处理器,其中,对状态的每个采样在选定的时钟周期内被调度,并且是最小侵入性的。
4.根据权利要求1所述的图形处理器,其中,所述控制逻辑被配置成当在处理资源上分配线程而在被采样的选定周期内没有指令被执行时存储状态。
5.根据权利要求4所述的图形处理器,其中,所述控制逻辑被配置成如果所述处理资源是空闲的或正在执行指令,则在被采样的选定周期内丢弃状态。
6.根据权利要求1所述的图形处理器,其中所述控制逻辑被配置成:在所述处理资源的分组和处理资源的其它分组之间交织对处理资源的状态的采样,以将所述状态解析为多个支持的停顿原因之一,并基于所述停顿原因的优先级等级对所述支持的停顿原因按优先顺序排列。
7.根据权利要求1所述的图形处理器,其中停顿活动的所支持的停顿和原因计数包括用于线程之间到达公共点的停顿或延迟的同步停顿字段、用于被停顿的来自存储器的指令获取的指令获取字段、用于基于数据相关性的停顿的记分板字段、用于对处理资源的发送总线带宽限制的发送停顿字段、用于流水线内的停顿的管道停顿字段、以及用于由存储体冲突引起的停顿的内部停顿字段。
8.一种高速缓存结构,包括:
用于执行所述高速缓存结构的操作的逻辑;以及
与所述逻辑耦合的存储器,所述存储器用于存储指令指针地址和相关联的数据字段以指示来自处理资源的采样的活动数据,其中所述逻辑被配置成接收与所述高速缓存结构相关联的处理资源的状态的活动数据和指令指针地址。
9.根据权利要求8所述的高速缓存结构,其中所述逻辑被配置成在所述高速缓存结构内执行指令指针地址查找。
10.根据权利要求9所述的高速缓存结构,其中所述逻辑被配置成:当所述指令指针查找未命中时,为新的高速缓存行构建条目,以将所述指令指针地址和所述活动数据存储在所述新的高速缓存...
【专利技术属性】
技术研发人员:M科尔,A库里莱夫,S迈于兰,V韦姆拉帕利,S瓦德拉马尼,P赖特,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。