退役队列压缩制造技术

技术编号:33426968 阅读:11 留言:0更新日期:2022-05-19 00:18
公开了用于将多个指令操作一起压缩到单个退役队列条目中的系统、装置和方法。处理器至少包括调度器、退役队列、一个或多个执行单元和控制逻辑。当控制逻辑检测到给定指令操作被调度器分派给执行单元时,控制逻辑确定给定指令操作是否满足与一个或多个其他指令操作压缩到单个退役队列条目中的一个或多个条件。如果满足所述一个或多个条件,则两个或更多个指令操作一起存储在单个退役队列条目中。通过将多个指令操作一起压缩到单独的退役队列条目中,能够更有效地使用退役队列,并且处理器可以推测性地执行更多指令,而不会让退役队列耗尽其可用条目的供应。耗尽其可用条目的供应。耗尽其可用条目的供应。

【技术实现步骤摘要】
【国外来华专利技术】退役队列压缩

技术介绍

[0001]相关技术的描述
[0002]处理器流水线包括对正执行的指令进行操作的许多不同的单元。这些单元包括解码单元、调度器单元、拣选器和执行单元。解码单元将提取的指令解码为指令操作。指令操作在本文中又被称为“操作”或“op”。一般而言,op是执行单元中包括的硬件能够执行的操作。在各种实现方式中,每个指令转换为一个或多个操作,该一个或多个操作在被执行时导致执行根据指令集架构针对该指令定义的操作。
[0003]无序处理器需要分派的操作的有序队列,以在操作退役时按顺序更新架构状态。该有序队列在本文中被称为“退役队列”。此外,如本文所使,术语“退役”定义为利用操作的结果来更新处理器的架构状态,同时也释放为该操作分配的临时存储位置。在一些处理器中,复杂指令在分派到执行单元时分解成一个或多个操作,以便限制调度器、算术逻辑和地址生成单元的复杂性。例如,在x86指令集架构(ISA)中,许多指令都支持加载

执行

存储形式。加载

执行

存储形式包括从存储器加载值,对该值执行操作,并且然后将结果写回存储器。这可以作为多达三个操作(诸如加载、算术操作和存储)分派给调度单元。通常,每个分派的操作都会消耗退役队列条目。因此,单个指令可能会消耗多个退役队列条目。这意味着退役队列中可用条目的供应可能很快耗尽。当发生该情况时,处理器将停滞,直到有更多的退役队列条目变得可用。退役队列中的条目的可用性限制了推测处理器可以在多大程度上操作,这影响处理器的性能(例如,每周期指令(IPC))。
附图说明
[0004]通过结合附图参照以下描述,可更好地理解本文描述的方法和机制的优点,在附图中:
[0005]图1是计算系统的一个实现方式的框图。
[0006]图2是处理器流水线的一个实现方式的框图。
[0007]图3示出了根据一个实现方式的用于确定op是否可以压缩到退役队列条目中的表。
[0008]图4示出了根据一个实现方式的用于追踪op到退役队列条目中的潜在压缩性的表的另一个示例。
[0009]图5是保留站的一个实现方式的框图。
[0010]图6是示出用于将指令操作压缩到退役队列条目中的方法的一个实现方式的一般化流程图。
[0011]图7是示出用于将中间数据存储在保留站中的方法的一个实现方式的一般化流程图。
[0012]图8是示出用于在多个指令操作间共享保留站条目的方法的一个实现方式的一般化流程图。
[0013]图9是示出用于减少指令操作使用的物理寄存器的数量以便提高退役队列条目的
压缩性的方法的一个实现方式的一般化流程图。
[0014]图10是示出用于广播来自执行单元的结果数据的方法的一个实现方式的一般化流程图。
具体实施方式
[0015]在以下描述中,阐述了众多具体细节以提供对本文呈现的方法和机制的透彻理解。然而,本领域普通技术人员应认识到,可在没有这些具体细节的情况下实践各种实现方式。在一些情况下,并未详细示出众所周知的结构、部件、信号、计算机程序指令和技术,以避免混淆本文所述的方法。应了解,为了说明的简洁性和清晰性,附图中所示出的元件不一定按比例绘制。例如,一些元件的尺寸可能相对于其他元件被放大。
[0016]本文中公开了用于压缩退役队列条目的各种系统、装置和方法。一种系统包括耦接到一个或多个存储器的一个或多个处理器。每个处理器至少包括调度器、退役队列、一个或多个执行单元和控制逻辑。由于减少指令消耗的退役队列条目的数量将有利于处理器性能,因此控制逻辑试图将多个指令操作一起压缩到单个退役队列条目中。因此,在一个实现方式中,当控制逻辑检测到给定指令操作被调度器分派给执行单元时,控制逻辑确定第一指令操作是否满足与一个或多个其他指令操作压缩到单个退役队列条目中的一个或多个条件。压缩指令操作的一个或多个条件可以包括指令操作一起被分派、指令操作不超过单个退役队列条目中的可用字段、指令操作能够一起退役、重定向操作不可能存在于指令操作之间和/或其他条件。如果满足这些条件,则两个或更多个指令操作一起存储在单个退役队列条目中。通过将多个指令操作一起压缩到单独的退役队列条目中,能够更有效地使用退役队列,并且处理器可以推测性地执行更多指令,而不会让退役队列耗尽其可用条目的供应。
[0017]现在参照图1,示出了计算系统100的一个实现方式的框图。在一个实现方式中,计算系统100至少包括处理器105A

105N、输入/输出(I/O)接口120、总线125、存储器控制器130、网络接口135和存储器设备140。在其他实现方式中,计算系统100包括其他部件,和/或计算系统100不同地布置。处理器105A

105N表示系统100中包括的任意数量的处理器。
[0018]在一个实现方式中,处理器105A是通用处理器,诸如中央处理单元(CPU)。在一个实现方式中,处理器105N是具有高度并行架构的数据并行处理器。数据并行处理器包括图形处理单元(GPU)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)等等。在一些实现方式中,处理器105A

105N包括多个数据并行处理器。
[0019]存储器控制器130表示可由耦接到I/O接口120的处理器105A

105N和I/O设备(未示出)访问的任何数目和类型的存储器控制器。存储器控制器130耦接到任何数量和类型的存储器设备140。存储器设备140表示任何数量和类型的存储器设备。例如,存储器设备140中的存储器的类型包括动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、NAND闪存存储器、NOR闪存存储器、铁电随机存取存储器(FeRAM)等。
[0020]I/O接口120表示任何数量和类型的I/O接口(例如,外围部件互连(PCI)总线、PCI扩展(PCI

X)、PCIE(PCI Express)总线、吉比特以太网(GBE)总线、通用串行总线(USB))。各种类型的外围设备(未示出)耦接到I/O接口120。此类外围设备包括(但不限于)显示器、键盘、鼠标、打印机、扫描仪、操纵杆或其他类型的游戏控制器、媒体记录设备、外部存储设备、
网络接口卡等。网络接口135用于跨网络接收和发送网络消息。
[0021]在各种实现方式中,计算系统100是计算机、膝上型计算机、移动设备、游戏机、服务器、流式传输设备、可穿戴设备或各种其他类型的计算系统或设备中的任一种。应注意,计算系统100的部件的数量因实现方式而不同。例如,在其他实现方式中,存在与图1所示的数量相比更多或更少的每种部件。还应注意,在其他实现方式中,计算系统100包括图1中未示出的其他部件。另外,在其他实现方式中,计算系统100以与图1中所示不同的其他方式进行结构化。
[0022]现在转向图2,示出了处理器流水线200的一个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种处理器,所述处理器包括:退役队列,所述退役队列被配置为存储与未退役的指令操作相对应的条目;以及控制逻辑,所述控制逻辑被配置为:接收待存储在所述退役队列中的第一指令操作和第二指令操作;以及响应于确定所述第一指令操作和所述第二指令操作满足一起压缩到单个退役队列条目中的一个或多个条件,将所述第一指令操作和所述第二指令操作一起压缩到单个退役队列条目中。2.根据权利要求1所述的处理器,其中所述一个或多个条件包括:第一条件:允许所述第一指令操作和所述第二指令操作在架构上一起退役,以及第二条件:由所述第一指令操作和所述第二指令操作引起的对所述处理器的架构状态的所有更新都能够在单个退役队列条目中进行追踪。3.根据权利要求2所述的处理器,其中所述一个或多个条件还包括:第三条件:所述第一指令操作和所述第二指令操作被一起分派。4.根据权利要求3所述的处理器,其中所述一个或多个条件还包括:第四条件:所述第一指令操作比所述第二指令操作更老。5.根据权利要求4所述的处理器,其中所述一个或多个条件还包括:第五条件:所述第一指令操作与所述第二指令操作之间不能够发生程序重定向。6.根据权利要求1所述的处理器,其中所述控制逻辑还被配置为响应于确定三个或更多个指令操作满足所述一个或多个条件而将所述三个或更多个指令操作存储在单个退役队列条目中。7.根据权利要求1所述的处理器,其中所述处理器还被配置为将所述第一指令操作的中间输出存储在保留站条目中,而不是存储在物理寄存器中。8.一种方法,所述方法包括:接收待存储在退役队列中的第一指令操作和第二指令操作;以及响应于确定所述第一指令操作和所述第二指令操作满足一起压缩到单个退役队列条目中的一个或多个条件,将所述第一指令操作和所述第二指令操作一起压缩到单个退役队列条目中。9.根据权利要求8所述的方法,其中所述一个或多个条件包括:第一条件:允许所述第一指令操作和所述第二指令操作在架构上一起退役,以及第二条件:由所述第一指令操作和所述第二指令操作引起的对处理器架构状态的所有更新都能够在单个退役队列条目...

【专利技术属性】
技术研发人员:马修
申请(专利权)人:超威半导体公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1