当前位置: 首页 > 专利查询>英特尔公司专利>正文

高性能互连相干协议制造技术

技术编号:11091493 阅读:75 留言:0更新日期:2015-02-26 20:29
接收一请求,该请求引用第一代理且请求特定存储器行在独占状态中被高速缓存。监听请求被发送指向一个或多个其他代理。接收到引用第二代理的监听响应,监听响应包括将对应于特定存储器行的已修改高速缓存行写回至存储器。发送完成以定址至第一代理,其中完成包括基于写回的特定存储器行的数据。

【技术实现步骤摘要】
【国外来华专利技术】高性能互连相干协议 技术 本公开案一般涉及计算机开发领域,尤其涉及包括协调相互依赖的受约束系统的 软件开发。 背景 半导体处理和逻辑设计中的进展允许增加集成电路器件上存在的逻辑的数量。计 算机系统配置必然已经从系统中的单个或多个集成电路演进为个别集成电路上存在的多 核、多硬件线程及多逻辑处理器,以及这种处理器内集成的其他接口。处理器或集成电路一 般包括单个物理处理器模,其中处理器模可包括任何数量的核、硬件线程、逻辑处理器、接 口、存储器、控制器中枢等。 作为在较小的封装包内适配更多处理能力的较高能力的结果,较小的计算设备越 来越流行。智能电话、平板电脑、超薄笔记本电脑及其他用户设备呈指数型增长。然而,这些 较小设备依赖于服务器来进行数据存储以及超出规格的复杂处理。因而,也增加了对高性 能计算市场(即,服务器空间)的需求。例如,在现代服务器中,一般不仅存在具有多个核 的单个处理器,也存在多个物理处理器(也称为多个插槽(socket))来提高计算能力。但 随着处理能力随着计算系统中设备数量而增长,插槽及其他设备间的通信变得更为关键。 实际上,互连已经从主要处理电子通信的较传统的多点总线增长为便于快速通信 的全面互连基础结构。不幸的是,由于存在对将来处理器以甚至更高速率进行消耗的需求, 对现有互连基础结构的能力也存在相应的需求。 附图简述 图1示出按照一实施例的系统的简化框图,该系统包括一系列点对点互连以连接 计算机系统中的多个I/O设备; 图2示出按照一实施例的分层协议栈的简化框图; 图3示出事务描述符的实施例。 图4示出串行点对点链路的实施例。 图5示出潜在的高性能互连(HPI)系统配置的多个实施例。 图6不出与HPI相关联的分层协议栈的实施例。 图7示出示例相干协议冲突管理的流程图。 图8示出另一示例相干协议冲突管理的流程图。 图9示出另一示例相干协议冲突管理的流程图。图10示出具有到存储器的写回的示例监听响应的流程图。 图11示出具有到存储器的写回的监听响应的另一示例的流程图。 图12示出示例写回冲刷操作的流程图。 图13示出到存储器的示例写回的流程图。 图14示出示例存储器控制器冲刷操作的流程图。 图15-17示出示例协议状态表的表示。 图18示出协议状态表的示例嵌套的表示。 图19示出由示例测试引擎使用一组协议状态表的表示。 图20示出由示例测试引擎使用一组协议状态表的表示。 图21示出包括多核处理器的计算系统的框图的实施例。 各附图中的相同附图标记和名称表示相同的元件。 详细描述 在以下描述中,提出了许多具体细节以便更透彻地理解本专利技术,诸如具体处理器 和系统配置类型、具体硬件结构、具体结构和微结构细节、具体寄存器配置、具体指令类型、 具体系统组件、具体处理器流水线阶段、具体互连层、具体分组/事务配置、具体事务名称、 具体协议交换、具体链路宽度、具体实现方式以及操作等等的多个示例。然而,对于本领域 技术人员显而易见的是,不需要必须采用这些具体细节来实现本公开案的主题。在其他情 况下,为避免不必要地混淆本公开案,已经避免了已知组件或方法的非常详细的描述,所述 组件或方法诸如具体的和替代的处理器体系结构、所述算法的具体逻辑电路/代码、具体 固件代码、低级互连操作、具体逻辑配置、具体制造技术和材料、具体编译器实现、算法用代 码的具体表达、具体掉电和门控技术/逻辑以及计算机系统的其他具体操作细节。 尽管可以参照具体集成电路(诸如计算平台或微处理器)中的能量保存、能量效 率、处理效率等来描述以下实施例,然而其他实施例可应用于其他类型的集成电路和逻辑 器件。这里所述的实施例的类似技术和原理可应用于也受益于这些特征的其他类型的电路 或半导体器件。例如,所公开的实施例不限于服务器计算机系统、台式计算机系统、膝上型 计算机、超级本(Ultrabooks)?,而可以用于其他设备中,诸如手持设备、智能电话、平板电 脑、其他薄型笔记本电脑、芯片上系统(SOC)设备及嵌入式应用。手持设备的一些示例包括 蜂窝电话、网际协议设备、数码相机、个人数字助理(PDA)及手持式PC。这里,用于高性能互 连的类似技术可应用于增加低功率互连中的性能(或甚至节省功率)。嵌入式应用一般包 括微控制器、数字信号处理器(DSP)、芯片上系统、网络计算机(NetPC)、机顶盒、网络中枢、 广域网(WAN)交换机或者可执行以下教导的功能和操作的任何其他系统。此外,这里所描 述的装置、方法和系统不限于物理计算设备,而是也关于用于能量节省和效率的软件优化。 从以下描述中可显而易见,这里所描述的方法、装置和系统的实施例(无论是参照硬件、固 件、软件或其组合)可被视为对于以性能考虑因素平衡的绿色技术将来是关键的。 随着计算系统的进步,其中的组件变得更为复杂。用于在多个组件间耦合和通信 的互连体系结构的复杂度也增加,以确保对于最佳组件操作满足带宽需求。而且,不同的细 分市场要求互连体系结构的不同方面来适合于相应的市场。例如,服务器要求较高性能,而 移动生态系统有时能为节省功率而牺牲总性能。大多数构造的单一目的仍然是以最大的功 率节省来提供最高的可能性能。而且,各种不同的互连可能潜在地受益于这里描述的主题。 例如,在其他示例中,外围组件互连(PCI)Express(快速)(PCIe)互连构造体系结构和快速 路径互连(QPI)构造体系结构可以根据这里描述的一个或多个原理得到潜在的改进。 图1示出由互连一组组件的多个点对点链路组成的构造的一个实施例。系统100 包括与控制器中枢115耦合的处理器105和系统存储器110。处理器105可以包括任何处 理元件,诸如微处理器、主机处理器、嵌入式处理器、协处理器或其他处理器。处理器105通 过前端总线(FSB) 106耦合至控制器中枢115。在一实施例中,FSB106是如下所述的串行 点对点互连。在另一实施例中,链路106包括与不同的互连标准相兼容的串行差分互连体 系结构。 系统存储器110包括任何存储器设备,诸如随机存取存储器(RAM)、非易失性(NV) 存储器、或可由系统100内的设备访问的其他存储器。系统存储器110通过存储器接口 116 耦合至控制器中枢115。存储器接口的示例包括双数据速率(DDR)存储器接口、双通道DDR 存储器接口以及动态RAM(DRAM)存储器接口。 在一实施例中,控制器中枢115可包括诸如PCIe互连层次结构中的根中枢(root hub)、根复合体(rootcomplex)或根控制器。控制器中枢115的示例包括芯片集、存储器 控制器中枢(MCH)、北桥、互连控制器中枢(ICH)、南桥以及根控制器/中枢。通常术语芯片 集是指两个物理上分开的控制器中枢,例如与互连控制器中枢(ICH)耦合的存储器控制器 中枢(MCH)。注意到,当前的系统通常包括与处理器105集成的MCH,而控制器115要以以 下描述的类似方式与1/0设备通信。在一些实施例中,通过根复合体115任选地支持对等 路由。 这里,控制器中枢115通过串行链路119耦合至交换机/桥120。输入/输出模块 117和121也可称为接口 /端口 117和121,输入/输出模块117和121可包括/实现分层 的协议栈以便在控制器本文档来自技高网...
高性能互连相干协议

【技术保护点】
一种装置,包括:包括协议层逻辑的特定代理,用于:接收引用第一代理以及请求特定存储器行在独占状态中被高速缓存的请求;发送旨在给一个或多个其他代理的监听请求;接收引用第二代理的监听响应,监听响应包括将与所述特定存储器行对应的已修改的高速缓存行写回至存储器;以及发送完成以被定址到第一代理,其中所述完成包括基于写回的特定存储器行的数据。

【技术特征摘要】
【国外来华专利技术】2012.10.22 US 61/717,0911. 一种装置,包括: 包括协议层逻辑的特定代理,用于: 接收引用第一代理以及请求特定存储器行在独占状态中被高速缓存的请求; 发送旨在给一个或多个其他代理的监听请求; 接收引用第二代理的监听响应,监听响应包括将与所述特定存储器行对应的已修改的 高速缓存行写回至存储器;以及 发送完成以被定址到第一代理,其中所述完成包括基于写回的特定存储器行的数据。2. 如权利要求1所述的装置,其特征在于,所述协议层逻辑还使已修改的高速缓存行 被写至特定存储器行。3.如权利要求1所述的装置,其特征在于,所述协议层逻辑还确定第二代理的高速缓 存行是已修改的高速缓存行。4.如权利要求3所述的装置,其特征在于,基于确定第二代理的高速缓存行是已修改 的高速缓存行,所述完成在接收到对与来自第一代理的请求相对应的所有监听请求的响应 之前被发送。5.如权利要求1所述的装置,其特征在于,监听请求包括监听无效请求。6.如权利要求5所述的装置,其特征在于,所述监听无效请求使对应于特定行或存储 器的接收另一代理的高速缓存无效。7.如权利要求5所述的装置,其特征在于,所述监听无效请求标识特定存储器行以及 来自第一代理的请求中所包括的命令。8. 如权利要求1所述的装置,其特征在于,所述协议层逻辑还转换目录状态以指示特 定存储器行与独占状态相关联。9. 一种装置,包括: 包括协议层逻辑的代理,用于: 发送对独占状态下的特定高速缓存行的请求;以及 从存储器接收对应于所述特定高速缓存行的数据,其中所述特定数据包括由另一代理 在请求之后写回存储器的数据。10.如权利要求9所述的装置,其特征在于,特定高速缓存行在请求之前处于无效状 态。11.如权利要求9所述的装置,其特征在于,所述独占状态是E状态,指示特定高速缓存 行中的数据的副本与存储器相匹配并且是独占副本。12.如权利要求9所述的装置,其特征在于,所述协议层逻辑还将特定数据复制到特定 高速缓存行。13.如权利要求12所述的装置,其特征在于,所述协议层逻辑还基于接收到特定数据 而将特定高速缓存行转换至独占状态。14.如权利要求9所述的装置,其特征在于,由另一代理写回存储器的数据包括响应于 和对独占状态中的特定高速缓存行的请求相对应的监听而返回的数据。15.如权利要求14所述的装置,其特征在于,监听是多个监听之一,特定数据在针对每 一个监听请求返回响应之前被接收。16. -种方法,包括: 从第一代理接收在独占状态中高速缓存特定存储器行的请求; 发送监听请求至一个或多个其他代理; 从第二代理接收监听响应,所述监听响应包括将第二代理的对应于特定存储器行的已 修改高速缓存行写回至存储器;以及 发送完成至第一代理,其中所述完成包括基于所述写回的特定存储器行的数据。17. 如权利要求16所述的方法,其特征在于,还包括:发送请求至存储器控制器以将已 修改高速缓存行写至特定存储器行。18. 如权利要求16所述的方法,其特征在于,还包括确定第二代理的高速缓存行是已 修改高速缓存行。19. 如权利要求16所述的方法,其特征在于,所述完成在接收到对和来自第一代理的 请求相对应的所有监听响应的响应之前被发送。20. 如权利要求16所述的方法,其特征在于,还包括转换目录状态以指示特定存储器 行与独占状态相关联。21. -种系统,包括: 具有特定存储器位置的存储器控制器; 对应于所述特定存储器位置的归属代理;以及 第一设备的第一高速缓存代理; 其中所述归属代理用于: 接收引用第一代理以及请求特定存储器行在独占状态中被高速缓存的请求; 发送旨在给一个或多个其他代理的监听请求; 接收引用第二代理的监听响应,所述监听响应包括将与所述特定存储器行对应的已修 改的高速缓存行写回至存储器;以及 发送完成以被定址到第一代理,其中所述完成包括基于所述写回的特定存储器行的数 据。22. 如权利要求21所述的装置,其特征在于,还包括第二高速缓存代理,用于: 接收监听请求; 从监听请求中标识来自第一高速缓存代理的请求以便在独占状态中高速缓存特定存 储器位置的特定行; 将监听响应发送至归属代理。23. 如权利要求21所述的系统,其特征在于,所述第一高速缓存代理用于: 发送请求至归属代理;以及 接收所述完成; 将特定存储器行的数据写入至相应的高速缓存行;以及 将相应的高速缓存行转换成独占状态。24. 如权利要求21所述的系统,其特征在于,来自所述第一高速缓存代理的请求包括 相干协议请求。25. 如权利要求21所述的系统,其特征在于,所述完成在接收到对与来自第一代理的 请求相对应的所有监听请求的响应之前被发送。26. -种装置,包括: 包括协议层逻辑的代理,用于: 接收显式写回请求,其中所述显式写回请求对应于和特定存储器行相对应的已修改 高速缓存行,并且所述显式写回请求包括用以指示另一高速缓存要请求特定存储器行的暗 示; 确定是否在将已修改高速缓存行的数据写至特定存储器行之前,将已修改高速缓存行 的数据推至其他高速缓存;以及 发送完成以对应于显式写回请求。27. 如权利要求26所述的装置,其特征在于,确定不要推送数据使已修改高速缓存行 的数据被写至特定存储器行。28. 如权利要求27所述的装置,其特征在于,已修改高速缓存行的数据不被推至所述 另一_速缓存。29. 如权利要求27所述的装置,其特征在于,所述协议层逻辑还将对应于特定存储器 行的目录状态自独占状态转换成无效状态。30. 如权利要求26所述的装置,其特征在于,确定要推送数据使已修改高速缓存行的 数据被发送至对应于所述另一高速缓存的第一高速缓存代理,以使已修改高速缓存行的数 据被写至所述另一高速缓存的相应的高速缓存行。31. 如权利要求30所述的装置,其特征在于,所述协议层逻辑还将对应于特定存储器 行的目录状态转换为指示所述另一高速缓存具有特定存储器行的独占副本的状态。32. 如权利要求3...

【专利技术属性】
技术研发人员:R·G·布朗肯希普B·法西姆R·比尔斯YC·刘V·基塔H·H·胡姆J·维利
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1