一种用于缩放至少一个微处理器的时钟域的频率和操作电压的方法和装置。尤其,本发明专利技术涉及把微处理器划分成时钟域和单独控制每个时钟域的频率和操作电压的技术。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术的实施例涉及微处理器架构领域。尤其,本专利技术的实施例涉及一种缩放微处理器内的各种功能单元的频率和操作电压的技术。
技术介绍
为了帮助降低微处理器的功率,同时最小化对性能的影响,已经开发了用于降低处理器时钟频率的现有技术。在这些现有技术中,存在把处理器分成多个时钟域的架构。例如,一种现有技术具有用于整数管线的单独时钟域、用于浮点管线的单独时钟域、以及用于存储器存取逻辑的单独时钟域。由于控制每个时钟域所需要的线路的开销,对每条管线和/或存储器存取群集使用单独时钟域能引起维护处理器性能的挑战。附图说明通过示例来例示出实施例和专利技术,但不受附图的限制,附图中相同的引用指示类似的元件,其中图1示出了根据本专利技术的一个实施例的时钟和电压缩放架构。图2示出了能在其中使用本专利技术的一个实施例的前端总线计算机系统。图3示出了能在其中使用本专利技术的一个实施例的点对点计算机系统。专利技术详述本专利技术的实施例涉及用于微处理器的频率和电压控制架构。尤其,本专利技术的实施例涉及在微处理器中多个时钟域之间分配和控制时钟和操作电压的技术,以使每个域的频率和操作电压能被单独地控制。图1示出了根据本专利技术的一个实施例的时钟和电压域架构。尤其,图1示出了已经被划分成三个基本时钟域的处理器架构100前端域101,具有跟踪高速缓冲存储器102、分支预测器103、重命名单元104、解码单元105、定序器106、自由表107、重命名表108、以及重新排序缓冲器(ROB)109;数个后端域110,具有存储器排序缓冲器(MOB)111、一级高速缓冲存储器112、物理寄存器文件113、发出队列(issue queue)114、总线接口116以及执行单元115;以及存储器域,包括二级高速缓冲存储器119。在一个实施例中,总线接口是前端总线接口,而在其他实施例中,它是点对点总线接口。前端域、后端域和存储器域各具有至少一个先进先出(FIFO)队列117,用以帮助同步各个时钟域之间的信息交换。在本专利技术的一个实施例中,至少某些同步队列是在处理器内提供其他功能的队列,然而在其他实施例中,同步队列被用于时钟域控制架构。除了时钟域,本专利技术的一个实施例把处理器分成彼此可被单独控制的电压域。在至少一个实施例中,时钟域和电压域是相同的并且包括相同的功能单元,然而,在其他实施例中,时钟域和电压域不是相同的并且可包括不同的功能单元。在本专利技术的一个实施例中,各个时钟域中的每个时钟能被同步于参考时钟。然而,在其他实施例中,每个域时钟可不与其他域时钟同步。此外,在至少一个实施例中,后端域可通过被称为“交叉开关(crossbar)”的信号相互通信。为了控制每个时钟域和电压域,本专利技术的一个实施例试图通过在某些时间间隔确定每个域的能量和性能来最小化每个域的能量和延迟的平方(delay2)的乘积。在至少一个实施例中,可通过计算在第一时间间隔期间域的能量和延迟以及估算在后一时间间隔域的能量和延迟,在两个时间间隔确定能量和性能。然后,可通过最小化第一时间间隔的能量和延迟的平方(delay2)的乘积与后一时间间隔的能量和延迟的平方(delay2)的乘积的比率,来选择所述后一时间间隔的频率和电压对。例如,在本专利技术的一个实施例中,对于间隔n+1,处理器能量“E”根据以下的等式被估算En+1En=1+EFE,nEn×(Vn+12Vn2-1)]]>在以上的等式中,“EFE,n”是在时间间隔“n”的前端域的能量,“En+1”是在时间间隔n+1的前端的能量,“Vn+1”是在时间间隔n+1的前端域的操作电压,“Vn”是在时间间隔n的前端域的操作电压。作为前端域的频率的函数的处理器的性能能通过使用给定的时间间隔的前端域的时钟频率、前端取指令的速率、微操作(解码的指令)被送交后续管线级的速率来估算。在一个实施例中,根据以下等式估算时间间隔n+1的性能估算“Tn+1”Tn+1Tn=1+(fnfn+1-1)×1-pn1+b]]>在以上的等式中,“pn”是第n个时间间隔的前端队列中的输入项的平均数,“b”是分支错误预测率。值“1+b”是可被装载的取指令队列的速率的指示器,而“1-pn”是队列中输入项的平均数的指示器。“Tn”是在间隔“n”的前端的性能,“fn”是在间隔n的前端域的频率,以及“fn+1”是在下一时间间隔的前端域的频率。一旦处理器的能量和性能根据以上的等式被计算,在一个实施例中,前端域频率和电压能在每个时间间隔n的末端为下一个时间间隔n+1被调整。在一个实施例中,可根据以下比率做出频率和电压的选择R(<f,V>)=En+1En×Tn+1Tn×Tn+1Tn]]>被选择用于间隔n+1的频率和电压是那些最小化以上比率的频率和电压。如果发现两对或两对以上的频率和电压产生相同的值R,那么在一个实施例中选择具有最小频率的那对。然后,对于间隔n+1,前端域的频率和操作电压可被设定成适当的值,并且对下一个间隔重复该过程。每个后端频率和操作电压可通过与对前端相同的方式被估算,估算是通过按照每个后端域的操作电压和频率的函数估算处理器的能量和性能,以及选择将间隔n+1和间隔n之间的能量性能乘积的比率最小化的频率和操作电压而进行的。在一个实施例中,处理器能量“En”作为后端域能量“EBE,n”的函数根据以下等式被估算 作为每个后端域的频率的函数的处理器的性能可在每个间隔n+1通过以下等式被计算Tn+1Tn=1+S×(1-2mn)2×p]]>其中,p=-Lq,n+Lq,n2+4Lq,n2]]>以及,S=(fnfn+1-1)×|fn+1-fn|fmax-fmin]]>在以上的等式中,mn是对于间隔n的二级高速缓冲存储器失败数除以调拨的微操作数,Lq,n是对于包含执行单元的所有后端域的所有微操作发出队列的平均使用。一旦处理器的能量和性能根据以上的等式被计算,在一个实施例中,后端域频率和电压能在每个时间间隔n的末端为下一个时间间隔n+1被调整。在一个实施例中,频率和电压的选择可根据以下的比率做出R(fn+1,Vn+1)=En+1En×Tn+1Tn×Tn+1Tn]]>被选择刚于间隔n+1的频率和电压是那些最小化以上比率的频率和电压。如果发现两对或两对以上的频率和电压产生相同的值R,那么在一个实施例中选择具有最小频率的那对。然后,对于间隔n+1,后端域的频率和操作电压可被设定成适当的值,并且对下一个间隔重复该过程。图2示出了本专利技术的一个实施例可在其中被使用的前端总线(FSB)计算机系统。处理器205访问来自一级(L1)高速缓冲存储器210和主存储器215的数据。在本专利技术的其他实施例中,高速缓冲存储器可以是二级(L2)高速缓冲存储器或其他计算机系统存储器分级结构内的存储器。此外,在某些实施例中,图2的计算机系统既可包括L1高速缓冲存储器也可包括L2高速缓冲存储器,该计算机系统包括相容(inclusive)高速缓冲存储器分级结构,其中相干的数据能在L1和L2高速缓冲存储器中共享。在图2的处理器内示出的是本本文档来自技高网...
【技术保护点】
一种处理器,包括具有第一时钟信号频率和第一操作电压的第一时钟域;具有第二时钟信号频率和第二操作电压的第二时钟域;具有第三时钟信号频率和第三操作电压的第三时钟域。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:G玛格里斯,J冈萨雷斯,A冈萨雷斯,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。