响应于输入数据值降低FMA单元中的功率消耗制造技术

技术编号：10053693 阅读：159 留言：0更新日期：2014-05-16 02:24

公开了响应于输入数据值降低FMA单元中的功率消耗的技术。在实施例中，融合乘加（FMA）电路被配置为接收多个输入数据值以执行所述输入数据值上的FMA指令。所述电路包括乘法器单元和耦合到所述乘法器单元的输出的加法器单元，和控制逻辑，其接收所述输入数据值并降低切换活动，并由此基于所述输入数据值中的一个或多个的值降低所述电路的一个或多个组件的功率消耗。对其他实施例也予以描述并要求保护。

全部详细技术资料下载

【技术实现步骤摘要】
响应于输入数据值降低FMA单元中的功率消耗
技术介绍
处理器中一个常见的执行单元是融合乘加(FMA)单元。一般而言，FMA单元可以执行在三个传入操作数上首先将操作数中的两个相乘然后将乘积与第三个数累积的操作。更具体地，FMA算术逻辑单元(ALU)被设计为计算A*B+C，其中A、B和C是任意值。通常A称为乘数输入，B称为被乘数输入，且C称为加数输入。最新的FMAALU将通电和操作设计在同一功率水平而不管呈交给FMAALU的数据输入如何。这会导致过度的功率消耗，特别是因为FMA的乘法单元是高功率消耗件。一些处理器使用这样的单元，通过对第三个操作数的适当选择或经由选择电路路由操作数和结果而执行更多的简单数学操作诸如加法、减法和乘法。因此，在许多处理器中FMA单元可以构成执行单元的骨干，并可以是用以确定处理器的频率、功率和面积的关键电路。之前用来降低FMA单元平均功率的解决方案通常关注于降低覆盖于FMAALU之上的较简单操作的功率，此举往往是通过将这些覆盖操作放置进独立于FMAALU的单独的浮点ALU中。这允许FMAALU对这些较简单操作断电，从而降低这些情况下的功率消耗。然而就面积和泄漏功率而言这很昂贵，因此不是理想的解决方案。而且，这个解决方案不能节省用于FMA指令执行的功率。附图说明图1是根据本专利技术实施例的一般融合乘加(FMA)单元的框图。图2是根据本专利技术实施例的FMA电路的示意图。图2A是根据本专利技术另一实施例的FMA电路的示意图。图3是根据本专利技术另一实施例的FMA电路的示意图。图4是根据本专利技术另一实施例的FMA电路的示意图。图5是根据本专利技...
响应于输入数据值降低FMA单元中的功率消耗

【技术保护点】

【技术特征摘要】
2012.10.31 US 13/664,6891.一种处理器，包括：核，其包括执行指令的多个执行单元，所述多个执行单元包括：融合乘加FMA电路，用于接收多个输入数据值以在所述输入数据值上执行FMA指令，所述融合乘加FMA电路包括：乘法器单元；加法器单元，耦合到所述乘法器单元的输出；控制逻辑单元，用于接收所述多个输入数据值并基于所述多个输入数据值中的至少一个的值门控所述融合乘加FMA电路的一个或多个组件，还用于接收将在所述融合乘加FMA电路中执行的指令类型并基于所述指令类型门控所述融合乘加FMA电路的至少一个组件；以及异常逻辑单元，所述异常逻辑单元用于接收所述多个输入数据值并确定是否要基于上述多个输入数据值中的至少一个发起异常，其中响应于所述多个输入数据值中的乘数和所述多个输入数据值中的被乘数中的一个是零，所述控制逻辑单元用于使得所述异常逻辑单元作为旁路路径以输出所述多个输入数据值中的加数，同时所述加法器单元和所述乘法器单元被阻止进行切换。2.如权利要求1所述的处理器，其特征在于，所述异常逻辑单元用于输出相对应于异常值的所述多个输入数据值中所选择的一个，同时所述乘法器单元和所述加法器单元被阻止进行切换。3.如权利要求1所述的处理器，其特征在于，所述控制逻辑单元用于：当所述多个输入数据值中的所述加数是零时，使得所述加法器单元被门控关闭。4.如权利要求1所述的处理器，其特征在于，所述控制逻辑单元用于：当所述多个输入数据值中的所述乘数或所述多个输入数据值中的所述被乘数是2N，其中N是整数时，使得所述乘法器单元被门控关闭。5.如权利要求4所述的处理器，其特征在于，所述融合乘加FMA电路还包括移位器，所述移位器用于选择所述乘数和所述被乘数中的一个作为输入并将所述一个移位N位以获得经移位值。6.如权利要求5所述的处理器，其特征在于，所述加法器单元用于将所述多个输入数据值中的加数与所述经移位值相加以获得和。7.如权利要求1所述的处理器，其特征在于，所述融合乘加FMA电路还包括：多个第一选择器，其与所述乘法器单元耦合，并用于从所述乘法器单元接收乘积；移位器，其耦合到所述多个第一选择器中的第一个的输出；第一存储元件，其耦合到所述多个第一选择器中的第二个；第二存储元件，其耦合到所述多个第一选择器中的第三个；第三存储元件，其耦合到所述移位器的输出，其中所述乘积由所述多个第一选择器的所述第一个输出到所述第三存储元件，且所述第一和第二存储元件在乘法指令的执行过程中被时钟门控。8.如权利要求1所述的处理器，其特征在于，所述融合乘加FMA电路还包括：第一组存储元件，包括用于接收所述多个输入数据值中的所述乘数的第一存储元件和第四存储元件、用于接收所述多个输入数据值中的所述被乘数的第二存储元件和用于接收所述多个输入数据值中的所述加数的第三存储元件，其中当所述被乘数等于一时所述第一和第二存储元件被时钟门控。9.如权利要求8所述的处理器，其特征在于，所述控制逻辑单元用于：当所述被乘数等于一时，阻止所述乘法器单元的顺序时钟进行切换，所述多个输入数据值中的所述乘数将从所述第四存储元件被路由到所述加法器单元用于与所述多个输入数据值中的所述加数相加。10.一种降低处理器功耗的方法，包括：接收与将在...

【专利技术属性】
技术研发人员：B·J·希克曼，D·R·布拉德福德，T·D·弗莱切，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人