二进制融合乘加浮点计算制造技术

技术编号：15955910 阅读：35 留言：0更新日期：2017-08-08 09:55

本公开的各实施例总体上涉及二进制融合乘加浮点计算。具体地，涉及一种二进制融合乘加浮点单元，被配置成对加数、乘数和被乘数进行运算。该单元被配置成经由早期结果反馈路径接收在该单元中执行的在先运算的未舍入结果作为加数；以对未舍入指数和未舍入尾数执行未舍入加数的对准移位；以及响应于向上舍入信号与实际对准移位并行地执行加数的舍入校正。

全部详细技术资料下载

【技术实现步骤摘要】
二进制融合乘加浮点计算
本专利技术的各个方面总体上涉及数据处理系统，并且具体地涉及执行二进制融合乘加浮点计算。
技术介绍
2008年出版的用于二进制浮点运算的IEEE-754-2008标准规定了通常在计算机硬件中实现的浮点数据架构，诸如具有乘法器的浮点处理器。格式包括符号、无符号偏置指数和有效位数。符号位是单个比特，并且用“S”表示。用“e”表示的无符号偏置指数例如对于单精度为8个比特长，对于双精度为11个比特长，对于四精度为15个比特长。有效位数例如对于单精度为24个比特长，对于双精度为53个比特长，对于四精度为113个比特长。如IEEE-754-2008标准所定义的，有效位数的最高有效位——即所谓的隐含位——是从指数位中解码的。为了改进浮点算术处理，大多数现代处理器使用被称为融合乘加(以下缩写为FMA)过程的过程来将浮点乘法运算(例如A*B)与浮点加法运算(例如+C)组合，用于作为单个指令(例如A*B+C)来执行，其中A、B、C是乘积A*B的操作数以及C和乘积的和的操作数。通过在单个指令中执行两个运算，FMA过程减少了整个执行时间。FMA过程还提供了改进的精度，因为仅需要在以全精度执行乘法和加法运算两者之后才执行舍入。例如，只有一个舍入误差，而不是两个。在浮点处理器中，一个中心区域是乘法器阵列。乘法器阵列用于执行两个数的乘法。通常，使用具有基数4的最先进的布思(Booth)编码，其是通常使用的快速乘法算法。这减少了需要求和直到n/2+1的乘积项的数量，其中n是每个操作数的位数。使用允许并行处理所有位的进位保存加法器电路来进行求和，而不是将较低位位置的进...

【技术保护点】
一种被配置成对加数、乘数和被乘数进行运算并且被配置成执行一种方法的单元，所述方法包括：经由早期结果反馈路径接收在所述单元中执行的在先运算的未舍入结果作为所述加数；对未舍入指数和未舍入尾数执行所述加数的对准移位；以及与所述对准移位并行地执行所述加数的舍入校正，所述舍入校正通过向上舍入信号被启用。

【技术特征摘要】
2016.02.01 US 15/011,735;2016.06.29 US 15/197,2901.一种被配置成对加数、乘数和被乘数进行运算并且被配置成执行一种方法的单元，所述方法包括：经由早期结果反馈路径接收在所述单元中执行的在先运算的未舍入结果作为所述加数；对未舍入指数和未舍入尾数执行所述加数的对准移位；以及与所述对准移位并行地执行所述加数的舍入校正，所述舍入校正通过向上舍入信号被启用。2.根据权利要求1所述的单元，其中所述执行所述舍入校正还包括通过向所述单元的乘数约减树施加的校正项来执行所述加数的所述舍入校正。3.根据权利要求2所述的单元，还包括执行以下中的至少一项：通过基于有效加法向移位量应用解码函数来获取所述校正项；或者通过基于有效减法向所述移位量应用半解码函数来获取所述校正项。4.根据权利要求2所述的单元，其中支持多个浮点精度，并且其中所述校正项的值被适配成支持所支持的多个浮点精度中的一个或多个浮点精度的结果的未舍入转发。5.根据权利要求2所述的单元，其中所述方法还包括基于递增所述在先运算的未舍入中间结果来生成所述校正项。6.根据权利要求1所述的单元，其中所述执行所述对准移位还包括通过总和寻址移位器来执行所述对准移位。7.根据权利要求1所述的单元，其中所述在先运算是以下中的至少一项：加法、乘法、或乘加运算。8.根据权利要求1所述的单元，其中计算所述加数与所述乘数和所述被乘数的乘积之间的和或绝对差，所述和或所述绝对差包括粘滞位。9.根据权利要求8所述的单元，其中所述方法还包括基于所述和或所述绝对差的所述粘滞位来计算由所述执行所述舍入校正使用的校正项。10.根据权利要求1所述的单元，其中所述执行所述对准移位包括计算移位量并且对操作数移位。11.根据权利要求10所述的单元，其中所述方法还包括基于所述移位量来生成由所述执行所述舍...

【专利技术属性】
技术研发人员：M·克莱恩，K·M·克罗伊纳，C·利希特瑙，S·M·穆勒，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人