用于执行指令以转换成16位浮点格式的系统和方法技术方案

技术编号：27740828 阅读：21 留言：0更新日期：2021-03-19 13:33

本公开涉及用于执行指令以转换成16位浮点格式的系统和方法。在一个实施例中，处理器包括：提取电路，所述提取电路用于提取指令，所述指令具有字段，所述字段用于指定操作码以及包括N个单精度元素的第一源向量和包括至少N个16位浮点元素的目标向量的位置，所述操作码指示执行电路将所述第一源向量的每个元素转换为16位浮点格式，并且将每个经转换的元素存储到所述目标向量的对应位置中，该转换在必要时包括截断和舍入；解码电路，用于对所述指令进行解码；以及执行电路，用于根据所述操作码来对所述指令作出响应。

全部详细技术资料下载

【技术实现步骤摘要】
用于执行指令以转换成16位浮点格式的系统和方法本申请是申请号为201911045764.1、名称为“用于执行指令以转换成16位浮点格式的系统和方法”的专利技术专利申请的分案申请。
本专利技术的领域概括而言涉及计算机处理器体系结构，更具体而言涉及用于执行指令以转换成16位浮点格式的系统和方法。
技术介绍
指令集，或者说指令集体系结构(instructionsetarchitecture，ISA)，是与编程有关的计算机体系结构的一部分，并且可包括原生数据类型、指令、寄存器体系结构、寻址模式、存储器体系结构、中断和异常处理以及外部输入和输出(I/O)。指令集包括一个或多个指令格式。给定的指令格式定义各种字段(位的数目、位的位置)来指定要执行的操作和要在其上执行该操作的(一个或多个)操作对象(operand)，等等。给定的指令是使用给定的指令格式来表述的并且指定操作和操作对象。指令流是指令的特定序列，其中序列中的每个指令是某个指令以某种指令格式的出现。科学、金融、自动向量化通用、RMS(识别、挖掘和合成)/视觉和多媒体应用(例如，2D/3D图形、图像处理、视频压缩/解压缩、语音识别算法和音频操纵)经常要求对大量的数据项执行相同的操作(称为“数据并行”)。单指令多数据(SingleInstructionMultipleData，SIMD)指的是使得处理器对多个数据项执行相同操作的一类指令。SIMD技术尤其适合于这样的处理器：这些处理器可将寄存器中的位从逻辑上划分成若干个固定大小的数据元素，每个数据元素表示单独的...

【技术保护点】
1.一种芯片包括：/n多个存储器控制器；/n二级L2缓存存储器，耦合到所述多个存储器控制器；/n处理器，耦合到所述多个存储器控制器，并且耦合到所述L2缓存存储器，所述处理器具有多个核心，所述多个核心包括响应于格式转换指令来执行以下操作的核心，所述核心具有包括第一32位单精度浮点数据元素的第一源操作对象和包括第二32位单精度浮点数据元素的第二源操作对象：/n将所述第一32位单精度浮点数据元素转换为第一16位浮点数据元素，其中，当所述第一32位单精度浮点数据元素为普通数据元素时，根据由所述格式转换指令指定的舍入模式执行转换，并且所述第一16位浮点数据元素具有符号位、8位指数、七个显式尾数位和一个隐式尾数位，并且其中，当所述第一32位单精度浮点数据元是非数据NaN数据元素时，所述第一16位浮点数据元素具有最高有效位被设置为1的尾数；/n将所述第二32位单精度浮点数据元素转换为第二16位浮点数据元素，其中，当所述第二32位单精度浮点数据元素为普通数据元素时，根据所述舍入模式执行转换，并且所述第二16位浮点数据元素具有符号位、8位指数、七个显式尾数位和一个隐式尾数位，并且其中，当所述第二32位单...

【技术特征摘要】
20181109 US 16/186,3841.一种芯片包括：
多个存储器控制器；
二级L2缓存存储器，耦合到所述多个存储器控制器；
处理器，耦合到所述多个存储器控制器，并且耦合到所述L2缓存存储器，所述处理器具有多个核心，所述多个核心包括响应于格式转换指令来执行以下操作的核心，所述核心具有包括第一32位单精度浮点数据元素的第一源操作对象和包括第二32位单精度浮点数据元素的第二源操作对象：
将所述第一32位单精度浮点数据元素转换为第一16位浮点数据元素，其中，当所述第一32位单精度浮点数据元素为普通数据元素时，根据由所述格式转换指令指定的舍入模式执行转换，并且所述第一16位浮点数据元素具有符号位、8位指数、七个显式尾数位和一个隐式尾数位，并且其中，当所述第一32位单精度浮点数据元是非数据NaN数据元素时，所述第一16位浮点数据元素具有最高有效位被设置为1的尾数；
将所述第二32位单精度浮点数据元素转换为第二16位浮点数据元素，其中，当所述第二32位单精度浮点数据元素为普通数据元素时，根据所述舍入模式执行转换，并且所述第二16位浮点数据元素具有符号位、8位指数、七个显式尾数位和一个隐式尾数位，并且其中，当所述第二32位单精度浮点数据元是NaN数据元素时，所述第二16位浮点数据元素具有最高有效位被设置为1的尾数；以及
将所述第一16位浮点数据元素存储在目标寄存器的低阶一半部分，并且将所述第二16位浮点数据元素存储在所述目标寄存器的高阶一半部分；
互连件，耦合到所述处理器；以及
总线控制器，耦合到所述处理器。

2.根据权利要求1所述的芯片，其中，所述第一16位浮点数据元素和所述第二16位浮点数据元素是第一BF16格式数据元素和第二BF16格式数据元素。

3.根据权利要求1所述的芯片，还包括指令转换器，所述指令转换器用于将所述格式转换指令转换为能够由所述核心执行的不同指令集的一条或多条指令。

4.根据权利要求1至3中任一项所述的芯片，其中，所述多个核心包括图形核心。

5.根据权利要求1至3中任一项所述的芯片，其中，所述多个核心是异质的。

6.根据权利要求1至3中任一项所述的芯片，其中，所述处理器还包括：
第一寄存器，用于存储所述第一32位单精度浮点数据元素；以及
第二寄存器，用于存储所述第二32位单精度浮点数据元素。

7.根据权利要求1至3中任一项所述的晶片，其中，所述处理器包括：
附加的缓存存储器；以及
寄存器文件。

8.一种系统包括：
根据权利要求1至7中任一项所述的芯片；以及
与所述芯片耦合的系统存储器。

9.一种装置，包括：
存储器控制器；
二级L2缓存存储器，耦合到所述多个存储器控制器；
多个核心，耦合到所述多个存储器控制器，并且耦合到所述L2缓存存储器，所述多个核心包括响应于格式转换指令来执行以下操作的核心，所述核心具有包括第一32位单精度浮点数据元素的第一源操作对象和包括第二32位单精度浮点数据元素的第二源操作对象：
将所述第一32位单精度浮点数据元素转换为第一16位浮点数据元素，其中，当所述第一32位单精度浮点数据元素为第一类型时，根据由所述格式转换指令指定的舍入模式执行转换，并且所述第一16位浮点数据元素具有符号位、8位指数、七个显式尾数位和一个隐式尾数位，并且其中，当所述第一32位单精度浮点数据元是与所述第一类型不同的第二类型时，所述第一16位浮点数据元素具有最高有效位被设置为1的尾数；
将所述第二32位单精度浮点数据元素转换为第二16位浮点数据元素，其中，当所述第二32位单精度浮点数据元素为所述第一类型时，根据所述舍入模式执行转换，并且所述第二16位浮点数据元素具有符号位、8位指数、七个显式尾数位和一个隐式尾数位，并且其中，当所述第二32位单精度浮点数据元是所述第二类型时，所述第二16位浮点数据元素具有最高有效位被设置为1的尾数；以及
将所述第一16位浮点数...

【专利技术属性】
技术研发人员：亚力山大·F·海涅克，罗伯特·瓦伦泰恩，马克·J·查尼，拉阿南·萨德，梅纳赫姆·阿德尔曼，泽夫·斯帕波，阿米特·格拉德斯坦，西蒙·鲁巴诺维奇，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人