【技术实现步骤摘要】
【国外来华专利技术】用于基于向量写掩码的内容而在通用寄存器中存储两个标量常数之一的指令
本专利技术的各实施例涉及处理器领域;更具体而言,涉及用于基于写掩码内容设置通用寄存器中的标量值的指令。
技术介绍
指令集,或指令集架构(ISA)是涉及编程的计算机架构的一部分,并可以包括原生数据类型、指令、寄存器架构、寻址模式、存储器架构、中断和异常处理、以及外部输入和输出(I/O)。应当注意,在本文中术语指令一般指宏指令——即被提供给处理器(或指令转换器,该指令转换器(例如使用静态二进制翻译、包括动态编译的动态二进制翻译)将指令翻译、变形、仿真,或以其他方式将指令转换成要由处理器处理的一个或多个指令)以用于执行的指令——而不是微指令或微操作——它们是处理器的解码器解码宏指令的结果。指令集架构与微架构不同,该微架构是实现ISA的处理器的内部设计。带有不同的微架构的处理器可以共享共同的指令集。例如,IntelPentium4处理器、IntelCore处理器,以及位于SunnyvaleCA的AdvancedMicroDevices公司的处理器实现x86指令集的几乎相同的版本(带有被添加到较新的版本中的某些扩展),但是,具有不同的内部设计。例如,ISA的相同寄存器架构在不同的微架构中可使用已知的技术以不同方法来实现,包括专用物理寄存器、使用寄存器重命名机制(诸如,使用寄存器别名表RAT、重排序缓冲器ROB、以及引退寄存器组;使用多个映射和寄存器池)的一个或多个动态分配物理寄存器等。除非另作说明,短语“寄存器架构”、“寄存器组”,以及寄存器是指对软件/编程器以及指令指定寄存器的方式可见的东西。在需 ...
【技术保护点】
一种计算机实现的方法,包括:取出指令的表示,其中所述指令的格式将来自单个向量写掩码寄存器的源操作数指定为其唯一源操作数并且将单个通用寄存器指定为其目的地,其中所述指令的格式包括第一字段,所述第一字段的内容从多个架构向量写掩码寄存器中选择所述单个向量写掩码寄存器,并且其中所述指令的格式包括第二字段,所述第二字段的内容从多个架构通用寄存器中选择所述单个通用寄存器,并且其中所述源操作数是写掩码,所述写掩码包括多个一位向量写掩码元素,所述多个一位向量写掩码元素对应于架构向量寄存器内的不同多位数据元素位置;以及响应于执行所述单个指令的单次出现,将数据存储在所述单个通用寄存器中,使得所述单个通用寄存器的内容基于所述源操作数中的所述多个一位向量写掩码元素是否均为0,表示第一或第二标量常数。
【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:取出指令的出现,其中所述指令的格式将来自单个向量写掩码寄存器的源操作数指定为其唯一源操作数并且将单个通用寄存器指定为其目的地,其中所述指令的格式包括第一字段,所述第一字段的内容从多个架构向量写掩码寄存器中选择所述单个向量写掩码寄存器,并且其中所述指令的格式包括第二字段,所述第二字段的内容从多个架构通用寄存器中选择所述单个通用寄存器,并且其中所述源操作数是写掩码,所述写掩码包括多个一位向量写掩码元素,所述多个一位向量写掩码元素对应于架构向量寄存器内的不同多位数据元素位置;以及响应于执行所述指令的单次出现,将数据存储在所述单个通用寄存器中,使得所述单个通用寄存器的内容基于所述源操作数中的所述多个一位向量写掩码元素是否均为0,表示第一或第二标量常数。2.如权利要求1所述的方法,其特征在于,所述第一和第二标量常数分别为1和0。3.如权利要求2所述的方法,其特征在于,所述存储包括将数据存储在所述单个通用寄存器中以使得在所述多个一位向量写掩码元素为全0时所述单个通用寄存器的内容表示1。4.如权利要求2所述的方法,其特征在于,所述存储包括将数据存储在所述单个通用寄存器中以使得在所述多个一位向量写掩码元素为全0时所述单个通用寄存器的内容表示0。5.如权利要求1-4中任一项所述的方法,其特征在于,所述指令的操作码指定所述源操作数的尺寸。6.如权利要求5所述的方法,其特征在于,所述源操作数的所述尺寸小于所述单个向量写掩码寄存器的尺寸。7.如权利要求6所述的方法,其特征在于,所述源操作数是来自所述单个向量写掩码寄存器的、从最低有效位开始的毗邻位。8.如权利要求1所述的方法,其特征在于,所述指令是指令集架构(ISA)的一部分,其中来自所述指令集架构(ISA)的其他指令指定向量操作、选择目的地、并且从所述多个架构向量写掩码寄存器的写掩码中进行选择,其中对于所述其他指令中的每个指令,所选择的写掩码的多个一位向量写掩码元素控制所选择的目的地中的哪些数据元素位置反映所述指令的向量操作的结果。9.如权利要求1所述的方法,其特征在于,所述通用寄存器被配置为存储用于逻辑操作、算术操作、地址计算、以及存储器指针的操作数,并且其中所述架构向量寄存器被配置为存储向量。10.如权利要求1所述的方法,其中存在至少16个尺寸为至少64位的架构通用寄存器,其中存在至少8个尺寸至少为32位以便存储写掩码的架构向量写掩码寄存器,并且其中存在至少16个尺寸至少为256位以便存储向量的架构向量寄存器。11.如权利要求1所述的方法,其中存在至少16个尺寸为至少64位的架构通用寄存器,其中存在至少8个尺寸至少为64位以便存储写掩码的架构向量写掩码寄存器,并且其中存在至少32个尺寸至少为512位以便存储向量的架构向量寄存器。12.如权利要求1所述的方法,其特征在于,所述执行包括:对所述多个一位向量写掩码元素执行逻辑或操作;以及基于所述逻辑或操作的结果生成所述第一或第二标量常数。13.如权利要求12所述的方法,其特征在于,所述生成包括:对所述逻辑或的结果求反;将求反后的值转换为64位无符号整数值以形成所述第一或第二标量常数。14.如权利要求12所述的方法,其特征在于,所述生成包括:基于控制信号来复用所述第一或第二标量常数,所述控制信号是从所述逻辑或操作的结果和所述指令为多种类型中的哪一种的指示形成的。15...
【专利技术属性】
技术研发人员:J·考博尔,M·J·克莱格德,B·L·托尔,A·T·福塞斯,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。