【技术实现步骤摘要】
【国外来华专利技术】
本专利技术的领域一般涉及计算机处理器架构,更具体地涉及在执行时导致特定结果的指令。
技术介绍
指令集或指令集架构(ISA)是计算机架构中与编程有关的部分,并且可包括原生数据类型、指令、寄存器架构、寻址模式、存储器架构、中断和异常处理、以及外部输入和输出(I/O)。术语指令在本申请中一般表示宏指令,宏指令是被提供给处理器(或指令转换器,该指令转换器(利用静态二进制转换、包括动态编译的动态二进制转换)转换、变形、仿真或以其他方式将指令转换成将由处理器处理的一个或多个其他指令)以供执行的指令——作为对比,微指令或微操作(微操作)是处理器的解码器解码宏指令的结果。ISA与微架构不同,微架构是实现该指令集的处理器的内部设计。具有不同微架构的处理器可共享共同的指令集。例如,奔腾四(Pentium4)处理器、酷睿(CoreTM)处理器、以及来自加利福尼亚州桑尼威尔(Sunnyvale)的超微半导体有限公司(AdvancedMicroDevices,Inc.)的诸多处理器执行几乎相同版本的x86指令集(在更新的版本中加入了一些扩展),但具有不同的内部设计。例如,在不同的微架构中可使用公知的技术以不同方法来实现ISA的相同寄存器架构,这些技术包括专用物理寄存器、使用寄存器重命名机制(诸如,使用寄存器别名表(RAT)、重排序缓冲器(ROB)、以及引退寄存器组;使用多个映射和寄存器池)的一个或多个动态分配的物理 ...
【技术保护点】
一种用于在计算机处理器中响应于单个向量打包的将掩码寄存器转换成一系列索引值的指令而执行将掩码寄存器转换成一系列索引值的方法,所述单个向量打包的将掩码寄存器转换成一系列索引值的指令包括目的地向量寄存器操作数、源写掩码寄存器操作数以及操作码,所述方法包括以下步骤:执行所述单个向量打包的将掩码寄存器转换成一系列索引值的指令,以标识将所述源写掩码寄存器的哪些有效位位置作为索引值存储在所述目的地向量寄存器中;以及在所述目的地向量寄存器中存储所述索引值,其中对于每个打包数据元素位置仅存储一个索引值。
【技术特征摘要】 【专利技术属性】
【国外来华专利技术】1.一种用于在计算机处理器中响应于单个向量打包的将掩码寄存器转换
成一系列索引值的指令而执行将掩码寄存器转换成一系列索引值的方法,所述
单个向量打包的将掩码寄存器转换成一系列索引值的指令包括目的地向量寄
存器操作数、源写掩码寄存器操作数以及操作码,所述方法包括以下步骤:
执行所述单个向量打包的将掩码寄存器转换成一系列索引值的指令,以标
识将所述源写掩码寄存器的哪些有效位位置作为索引值存储在所述目的地向
量寄存器中;以及
在所述目的地向量寄存器中存储所述索引值,其中对于每个打包数据元素
位置仅存储一个索引值。
2.如权利要求1所述的方法,其特征在于,要作为索引值被存储的位位
置具有值1。
3.如权利要求1所述的方法,其特征在于,所述操作码定义所述目的地
寄存器的打包数据元素尺寸。
4.如权利要求3所述的方法,其特征在于,所述源写掩码寄存器中的有
效写掩码位的数量是以位表示的所述目的地寄存器的尺寸除以所述目的地寄
存器的打包数据元素尺寸。
5.如权利要求1所述的方法,其特征在于,并行地执行在每个有效位位
置中存储的值的确定。
6.如权利要求1所述的方法,其特征在于,所述源写掩码寄存器是16位
或64位。
7.如权利要求1所述的方法,其特征在于,所述目的地向量寄存器的尺
\t寸是128位、256位或512位。
8.如权利要求1所述的方法,其特征在于,所述执行步骤包括:
确定所述源写掩码寄存器的有效位的数量;以及
对于所述源写掩码寄存器的每个有效位位置,
判断所述源写掩码寄存器的有效位位置中的值是否是1,
如果所述源写掩码寄存器的有效位位置的值是1,则将所述位位置作
为索引写入目的地向量寄存器的未使用的打包数据元素位置。
9.如权利要求1所述的方法,其特征在于,进一步包括:
将所有未使用的打包数据元素位置均设置为1。
10.一种制品,包括:
有形的机器可读存储介质,其上存储有指令的出现,其中所述指令的格式
将写掩码寄存器指定为其源操作数,并将单个目的地向量寄存器指定为其目的
地,并且其中所述指令格式包括操作码,所述操作码指令一机器响应于所述单
个指令的单次出现而导致:标识将源写掩码寄存器中的哪些有效位位置作为索
引值存储在目的地向量寄存器中;以及将索引值存储在目的地向量寄存器中,
技术研发人员:E·乌尔德阿迈德瓦尔,T·威尔豪姆,T·G·德赖斯代尔,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。