【技术实现步骤摘要】
【国外来华专利技术】
本专利技术的领域一般涉及计算机处理器架构,更具体地涉及在执行时导致特定结果的指令。
技术介绍
指令集或指令集架构(ISA)是计算机架构中与编程有关的部分,并且可包括原生数据类型、指令、寄存器架构、寻址模式、存储器架构、中断和异常处理、以及外部输入和输出(I/o)。术语指令在本申请中一般表示宏指令,宏指令是被提供给处理器(或指令转换器,该指令转换器(利用静态二进制转换、包括动态编译的动态二进制转换)转换、变形、仿真或以其他方式将指令转换成将由处理器处理的一个或多个其他指令)以供执行的指令一作为对比,微指令或微操作(微操作)是处理器的解码器解码宏指令的结果。 ISA与微架构不同,微架构是实现该指令集的处理器的内部设计。具有不同微架构的处理器可共享共同的指令集。例如,INTEL?奔腾四(Pentium4)处理器、Intel?酷睿(Core?)处理器、以及来自加利福尼亚州桑尼威尔(Sunnyvale)的超微半导体有限公司(Advanced Micro Devices, Inc.)的诸多处理器执行几乎相同版本的x86指令集(在更新的版本中加入了一些扩展),但具有不同的内部设计。例如,在不同的微架构中可使用公知的技术以不同方法来实现ISA的相同寄存器架构,这些技术包括专用物理寄存器、使用寄存器重命名机制(诸如,使用寄存器别名表(RAT)、重排序缓冲器(R0B)、以及引退寄存器组;使用多个映射和寄存器池)的一个或多个动态分配的物理寄存器、等等。在本申请中使用短语寄存器架构、寄存器组以及寄存器来表示软件/编程者可见的寄存器和指令指定寄存器的方式 ...
【技术保护点】
一种响应于单个向量打包横向求和指令在计算机处理器中执行打包数据元素的向量打包横向部分求和的方法,所述单个向量打包横向求和指令包括目的地向量寄存器操作数、源向量寄存器操作数以及操作码,所述方法包括以下步骤:执行所述单个向量打包横向求和指令,以对于所述源向量寄存器的数据通道的每个数据元素位置计算来自比所述数据元素位置更低有效的数据元素位置的所有数据元素与所述位置的数据元素之和,其中对于每个打包数据元素位置产生的所述和是直至所述打包数据元素位置的诸个打包数据元素并且包括所述打包数据元素的所有打包数据元素之和;以及将对于所述源向量寄存器的打包数据元素位置计算出的每个和存储在所述目的地向量寄存器的相应打包数据元素位置中。
【技术特征摘要】
【国外来华专利技术】1.一种响应于单个向量打包横向求和指令在计算机处理器中执行打包数据元素的向量打包横向部分求和的方法,所述单个向量打包横向求和指令包括目的地向量寄存器操作数、源向量寄存器操作数以及操作码,所述方法包括以下步骤: 执行所述单个向量打包横向求和指令,以对于所述源向量寄存器的数据通道的每个数据元素位置计算来自比所述数据元素位置更低有效的数据元素位置的所有数据元素与所述位置的数据元素之和,其中对于每个打包数据元素位置产生的所述和是直至所述打包数据元素位置的诸个打包数据元素并且包括所述打包数据元素的所有打包数据元素之和;以及 将对于所述源向量寄存器的打包数据元素位置计算出的每个和存储在所述目的地向量寄存器的相应打包数据元素位置中。2.如权利要求1所述的方法,其特征在于,所述源向量的每个数据通道具有四个打包数据元素。3.如权利要求1所述的方法,其特征在于,要处理的数据通道的数量取决于所述目的地向量寄存器的尺寸。4.如权利要求1所述的方法,其特征在于,所述源向量寄存器和目的地向量寄存器的尺寸是128位、256位、或512位。5.如权利要求1所述的方法,其特征在于,所述源寄存器和所述目的地寄存器的打包数据元素的尺寸是8位、16位、32位或64位。6.如权利要求5所述的方法,其特征在于,通过所述操作码来定义所述源寄存器和所述目的地寄存器的打包数据元素的尺寸。7.如权利要求1所述的方法,其特征在于,所述执行步骤还包括: 在每次求和之后确定所述打包数据元素位置是否是所述数据通道的最后一个打包数据元素位置; 当所述打包数据元素位置是所述数据通道的最后一个打包数据元素位置时,则所述数据通道的处理完成; 当所述打包数据元素位置不是所述数据通道的最后一个打包数据元素位置时,则计算下一最低有效的打包数据元素位置的和。8.—种制品,包括: 有形的机器可读存储介质,其上存储有指令的出现,其中所述指令的格式指定向量寄存器作为其源操作数,并指定单个目的地向量寄存器作为其目的地,并且其中所述指令包括操作码,所述操作码指令机器响应于所述单个指令的单次出现而导致:对于所述源向量寄存器的数据通道的每个数据元素位置计算来自比所述数据元素位置更低有效的数据元素位置的所有数据元素与所述位置的数据元素之和,其中对于每个打包数据元素位置产生的所述和是直至所述打包数据元素位置的诸个打包数据元素并且包括所述打包数据元素的所有打包数据元素之和;以及将对于所述源向量寄存器的打包数据元素位置计算出的每个和存储在所述目的地向量寄存器的相应打包数据元素位置中。9.如权利要求8所述的制品,其特征在于,所述源向量的每个...
【专利技术属性】
技术研发人员:E·乌尔德阿迈德瓦尔,M·哈高格,R·凡伦天,A·格雷德斯廷,S·卢巴诺维奇,Z·斯波伯,B·靳兹伯格,Z·艾韦弗,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。